

머신러닝 딥러닝을 위해 구글에서 무료로 배포해주는 GPU를 사용하는 것이 컴퓨터에 좋다.
자료를 넣는 상자
어떤 자료를 담느냐에 따라 상자의 모양 / 성격(자료형)이 달라짐
a = 1
b = 3.14
c = "ㄱ" # str 문자형은 반드시 따옴표를 넣어야한다
print(type(a))
print(type(b))
print(type(c))
문자 1개 = 문자
문자 2개 이상 = 문자열
문자열은 순서가 있고 번호를 불러 그 번호에 해당하는 문자를 꺼내올 수 있다.
Python에서 문자열의 길이(문자열에 포함된 문자의 개수)는 내장 함수 len()을 이용하여 구할 수 있다.
예를 들어, 아래와 같은 문자열의 길이를 구할 수 있다.
str = "Hello World"
print(len(str)) # 11 출력
또한, 문자열 메서드 count()를 이용하여 특정 문자나 문자열이 문자열 내에 몇 개 존재하는지 세어볼 수도 있다.
str = "Hello World"
print(str.count('l')) # 3 출력
print(str.count('lo')) # 1 출력
변수에는 1개의 자료만이 들어갈 수 있다.
변수에 다른 자료를 넣으면 이전 자료는 사라지게 된다.
del # 변수를 삭제시키는 명령어
num = int(input('갑 입력>>'))
print(num)
형 변환
문자와 문자열
리스트형 변수 - 데이터 분석에서 가장 많이 사용하는 자료형 1
슬라이싱 : 리스트에서 범위를 지정해 자료를 여러개 가져오는 법
튜플
딕셔너리 : JSON이라고도 함
데이터분석에서 가장 많이 사용되는 자료형2
1) 연산자의 종류
1-1) 더하기
1-2) 빼기
1-3) 곱하기
1-4) 나누기
1-5) 나머지
*) 나누기를 하면 나머지가 타입이 실수로 변한다
할당 연산자
괄호 사용법
연산자 우선순위 : () 안쪽이 연산에서 우선 순위를 갖는다
할당 연산자
비교연산자 ==,!= , >,<,>=,<=
!= 다르면 True, 같으면 False
왼쪽을 기준으로 왼쪽 값이 오른쪽보다 큰것인가?
식별 연산자 : is,is not - 객체(object)가 같은지 비교
논리 연산자
1. 산술 연산자(arithmetic operator)
기본적인 산술 연산을 위해 제공되는 연산자이다.
| + | 왼쪽 항에 오른쪽 항을 더한다 |
|---|---|
| - | 왼쪽 항에 오른쪽 항을 뺀다 |
| * | 왼쪽 항에 오른쪽 항을 곱한다 |
| / | 왼쪽 항을 오른쪽 항으로 나눈다 |
| % | 왼쪽 항을 오른쪽 항으로 나눈 나머지 |
| ** | 왼쪽 항에 오른쪽 항만큼 제곱한다 |
| // | 왼쪽 항을 오른쪽 항으로 나눈 몫 |
2. 대입 연산자(assignment operators)
| = | 왼쪽 항에 오른쪽 항을 대입한다 |
|---|---|
| += | 왼쪽 항에 오른쪽 항의 값을 더하고 왼쪽 항에 대입한다 |
| -= | 왼쪽 항에 오른쪽 항의 값을 빼고 왼쪽 항에 대입한다 |
| *= | 왼쪽 항에 오른쪽 항의 값을 곱하고 왼쪽 항에 대입한다 |
| /= | 왼쪽 항을 오른쪽 항의 값으로 나누고 왼쪽 항에 대입한다 |
| %= | 왼쪽 항을 오른쪽 항의 값으로 나눈 나머지를 왼쪽 항에 대입한다 |
| **= | 왼쪽 항에 오른쪽 항의 값만큼 제곱하고 왼쪽 항에 대입한다 |
| //= | 왼쪽항을 오른쪽 항의 값으로 나눈 몫을 왼쪽 항에 대입한다 |
3. 비교 연산자(comparison operator)
값의 크기를 비교하는 연산자이다. C++의 경우 값을 비교하여 참일 경우 1을 거짓일 경우 0을 반환했지만 파이썬은 참일 경우 True를 거짓일 경우 False의 bool형 값을 그대로 반환한다.
| == | 왼쪽항과 오른쪽 항의 값이 같을 경우 참 |
|---|---|
| != | 왼쪽항과 오른쪽 항의 값이 다를 경우 참 |
| > | 왼쪽항이 오른쪽 항보다 큰 경우 참 |
| < | 왼쪽항이 오른쪽 항보다 작은 경우 참 |
| >= | 왼쪽항이 오른쪽 항보다 크거나 같을 경우 참 |
| <= | 왼쪽항이 오른쪽 항보다 작거나 같을 경우 참 |
4. 논리 연산자(logical operator)
주어진 논리 식의 참(True) 거짓(False)을 판단한다.
| and | 두 항을 비교하여 둘다 참일 경우 참을 반환 한다 |
|---|---|
| or | 두 항을 비교하여 둘중 하나라도 참인 경우 참을 반환 한다. |
| not | 논리 결과를 반전시킨다. |
| x | y | x and y | x or y | not(x) |
|---|---|---|---|---|
| T | T | T | T | F |
| T | F | F | T | F |
| F | T | F | T | T |
| F | F | F | F | T |
5. 비트 연산자(bitwise operator)
비트단위 논리 연산을 진행할 때 사용한다. 만약 a가 30일 경우 0001 1110으로 b가 5일 경우 0000 0101로 바꾸어 비교하는 것이다.
| & | 두항의 비트를 비교 같은 자리의 비트가 모두 1일 경우 1을 반환 (비트AND) |
|---|---|
| ^ | 두항의 같은 자리의 비트가 서로 다를 경우 1을 반환 (비트 XOR) |
| ~ | 비트가 1일 경우 0으로, 0일 경우 1로 반환 (비트 NOT, 1의 보수) |
| << | 지정한 수만큼 비트를 왼쪽으로 이동 (left shift) |
| >> | 지정한 수만큼 비트를 오른쪽으로 이동 (right shift) |
6. 멤버 연산(membership operator)
멤버 연산자의 경우 list안에 확인하고자 하는 값이 들어가 있는지에 대한 여부를 확인할 때 사용한다.
| in | 왼쪽항이 오른쪽 리스트 안에 들어 있으면 참 |
|---|---|
| not in | 왼쪽항이 오른쪽 리스트 안에 안들어 있으면 참 |
※연산자 우선 순위
| ** | 지수 |
|---|---|
| ~ + - | 보수, 양수와 음수 |
| * / % // | 곱하기, 나누기, 나머지, 몫 |
| + - | 덧셈과 뺄셈 |
| >> << | 좌우 비트 시프트 |
| & | 비트 'AND' |
| ^ | |
| <= < > >= | 비교 연산자 |
| <> == != | 비교 연산자 |
| = %= /= //= -= += *= **= | 대입 연산자 |
| is is not | 식별 연산자 |
| in not in | 맴버 연산자 |
| not or and | 논리 연산자 |
이스케이프 문자
() 사용하기
문자열 함수
| 명칭 | 용도 |
|---|---|
| split | 기준 문자를 기준으로 문자열을 분리 리스트로 저장 |
| join | 앞 쪽에 지정한 형식을 포함해서 문자열을 합쳐준다 |
| strip | 문자열 양쪽 끝에 공백이나 특수문자를 제거 |
| replace | 문자열에서 원하는 값을 찾아 다른 값으로 변경 |
L4 = ['사과','배','포도','파인애플']
','.join(L4)
‘,’.join() 컴마를 기준으로 → 붙여주겠다 라는 의미
split(list) ↔ join(str)
번갈아가면서 사용하는 것이 중요할 것 같다.
replace(’찾을문자’,’바꿀문자’)
여기서 중요한점
- split은 특정 단어로 나누어 list형태로 나누어 주고
- join은 특정 단어로 합쳐 문자열로 반환시켜주니 크롤링 및 학습모델을 만들 때에 이 부분을 응용하는 것이 좋다
import string
string.punctuation
- '!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'
.translate(str.maketrans('','',string.punctuation)).strip()
.translate(str.maketrans('','',string..punctuation))을 이용하여 string 안에 내장되어 있던
특수문자들을 포함 그리고, str.maketrans(intab, outtab)
intab: 치환할 문자열 값
outtab: 치환 후 문자열 값
공백과 특수문자들을 한꺼번에 없애주는 작업을 해주면된다.
잘 읽었습니다. 좋은 정보 감사드립니다.