import os
os.getcwd()
'C:\\Users\\Admin'
user 폴더가 있으니 경로 설정 시 주의해야 한다.
해당 주소를 path에 담는다.
path = 'C:/Users/Admin/Documents/R/'
그리고 경로를 변경한다.
os.chdir(path)
다시 경로를 확인한다.
import os
os.getcwd()
판다스라이브러리 임포트를 한다.
pd는 pandas 라이브러리를 간단히 사용하기 위한 별칭이다.
import pandas as pd
pd.read_csv 함수는 CSV 파일을 읽어와 데이터프레임으로 변환한다.
'c:/Users/Admin/Desktop/examdata.csv'는 읽어올 CSV 파일의 경로이다.
이 경로는 파일의 실제 위치에 따라 다를 수 있다.
읽어온 데이터는 emp 변수에 저장되며,
이는 pandas 데이터프레임 객체가 된다.
emp = pd.read_csv('c:/Users/Admin/Desktop/examdata.csv')
emp 데이터프레임을 출력하여, 읽어온 CSV 파일의 내용을 확인한다.
주피터 노트북 환경에서는 변수명만 입력해도 해당 변수의 내용을 출력할 수 있다.
emp
employee_id 의 타입을 확인하려고 한다.
데이터프레임의 하위 5개 행을 호출한다.
print(emp.tail(5))
print(type(emp['EMPLOYEE_ID']))
print(type(emp[['EMPLOYEE_ID']]))
<class 'pandas.core.series.Series'>
<class 'pandas.core.frame.DataFrame'>
하나는 시리즈, 하나는 데이터프레임 이다.
selected_columns = emp[['EMPLOYEE_ID', 'FIRST_NAME']]
print(selected_columns)
print(type(selected_columns))
<class 'pandas.core.frame.DataFrame'>
이는 두 개의 열을 선택하여 새로운 데이터프레임이 생성되었음을 의미한다.
==: 같음
!=: 다름
>: 크다
<" 작다
emp[emp['SALARY']>1000]

and: 그리고
or: 또는
not: 부정
a = 5
b = 3
print(not a < b)
True
a = 10
b = 20
c = 30
if a < b and b < c:
print("a는 b보다 작고, b는 c보다 작다.")
else:
print("조건이 성립하지 않는다.")
# 여러 조건을 조합한 예시
if a < b or b > c:
print("a는 b보다 작거나, b는 c보다 크다.")
# 조건 부정 사용 예시
if not (a == b):
print("a는 b와 같지 않다.")
a는 b보다 작고, b는 c보다 작다.
a는 b보다 작거나, b는 c보다 크다.
a는 b와 같지 않다.