_2022.08.12_
colab? 클라우드 기반의 무료 Jupyter notebook 개발 환경이다.
Variable 변수란? 변수이름 = 넣는 값
* 모든 변수명은 숫자로 시작하면 안됨, 영문으로 시작할 것.
* 변수는 동명이인이 있으면 안됨(if, for 등의 예약어).
* _를 제외한 특수문자 사용 불가.
* 대소문자 구별. 기본적으로 소문자로 시작하자.
글꼴 변경
3-1. 문자열 3-2. 문자열 연결 + 3-3. 문자열 문단 '''
: []대괄호와 ,콤마를 사용해서 만든다.
* 여러값 함께 모으기 및 꺼내올 수 있음.
변수명 하나만 설정하고 1,2,3,4,5 한번에 출력
: 특정데이터만 추출
0번부터 시작하니 [2]를 입력하면 3이 나옴
*마지막 값은 -1로 찾을 수 있음( 마지막 데이터 가져다 쓰는 거)
: 특정 범위의 데이터만 추출(구간)
: [인덱스:번째]
: 후에 list 에 데이터 담기. (기차 출발한 후 뒤에 데이터 더 명시하기)
*실수하면 최초의 코드 실행 부분 다시 실행하고 아래로 내려와라.
혹은 런타임에서 '다시 시작 및 모두 실행'
: 자유롭게 데이터 구성하고 싶을 때 사용
*값은 중복되도 되는데 키는 중복되면 안됨.
^Dictionary에 데이터 추가하기
^ 데이터 바꾸고 싶을때 엎어쓰기
^혼자해보기
<책 모두의 데이터분석 with 파이썬>
^ 아래의 '파일 불러오고 읽는 법' 요약한 교수님의 아름다운 서점 설명 ㅎㅎㅎㅎ
<책 29p> : 데이터 파일 여는 방법
^ CSV 파일로 다운 * 그래프보면 중간에 비워져있는 이유: 날짜는 있지만 데이터 누락됨
^ notepad++ 로 폴더 열기
^ 맨 아래로 내려가서 공백이 있으면 백스페이스로 없애라. 오류날 수도 있기 때문에.
^ 위의 불필요한 자료 없애기 및 다른이름으로 저장(seoul.csv)
^ seoul.csv 파일 읽어오기
^ 파일 읽고(경로복사) 닫기
^ 모든 데이터 출력
원본 데이터에서 누락된 데이터있는지 확인해라.
^ 1950년 09월 01일부터 데이터 누락. 후에 3년동안은.
header : next 한줄 읽고, 커서(읽어드릴 위치) 한칸 이동
기상 관측 이래, **서울**의 **최고 기온**이 **가장 높았던 날**은 **언제**였고,**몇 도**였을까?
질문을 해결하는 필요한 데이터는 날짜와 최고기온 데이터
1. 데이터를 읽어온다
f = open()
data = csv.reader(f)
2. 순차적으로 최고 기온을 확인한다.
for row in data: # 순차적으로 모든 데이터 읽어봐야지.
row[-1] # 최고기온은 -1로 읽어들이면 되니까.
row[0] # 날짜
3. 최고기온, 날짜저장 #* 금속탐지기
row[-1], row[0] #for문 끝
4. 출력
print()
5. f.close()
^ 위의 코드로 아래의 결과값들을 얻을 수 있다.
^ 코드로 최고기온 도출하기
^ 최저기온
^ 평균기온row[] 안의 수만 바꿔주면 됨.
+추가설명: 이 notepad++를 보면 평균기온 위치가 row[2]이니 2를 입력하면 됨.
^대구 최고 기온
^대전 최고 기온
^ 추가적인 코드 if row[-1] != '': 위와 같이 비교하지 않아도 != (아닌것)이라고 표시해주면 됨.
파일 읽어드리는 설명 그림은 좀 더 잘 그렸던 거 같은데 표현이 안되서 너무 아쉽네요 ㅎㅎㅎㅎ