7일차 데이터 분석1 - 히스토그램

차지예·2025년 5월 21일

생성AI

목록 보기
7/56
post-thumbnail

🟡그래프 그리기(히스토그램)

공공데이터 사용해 그래프 시각화하기

기상자료개방포털

[기후통계분석] - [기후분석] - [기온분석] -[csv 다운로드]

공공데이터들은 한국어가 있을수 있으므로 한글 깨짐 방지 하기

pip install koreanize-matplotlib

다운받은 csv파일은 무조건 한번은 확인한다.

  • 결측치 확인
  • 필요없는 데이터 확인
  • 데이터 자료형 확인

다운로드 받은 파일은 확인을해서 필요없는 자료같은건 지워줘야 한다.
간단한 것은 코드로 지우는것보단 1차적으로 지워주는게 좋다.


히스토그램

# 관측이래, 서울의 최고기온의 데이터를 시각화
import csv
import matplotlib.pyplot as plt

# 최괴기온 정보를 담는 리스트 선언
result = []

# 파일을 연다
f = open('/content/drive/MyDrive/Colab Notebooks/딥다이브/seoul_2025.csv', 'r', encoding= "euc-kr")

# 파일을 읽는다
data = csv.reader(f,delimiter=',')

# 헤더(데이터 정보) 저장하기
header = next(data) #next()함수는 한줄 읽고, 커서(읽어드릴 위치) 한칸 이동, 한줄한줄 읽어드린다

# 최고기온 result 리스트만 담기
for row in data:
  # 결측치 데이터 처리 -> result 리스트에 담지 않기
  if row[-1] != '': #결측치가 아닌 최고기온 데이토 실수형변환하여 result 리스트에 담기
    result.append(float(row[-1]))
# 파일을 닫는다
f.close()

# 최고기온 데이터 시각화 -> 히스토그램
plt.figure(dpi=200) #해상도

plt.title('서울의 최고기온 히스토그램')
plt.hist(result ,bins=100 ,color='r')
plt.show


01월과 08월의 최고기온 데이터 히스토그램으로 표현하기
# 관측이래, 서울의 최고기온의 데이터를 시각화
import csv
import matplotlib.pyplot as plt

# 01월, 08월 최고기온 정보를 담는 리스트 선언
aug_list = []
jan_list = []

# 파일을 연다
f = open('/content/drive/MyDrive/Colab Notebooks/딥다이브/seoul_2025.csv', 'r', encoding= "euc-kr")

# 파일을 읽는다
data = csv.reader(f,delimiter=',')

# 헤더(데이터 정보) 저장하기
header = next(data) #next()함수는 한줄 읽고, 커서(읽어드릴 위치) 한칸 이동, 한줄한줄 읽어드린다

# 최고기온 result 리스트만 담기
for row in data:
  # 결측치 데이터 처리 -> result 리스트에 담지 않기
  if row[-1] != '': #결측치 처리
    # 08월 데이터 담기
    month = row[0].split('-')[1]
    if month == '08':
      aug_list.append(float(row[-1]))

    if month == '01':
      jan_list.append(float(row[-1]))
# 파일을 닫는다
f.close()

# 최고기온 데이터 시각화 -> 히스토그램
plt.figure(dpi=200) #해상도

plt.title('서울의 최고기온 히스토그램')
plt.hist(aug_list ,bins=100 ,color='r',label='08월의 최고기온') #08월 최고기온
plt.hist(jan_list ,bins=100 ,color='b',label='01월의 최고기온') #01월 최고기온
plt.legend()
plt.show

자세한 코드는 깃허브

0개의 댓글