
인공지능 종류
딥러닝, 머신러닝, 롤베이스 기반 서비스
-> 머신러닝 딥러닝 뿐만이 아니다
머신러닝이란?
데이터를 통해서 모델이 학습을 하고 결과를 도출하는 것
딥러닝이란?
사람의 뇌를 모티브로한 모델
데이터 관련 이론은 있었는데 gpu가 발전하면서 급속도로 더욱 발전하기 시작했다.
머신러닝
1. 지도학습
-> 정답이 포함되어있음
- 분류 - 클래스로 나뉘어지는것
ex) 고양이 표범 호랑이 사진 학습해서, 새로운 고양이과 사진 정답으로 분류하기
- 회귀 - 어떤값이 있을때 다음 값을 예측하는 것 - 시계열 관련
2. 비지도학습
-> 정답이 없다. 데이터를 뿌려넣고 서로 비슷한 특성끼리 묶어주는 것.
-> 현업에서는 보통 많이 쓰지 않는 것 같다.
teachable machine
가위 바위 보 한번 해봤다.
수행 목표
지도학습의 분류 -> 플라스틱 분류

분류해보자
프로세스
플라스틱 종류 구분해보기


folium : 파이썬에서 사용할 수 있는 지도 시각화 라이브러리
df = pd.read_csv(r"E:\est\map_vison\busan.csv",
encoding='cp949',
index_col=0)
geo_path = r"E:\est\map_vison\busan_gu.json"
geo_str = json.load(open(geo_path, encoding='utf-8'))
map=folium.Map([35.179665, 129.0747635], zoom_start=10)
map=folium.Map([35.179665, 129.0747635], zoom_start=10)
folium.Choropleth(geo_data = geo_str,
#data = df['population'],
fill_color = "PuBu",
key_on = "feature.id",
legend_name = "부산 인구 수 (단위 : 명)").add_to(map)
map
절대 테스트 데이터는 학습데이터로 구성하면 안된다. 모델의 성능을 테스트하려면 무조건 새로운 것 데이터를 사용해야한다.
서로 같은 데이터를 넣었는데, 다른 결과가 다르게 나온다.
-> 가중치 설정을 할 수 없기에, 여기서는 랜덤하게 주어졌기 때문에 모델이 다르게 나온 것이다.
데이터를 받아오면 어떤 종류의 데이터인지 파악부터하는게 중요하다. 단위 따위 놓치지 말자.
key_on : 지리정보와 시각화정보의 공통변수로서 'feature.id'를 설정
load/loads
[i['properties']['name_eng'] for i in geo_str['features']]geo_str에서 name_eng를 수집하여 df에 "gu_eng"의 열을 만드시오.
-> for 문을 사용하여 json 데이터에서 영어 관련 딕셔너리를 찾아서 벨류값을 담은 리스트를 만들었다.
이후 새로운 컬럼을 선언
부산 구별 인구 밀도를 계산하여 df에 "density"열을 추가하고 인구 밀도 값을 추가하시오.
-> 인구 컬럼 / 면적 컬럼 한값을 신규 컬럼에 담았다.
인구 밀도에 따른 구별 Choropleth를 그리시오.
map = folium.Map([35.179665, 129.0747635], zoom_start=10)
folium.Choropleth(geo_data=geo_str,
data=df['density'],
fill_color='PuOr',
key_on='feature.id',
legend_name = '부산 구별 인구 밀도 (단위 : 명/㎢)'
).add_to(map)
map