profile
성장 중독 | 서버, 데이터, 정보 보안을 공부합니다.

[AI] LinearRegression과 XGBoost 비교하기

XGBoost로 학습을 시켰을 때 더 좋지 않은 성능이 측정됨을 알 수 있다.

2023년 5월 3일
·
0개의 댓글
·

[AI] EDA 필사를 하며 알게된 사실

pandas.DataFrame.plot.pie를 사용하여 pandas에서 바로 pie chart를 그릴 수 있다. bar plot 등도 마찬가지.hue는 오른쪽 위 작은 네모 박스나이 결측치를 채우기 위해 이름의 Mrs, Ms 등을 힌트로 이용할 수 있다는 사실. 본인

2023년 4월 10일
·
0개의 댓글
·

[AI] EDA 실습

데이터의 자료형이나 특성이 이러해서 어떠한 방법을 사용했는지, 그런 특성상 어떤 시각화 기법을 이용하는 것이 좋겠다고 판단했는지Male과 Female이 존재하는 Gender열에서 각 성별 별 데이터 수를 비교하고 싶었다. 이를 위해 bar plot의 형태로 시각화를 진

2023년 4월 2일
·
0개의 댓글
·

[AI] 공공데이터로 EDA 실습하기

요즘 미세먼지가 너무 심해서 미세먼지 관련 데이터를 분석해보았다.데이터 출처 : 한국환경공단\_도로 재비산먼지 측정 정보\_20230228.csv서울, 경기가 가장 높을 것이라 예상했는데 충북이 가장 높다는 결과가 도출되었다. 하지만 모든 지역을 매일 조사하지 않았

2023년 4월 2일
·
0개의 댓글
·

[AI] Visualization with Matplotlib and Seaborn

저번주에 공부한 Pandas, 그리고 이번주에 공부한 Matplotlib과 Seaborn을 이용하여 여러 시각 자료를 생성해보았다. 데이터는 titanic과 관련된 csv로, 아래와 같은 정보가 저장되어있는 dataframe을 사용하였다. 1. Pclass 별 탑승

2023년 3월 26일
·
0개의 댓글
·

[AI] Pandas 기본 내용 정리

오랜만에 하는 포스팅.개강을 하고 이것저것 벌려놓은 일이 많아서 열심히 수습 중이다.올해는 뭐라도 저지르자가 목표였는데 그와 동시에 잘 수습하자는 목표가 생겼다.교내 동아리 GDSC의 인공지능 스터디에 참여하게 되어 매주 포스팅할 예정.아래는 Pandas 문서를 정리해

2023년 3월 19일
·
0개의 댓글
·