데이터 사이언스에 대한 기본 개념을 이해합니다.데이터 사이언스 정의데이터 사이언스와 통계학데이터 사이언스 벤 다이어그램데이터와 인공지능의 관계머신러닝과 딥러닝콘웨이의 데이터 사이언스 벤다이어그램아래의 모든 것을 아우르는 것을 데이터 사이언스라고 정의합니다.Hacking
엔트리를 통해 데이터 사이언스에 대한 기본 개념을 이해합니다.표를 읽는 방법(행과 열의 이해)차트의 이해 - 막대, 선, 원, 점, 히스토그램 그리기표를 요약하는 방법기본적인 기술통계의 이해평균, 표준편차, 최댓값, 중간값, 최솟값공식 사이트:https://p
파이썬의 가상환경과 아나콘다, 주피터, Google Colab 의 차이를 이해합니다.아나콘다의 이해Google Colaboratory클라우드 환경을 통한 주피터 노트북 사용법Colab을 통한 데이터 로드와 요약\*파이썬 생태계: 정말 많죠? 이걸 다 까는 것은 말이 안
Google Colab 의 사용법을 실습합니다.Google Colaboratory클라우드 환경을 통한 주피터 노트북 사용법런타임 연결Colab을 통한 데이터 로드와 요약학습 내용Google Colaboratory 를 직접 실습을 통해 알아봅니다. 클라우드 환경에서 파이
https://docs.python.org/ko/3/tutorial/index.html파이썬의 철학이 잘 담겨있는 Zen of Python 을 출력해 봅니다."아름다운 게 추한 것보다 낫다." (Beautiful is better than ugly)"명시적인
참고 사이트: 링크텍스트(https://docs.python.org/ko/3/tutorial/controlflow.htmlfor참고 사이트: 링크텍스트(https://docs.python.org/ko/3/tutorial/controlflow.htmlr
방법문자열을 ">" 문자로 나눕니다.(split)반복문으로 문자열을 나눠 만든 리스트를 순회합니다.(for)비어있는 문자일때는 건너뜁니다.비어있지 않다면 공백으로 나눕니다.(split)나눈 문자열로 지역과 지역번호를 구분해서 dict 에 넣어줍니다.딕셔너리를 출력해서
파이썬의 탐색적 데이터 분석과 관련된 도구에 대해 알아봅니다.수치 계산을 위한 numpy데이터 분석을 위한 pandaspandas의 DataFrame, Series데이터 시각화를 위한 matplotlib, seaborn참고 사이트: https://numpy.o
데이터 분석을 위해 판다스의 데이터프레임과 시리즈를 이해하며 실습해 봅니다.DataFrame, Seriesread_csvshape, index, columns, values, dtypesdf.info(), df.describe()df.isnull().sum(), df.
pandas와 seaborn 등을 활용하여 수치형 변수의 탐색적 데이터 분석을 실습해봅니다.df.head() df.tail()df.info()df.describe()pandas와 seaborn 등을 활용하여 수치형 변수의 탐색적 데이터 분석으로 데이터를 로드하고 일부
수치형 변수의 빈도수를 시각화하고 히스토그램과 분포에 대해 이해합니다.히스토그램과 도수분포표수치형 변수의 빈도수왜도와 첨도히스토그램은 수치형 변수를 도수분포 형태로 구간화 하고 그 빈도수를 세어 시각화하기히스토그램과는 다룹니다.히스토그램을 통해 수치 데이터의 분포를 알
하나의 수치형 변수에 대한 다양한 표현방법을 알아봅니다.히스토그램histplot, kdeplot, rugplotboxplot, violinplotdescribeskew, kurt하나의 수치형 변수에 대한 다양한 표현방법을 알려드릴건데 이전 블로그에선 전체 데이터프레임에
두 개 이상의 수치형 변수에 대한 시각화 방법을 알아봅니다.scatterplot, regplot, residplotlmplotrelplot : lineplot, scatterplot신뢰구간두 개 이상의 수치형 변수에 대한 시각화 방법을 알아볼 겁니다.seaborn 의
두 변수간의 관계의 강도인 상관계수를 직접 구하고 시각화 합니다.상관계수heatmap두 변수간의 관계의 강도인 상관계수를 직접 구하고 시각화 합니다. 상관 분석 이해하기 입니다.상관 분석(相關 分析, Correlation analysis) 또는 '상관관계' 또는 '상관
범주형 변수의 기술통계에 대해 알아봅니다.빈도수(count)유일값(unique)결측치(isnull, isna)최빈값(top), 최빈값의 빈도수(freq)describe(include="object")데이터 및 라이브러리 로드\*라이브러리 로드\*버전확인df = sns.
파이썬에 대해 알아봅니다.df.nunique()하나의 변수에 대한 빈도수 : series.value_counts()sns.countplot()두 개 이상의 변수에 대한 빈도수 : pd.crosstab()파이썬의 범주형 변수에 대한 빈도수를 그릴 때, 변수의 갯수에 따라
범주형과 수치형 변수로 막대그래프를 시각화 합니다.barplotgroupbypivot_table범주형과 수치형 변수로 막대그래프를 시각화할 때, barplot 은 범주형 변수와 수치형 변수의 대표값을 그릴 때 사용합니다. 수치형 변수를 표현하는 대표값에 대한 기본값은
범주형과 수치형변수를 박스플롯으로 그리고 사분위 수와 이상치를 알아봅니다.boxplot과 사분위수df.groupby()범주형과 수치형변수를 박스플롯으로 그리고 사분위수와 이상치를 알아보기boxplot과 사분위수를 알아보고 boxplot 내부에 사분위수가 어떻게 표현
범주형과 수치형변수를 박스플롯으로 그리고 사분위 수와 이상치를 알아봅니다.boxplot과 사분위수df.groupby()범주형과 수치형변수를 박스플롯으로 그리고 사분위수와 이상치를 알아보기boxplot과 사분위수를 알아보고 boxplot 내부에 사분위수가 어떻게 표현
범주형 변수의 산점도를 표현하는 다양한 방법을 알아봅니다.서브플룻을 그리는 catplot알아보기scatterplotstripplotswarmplotcatplotkind: bar, point, box, violin, strip, swarm범주형 변수의 산점도를 scatt
인공지능, 머신러닝, 딥러닝의 차이와 머신러닝과 딥러닝의 학습과정에 대해 알아보기인공지능, 머신러닝, 딥러닝지도학습, 비지도 학습분류와 회귀지도학습의 학습과 예측 과정인공지능에는 머신러닝과 딥러닝이 하위개념으로 있습니다. 인공지능이라는 기술은 어느 날 갑자기 등장한 개