OT
생존 Tips
- 다른 사람과 비교하려 하지 말자
- 완벽하려고 하지 말자 지금은 부족을 채우는 과정이다
- 모르는 내용 위주로 적자
- 소통을 중요시 하자
- 과제는 무조건 9시까지
[Today I Learned]
Warm-up
1. Git은 뭐고 Github는 뭔가요?
- Git은 버전관리를 위한 소프트웨어
- Github는 Git으로 저장돼서 원격 전송된 내역들이 저장되는 공간을 제공하는 서비스
- Git을 쓰는 이유
1) 버전 관리
2) 협업
- Fork, Commit, Clone, Pull Request
2. Goals of EDA
- EDA를 하는 이유
- 데이터를 더 잘 이해하기 위해서
- 분석 전에 데이터가 가진 잠재적인 문제를 발견
- 시각화를 통해 새로운 패턴 발견, 이를 바탕으로 가설 검증
3. Colab extension
- chrome extension을 통해서 github의 .ipynb파일을 여는 방법
4. Markdown
- Markdown(마크다운)은 일반 텍스트 문서의 양식을 편집하는 문법이다.
기본적인 문법
제목 : #, ===, --
인용 : >
링크 : [text](링크 주소)
이미지 : ](링크 주소)
리스트 : 1 , * , - , +
인라인 코드 : ' , ''' , ~~~
줄바꿈 : 엔터 2번
가로선 : ------
텍스트 속성
bold : * Text *, __Text__
itlaic : * Text *, _Text_
strikethrough : ~~Text~~
Session - n111
- github 과제 제출 방법
- 기본적인 colab의 사용법
- 기본적인 pandas의 사용법
- 모르는 코드를 키워드를 통해 검색하는 방법
과제
<과제 하면서 새롭게 배운 내용>
pd.read_excel(url, sheet_name = 0)
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf
plt.rc('font', family='NanumBarunGothic')
Reference
1. Exploratory Data Analysis
- 제대로된 데이터 분석을 위해서는 데이터 타입을 잘 확인해야
- Categorical
- Nominal : 순서 X
- Ordinal : 순서 O
- Continuous
- Interval : 일정 간격을 나타내며 0이 없음 (social science)
- Ratio : 0이 존재 (physical science)
- Descriptive statistics
- Mean, Median, Mode (Central tendency 집중 경향성)
- Range, Standard deviation, Interquartile (variability 변산도)
- 적절한 그래프 선정 방법
2. UCI Machine Learning Repository
3. 키워드 검색 노하우
첫 블로그 글 작성....