AI 부트캠프 2기 - Day 1

Jeongwoo Lee·2021년 3월 4일
0

Codestates AI Bootcamp

목록 보기
1/19

OT

생존 Tips

  • 다른 사람과 비교하려 하지 말자
  • 완벽하려고 하지 말자 지금은 부족을 채우는 과정이다
  • 모르는 내용 위주로 적자
  • 소통을 중요시 하자
  • 과제는 무조건 9시까지

[Today I Learned]

Warm-up

1. Git은 뭐고 Github는 뭔가요?

  • Git은 버전관리를 위한 소프트웨어
  • Github는 Git으로 저장돼서 원격 전송된 내역들이 저장되는 공간을 제공하는 서비스
  • Git을 쓰는 이유
    1) 버전 관리
    2) 협업
  • Fork, Commit, Clone, Pull Request

2. Goals of EDA

  • EDA를 하는 이유
    1. 데이터를 더 잘 이해하기 위해서
    2. 분석 전에 데이터가 가진 잠재적인 문제를 발견
    3. 시각화를 통해 새로운 패턴 발견, 이를 바탕으로 가설 검증

3. Colab extension

  • chrome extension을 통해서 github의 .ipynb파일을 여는 방법

4. Markdown

  • Markdown(마크다운)은 일반 텍스트 문서의 양식을 편집하는 문법이다.
기본적인 문법

제목 : #, ===, --
인용 : >
링크 : [text](링크 주소)
이미지 : ![text](이미지 주소)](링크 주소)
리스트 : 1 , * , - , +
인라인 코드 : ' , ''' , ~~~
줄바꿈 : 엔터 2번
가로선 : ------

텍스트 속성

bold : * Text *, __Text__
itlaic : * Text *, _Text_
strikethrough : ~~Text~~

Session - n111

  • github 과제 제출 방법
  • 기본적인 colab의 사용법
  • 기본적인 pandas의 사용법
  • 모르는 코드를 키워드를 통해 검색하는 방법

과제

<과제 하면서 새롭게 배운 내용>

  • 엑셀 시트 여러 개 불러오는 방법
# sheet_name 옵셥 사용
pd.read_excel(url, sheet_name = 0)
  • Colab 한글 깨짐 현상 해결 방법
# 폰트 설치 후 코랩 런타임 재실행
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

# 한글 폰트 설정
plt.rc('font', family='NanumBarunGothic')

Reference

1. Exploratory Data Analysis

  • 제대로된 데이터 분석을 위해서는 데이터 타입을 잘 확인해야
  • Categorical
    • Nominal : 순서 X
    • Ordinal : 순서 O
  • Continuous
    • Interval : 일정 간격을 나타내며 0이 없음 (social science)
    • Ratio : 0이 존재 (physical science)
  • Descriptive statistics
    • Mean, Median, Mode (Central tendency 집중 경향성)
    • Range, Standard deviation, Interquartile (variability 변산도)
  • 적절한 그래프 선정 방법

2. UCI Machine Learning Repository

3. 키워드 검색 노하우




첫 블로그 글 작성....

profile
열심히 하자

0개의 댓글