구글에서 제공하는 브라우저 기반 코드 실행환경 서비스. 클라우드를 기반이며,개발환경은 주피터 형식이나 보다 좋은 환경을 제공하고 있다.colab의 장점 : 무설치, 노트북, 공유기능무설치 : 설치 이슈가 없다. colab은 서버에서 돌아가는 시스템이기 때문.노트북 :
먼저 기본적인 내용 모듈, 패키지, 라이브러리 개념을 정리해보자. 개념 모듈(module) 함수나 변수 또는 클래스를 모아 놓는 파일 패키지(package) 파이썬 모듈을 계층적(디렉터리)으로 구성해 놓은 단위 라이브러리(library) 이미 구현된 유용한 기능을 가
판다스에서는 두 가지 핵심 데이터 구조(data structure)을 사용한다.(데이터 구조 : 다양한 종류의 데이터 형식(Data type)이 모여 있는 객체이다.)Serise 여러 개의 레이블과 그 값을 들고 있는 일차원 배열 DataFrame 데이터 테이블
판다스에서 인덱싱 하는 방법은 여러 가지가 있다.레이블레이블 모음레이블 순서(번호)값이 특정 조건을 만족하는 경우데이터 프레임에서는 행과 열 각각 인덱싱 할 수 있다..loc과 .iloc 모두 특정 행과 열을 인덱싱하는데 쓰인다..loc 축(axis)의 레이블(labe
데이터 형식csv(Comma Separated Values)값을 쉼표로 구분하는 데이터 형식. 호환성이 높고 텍스트 형식이기 때문에 사람이 읽기 쉽다는 점에서 자주 쓰인다. 하지만 큰 데이터(기가,테라 단위가 넘어가는)를 저장하기에는 효율적인 방식은 아니다.판다스 데이
개념 데이터 가공 (Data manipulation) 데이터 분석의 80% 이상 데이터 전처리(pre-processing)에 쓰인다. > 결측값(missing values) 처리 중복값(duplicated values) 처리 오류값(error values) 처리 기
데이터 가공(Data manipulation)데이터 분석의 80% 이상 데이터 전처리(pre-processing)에 쓰인다.결측값(missing values) 처리중복값(duplicated values) 처리오류값(error values) 처리기존 값을 가공해 새로운
데이터 가공 (Data manipulation)데이터 분석의 80% 이상 데이터 전처리(pre-processing)에 쓰인다.결측값(missing values) 처리중복값(duplicated values) 처리오류값(error values) 처리기존 값을 가공해 새로운