# dataframe

74개의 포스트
post-thumbnail

Serise와 DataFrame 그림으로 정리하기

판다스의 대표적인 데이터 타입인 시리즈와 데이터프레임은 비슷하면서도 다르다.시리즈가 여러 개 모인 것을 데이터프레임으로, 데이터프레임을 하나로 쪼갠 것을 시리즈로 볼 수도 있다.이전의 사진에서 확인했듯 시리즈는 1차원 벡터구조인 반면 데이터프레임은 2차원 행렬구조를 가

7일 전
·
0개의 댓글
·

loc와 iloc 정리

loc = location데이터프레임의 행이나 열에 label, boolean array(True, False)로 데이터에 접근사람이 읽기 편한 라벨로 특정 값을 추출loc 사용법df.loc행 인덱싱 값, 열 인덱싱 값iloc = inter location데이터프레임의

7일 전
·
0개의 댓글
·
post-thumbnail

ValueError: cannot join with no overlapping index names

엑셀 시트별 월 수를 데이터프레임 자체 연산을 시도했을 때 발생원인 : 데이터프레임에서 index 이름이 달라서 발생한 문제month_total생성한 데이터프레임에 index의 이름을 생성한다. \---> 결과로 NaN값 출력됨해당 시트의 월별 count값을 확인해보니

7일 전
·
0개의 댓글
·

loc를 이용한 Data Frame 각 행에 데이터 넣기

Data Frame 각 행에 데이터를 넣을 때 코드가 자꾸 헷갈려서 일반화 해서 공유합니다.

2022년 9월 17일
·
0개의 댓글
·

Apache Spark Dataframe API

Spark에서는 Dataframe 사용이 권장되며, Spark RDD에 스키마를 입힌 것이 Dataframe이라고 알면 된다. 즉 Spark 기본인 RDD에서 출발하여 더 발전된 형태로 활용할 수 있는 것이 Spark Dataframe이다.Spark Core -> RD

2022년 9월 12일
·
0개의 댓글
·
post-thumbnail

[udemy] python 부트캠프_section 26_List Comprehension

python에만 존재하는 독특한 구조로서, 이전 리스트로부터 새로운 리스트를 만드는 방법이다. for Loop를 사용하여 이전 리스트 값에서 1씩 증가한 새로운 리스트를 만드려면 다음과 같이 긴 코드가 필요하다.List Comprehension을 사용하면 다음과 같이

2022년 9월 12일
·
0개의 댓글
·
post-thumbnail

pandas - 데이터 프레임 조작하기

프로젝트를 진행하다, 잊고싶지 않아 이곳에 기록해둔다.kaggle에 올라온 데이터프레임을 전처리하다,데이터프레임에 담긴 list가 String으로 저장되어있는 문제를 마주했다."\['make a choice and proceed with recipe', 'dep..."

2022년 8월 12일
·
0개의 댓글
·
post-thumbnail

[Pansdas 기초] Data structures(DataFrame, Series)

Series, DataFrame 개념 및 사용법

2022년 8월 11일
·
0개의 댓글
·

Pandas DataFrame CSV 파일로 저장하기

Pandas DataFrame을 CSV 파일로 저장하는 방법

2022년 7월 21일
·
0개의 댓글
·
post-thumbnail

Pandas 상관분석

👉 Pandas Dataframe을 사용하여 상관분석을 하고 싶은 분👉 상관 분석을 그래프화하고 싶은 분상관분석, 그래프화 정도는 구글링이나 책 좀 보면 누구나 쉽게 따라할 수 있쥬? 😀근데 간혹가다 결과물로 생성된 그래프에 "NaN"으로 빈 줄이 쭈~욱 그어진

2022년 7월 21일
·
0개의 댓글
·
post-thumbnail

[Pandas] 데이터 살펴보기

df.head() : 데이터 상위 5개 행 출력, 괄호에 넣은 숫자만큼 행 출력df.tail() : 데이터 하위 5개 행 출력, 괄호에 넣은 숫자만큼 행 출력df.shape : 데이터의 (행, 열) 크기 확인df.info() : 전반적인 정보, 데이터 프레임의 행&열

2022년 6월 24일
·
0개의 댓글
·
post-thumbnail

[Pandas] 데이터프레임 연결/병합 : concat(), merge(), join(), append()

비슷한 듯 다른 문법이 너무 많다. 데이터프레임 병합하는 panda 함수들...1 concat() : 데이터프레임을 물리적으로 연결시켜 준다.인자값(파라미터)으로 리스트.아무 옵션 없이 합치면 각 데이터프레임의 인덱스를 그대로 사용하고 빈 부분은 NaN시리즈 데이터와

2022년 6월 23일
·
0개의 댓글
·
post-thumbnail

[Pandas] 데이터프레임 DataFrame

판다스란?R의 데이터프레임 데이터 타입을 참고하여 만든 것데이터프레임 3요소 - 컬럼, 로우(데이터), 인덱스다양한 데이터 타입 이용 가능 - list, dictionary, series, ndarray 등series들을 하나의 열로 취급한 집합이라 볼 수 있음데이터를

2022년 6월 20일
·
0개의 댓글
·

pandas DataFrame 생성 및 전처리 과정

pandas를 통해 DataFrame 생성 전처리 > 1. 필요없는 columns 제거, columns 이름 수정 > 2. 결측치, 중복 데이터 처리(제거 혹은 변경) > 3. 각 데이터의 type과 범위 확인 및 변경 => 이상치 확인 > 4. 이상치 처리(제거 혹은 변경) > 5. 데이터의 단위 통일, 분포 변환 > 6. 유의미한 결과 찾기 및 co...

2022년 6월 16일
·
0개의 댓글
·
post-thumbnail

csv파일 django model로 splite db에 저장하기

5천장의 사진데이터를 가져오고 사진과 함께 5천개의 데이터를 가져왔다. 가격정보, 이름, img_url까지 이 데이터를 dictionary에서 dataframe으로 바꾸고 다시 csv파일로 저장했다.이제 다음 단계로 우리 모델에 이 파일로 저장된 데이터를 가져와야 하는

2022년 6월 9일
·
0개의 댓글
·
post-thumbnail

파이썬으로 연동한 MYSQL - 날짜 입력에 따른 sql문 동작, 결과값 엑셀 파일로 저장

파이썬으로 MYSQL에 연동 후 원하는 날짜를 입력해 그에 맞는 데이터만 추출하기 위해 날짜를 입력받는 함수식을 추가했다이후 지표를 더 편하게 정리하기 sql 테이블 데이터를 python pandas 데이터프레임에 삽입 후 엑셀 파일로 추출하는 함수를 넣어 간단하게 복

2022년 5월 26일
·
0개의 댓글
·

python dataframe 값 복사

pandas의 데이터 타입인 dataframe의 경우 값을 복사할 때, 원본 dataframe의 값은 그대로 놔두고 싶은데 값을 바꾸면 원본 값이 바뀌는 경우가 발생한다. 이 경우

2022년 4월 10일
·
0개의 댓글
·
post-thumbnail

Python Web Crawling _ CSV로 데이터 저장하기 [1]

1. 기본 세팅 2. 페이지 분석하기 3. 코드 작성 4. 실행 결과

2022년 4월 5일
·
0개의 댓글
·

Pandas: inplace

Pandas 수업을 듣다, 를 보고, inplace = True의 뜻은 뭘까?하는 의문이 들었다.우선 이해를 위해 예제를 하나 만들어보겠다.예제 출처 : playdata 김연지 강사님DataFrame을 더 효율적으로 사용하려면 모든 타입을 int로 바꿔주는 것이 좋다.

2022년 3월 30일
·
0개의 댓글
·
post-thumbnail

[판다스] 왕초보 판다스 - 개념과 시리즈, 데이터프레임 만들기

왕초보 판다스 시리즈 1편: 판다스(Pandas)는 파이썬에서 2차원 배열 데이터를 간편하게 다룰 수 있도록 만들어진 라이브러리다. 판다스의 개념과 판다스에서 사용하는 데이터 종류를 만들어보자!

2022년 3월 25일
·
0개의 댓글
·