# iloc

12개의 포스트
post-thumbnail

[Python] pandas

import pandas DataFrame 기본 사용법 결측값 결측값 처리 방법 **1. 제거(Deletion) : 일반적으로는 결측값을 제거하는 것이 가장 좋은 방법이다. 대치(Imputation) : 결측값을 특정 값(최빈값, 중앙값, 평균)으로 대치하는 것이다. 예측모델 : 회귀 분석 기술이나 기계 학습 방법 등을 활용하는 통계 방법** DataFrame Join (데이터프레임 합치기) **위에 코드에서 DataFrame.merge()를 통해서 데이터프레임을 합치는데, 두 데이터프레임에 있는 공통필드를 기준으로 데이터프레임을 합치는 방식이다. left_on : 왼쪽 데이터프레임에서 공통필드를 작성해 주면 된다. right_on : 오른쪽 데이터프레임에서 공통필드를 작성해 주면 된다. how : "inner", "outer", "left", "right" 중에서 선택해서 작

2023년 5월 21일
·
0개의 댓글
·
post-thumbnail

[pandas] 색인 - loc와 iloc

축의 라벨을 이용하여 DataFrame의 로우와 컬럼을 선택할 수 있는데, loc는 축의 '이름'을 사용하고 iloc는 축의 정수 색인으로 사용한다. loc-iloc[index, column] 으로 색인을 한다. >## loc 하나의 인덱스와 두개의 컬럼을 축으로 해서 불러오면, 슬라이싱으로 불러올 수도 있다. loc에서 슬라이싱으로 불러올 때 주의할 점은 파이썬의 문법과 조금 다르다는 것이다. 예로 [a:b]로 불러온다면 'b'까지 불러온다. 슬라이싱 밑의 그림과 같이 'three'의 값도 불러온 것을 볼 수 있다.![](https://v

2023년 5월 17일
·
0개의 댓글
·

pandas columns iloc drop

컬럼명이 아닌 컬럼의 iloc으로 drop할 대상을 명시하여 설정하는 방법 KeyError 위의 코드를 실행했을 때는 KeyError가 발생, 그래서 삭제하고자 하는 부분을 데이터 프레임으로 생성한 뒤 확인했다. `iloc`으로 특정 열을 데이터프레임으로 변환한 값을 drop할 부분으로 지정해줌 ![](https://velog.velc

2022년 10월 7일
·
0개의 댓글
·

loc와 iloc 정리

데이터프레임에서 자주 등장하는 loc와 iloc의 개념, 차이점을 정리해보았다. loc = location 데이터프레임의 행이나 열에 label, boolean array(True, False)로 데이터에 접근 사람이 읽기 편한 라벨로 특정 값을 추출 loc 사용법 df.loc[행 인덱싱 값, 열 인덱싱 값] iloc = inter location 데이터프레임의 행이나 열의 순서를 나타내는 정수(int), 인덱스 값으로 특정값을 추출 정수(숫자)로 접근하기 때문에 컴퓨터가 읽기 좋은 방법 iloc 사용법 df.iloc[행 인덱스, 열 인덱스] loc와 iloc의 실행 방법 df.loc[0] -> 전체 데이터프레임에서 인덱스 이름이 0인 행만 추출 df.iloc[0] -> 전체 데이터프레임에서 0번째 행에 있는 값들만 추출

2022년 9월 22일
·
0개의 댓글
·
post-thumbnail

[Pandas] loc, iloc

loc이랑 iloc 헷갈린다. 반대로 기억하기도 하고. 나의 뇌 용량이 적은 것인가. 늘 느끼는 거지만 공부하고 정리해서 공유해주시는 분들께 정말 감사하다. [1] loc (=location) 데이터 프레임의 행이나 컬럼에 label이나 boolean array로 접근 인간이 읽을 수 있는 label 값으로 데이터에 접근 [2] iloc (=integer location) 데이터 프레임의 행이나 컬럼에 인덱스 값으로 데이터에 접근 컴퓨터가 읽을 수 있는 indexing 값으로 데이터에 접근 Reference 1) https://gagadi.tistory.com/16

2022년 6월 23일
·
0개의 댓글
·
post-thumbnail

Data Structure

리스트, 튜플 리스트와 튜플은 모두 여러 타입의 데이터를 담는 컨테이너형 변수 공통점 인덱싱과 슬라이싱 순회가능(iterable) for 문을 이용해 순회 가능 max, min 등의 순회 가능한 요소를 입력 받는 함수의 입력으로 사용 가능 차이점 리스트의 요소는 바꿀 수 있으나, 튜플의 요소는 바꿀 수 없음 리스트는 사전의 key로 사용할 수 없지만, 튜플은 사전의 key로 사용 가능 불변의 자료형(int, float, str etc.)만 사전의 key로 사용 가능 순회 속도는 리스트보다 튜플이 약간 더 빠름 따라서 요소를 변경할 필요가 없고, 요소에 대한 연산 결과만 필요한 경우 튜플이 더 적합 데이터가 큰 경우에 한해서, 리스트로 작업 후 튜플로 자료형을 바꾼 후 순회 리스트 관련 함수 >list.append(x) : x를 리스트 맨 뒤에

2022년 6월 20일
·
0개의 댓글
·
post-thumbnail

PANDAS : loc, iloc

LOC : 데이터프레임의 행(columns)과 열(rows)의 label 값, 즉 행과 열의 이름으로 접근 ILOC : 데이터프레임의 index값, 즉 slicing을 할 때의 위치를 기준으로 접근 dataframe 만들기 | | fruits | dessert | beverage | food | |--|--------|---------|----------|------| |0| banana |macaron| coffee |pizza| |1| strawberry| cake| beer |burger| |2| apple| donut| coke |pasta| 현재의 index값은 0,1,2. index 값을 바꾸고 싶을 땐, (데이터명).index = {(바꿀 index명)}으로 바꿔주기 LOC 알아보기 | beverage | food | |----------

2022년 4월 17일
·
0개의 댓글
·

[Aiffel] 아이펠 45일차 정리 및 회고

1. 정리 1) 오류 too many values to unpack (expected 2) for i, y in dict여서 오류 dict.item()로 바꿔서 해결 range step에서 float 사용 불가능 numpy.arange에서 사용 가능하므로 np를 쓰고 to_list() 하기 2) 참고 특정 열의 값 변경하기: apply 멀티인덱싱.. 풀어줄 때 reset_index() 사용, inplace=True 잊지 않기 df.loc[:,['NAME','GENDER']] loc[row, column] 순서로 써줌 열 이름을 사용해야함 df.iloc[:, 0:4] loc과 순서는 같음 숫자로 인덱싱 split() 할 땐 띄어쓰기까지 잘 보자. ','만 하면 데이터 누락된다. concat으로 합칠 때 axis=1 해야 옆으로 추가됨 2.

2022년 3월 10일
·
0개의 댓글
·
post-thumbnail

DataFrame-iloc를 활용하여 Column Drop

iloc를 활용한 Column Drop 데이터의 컬럼의 범위를 지정하여 drop 할 경우 iloc를 활용한다. 아래와 같이 iloc[:, 이후에 원하는 drop 하고자 하는 컬럼의 범위를 #:# 형식으로 지정하여 drop한다.

2022년 1월 3일
·
0개의 댓글
·
post-thumbnail

[pandas] 컬럼 범위 삭제 | drop | iloc | inplace

데이터 범위 삭제😫 : 컬럼을 잘못 추가했다. 그것도 40개나... 사건의 발단 df에 열을 추가하는데 리스트를 'month' 없이 추가 해서 다음과 같이 컬럼이 리스트만큼 추가 되었다. 데이터 중간에 1-10, 1-31 컬럼이 들어가게 되었다. drop을 이용하기로 했다. 근데 드롭을 범위로 삭제하는 법은 안배웠다.(안배우면 못하는 편) df.iloc 로 11:51 번째 인덱스 컬럼을 불러와보았다. 음 값이 맞군. 없애버릴 데이터가... 그 값을 drop 에 적용해 다시 원복 시켰다. 새로운 변수

2021년 12월 8일
·
0개의 댓글
·

seaborn, pandas indexing(보충)

복습 및 보충 seaborn hue를 사용하지 않고 color 지정 방법 : color : 'r' grid 삭제 : sns.set_style('ticks') pandas indexing df[], df.loc[], df.iloc[] 차이 : pandas tric 게시물 참고 위 내용들에 대해서 더 자세한 코드 및 설명들은 주제에 맞게 앞의 게시물들에 추가하였음.

2021년 3월 10일
·
0개의 댓글
·

데이터 셀렉션과 필터링

[]연산자 []연산자를 이용해서 데이터 셀렉션을 할 수 있다. [Output] numpy에서 공부했던 불린 인덱싱도 사용 가능하다. 정리해보면 DataFrame 바로 뒤의 [] 연산자는 넘파이의 []나 Series의 []와 다르다. DataFrame 바로 뒤의 [] 내 입력 값은 칼럼명을 지정해 칼럼 지정 연산에 사용하거나 불린 인덱스 용도로만 사용해야 한다. DataFrame[0:2] 같은 슬라이싱 연상으로 데이터를 추출하는 방법은 사용하지 않는 것이 좋다. DataFrame iloc[] 연산자 위치 기반 인덱싱만 허용하기 때문에 행과 열 값

2020년 12월 18일
·
0개의 댓글
·