'수원시' 가 포함된 문자열을 가진 시군구 열 데이터 프레임 출력
초과, 미만을 나타내는 '<', '>' 괄호 문자를 제거하기 위해 replace 함수를 적용부분 일치하는 다수의 문자열을 대체하기 위해 regex=True 파라미터를 추가한다.
python에서 파일을 불러올 때 인코딩 에러 발생인코딩 방식 중 하나를 추가적으로 입력하여 해결
object 데이터 타입의 컬럼 null값의 수를 확인하려고 할 때 발생한 에러
날짜 컬럼에서 strftime 메서드를 사용하여 년-월 데이터 컬럼을 생성할 때 발생한 오류참고
일자 + 시간 데이터를 datetime 형식으로 변환, 일자 컬럼 , 시간 컬럼으로 분리 datetime 형식으로 변환 to_datetime 일시 = 일자 / 시각 분리 dt.date / dt.time 시각에서 초(S) 정보 제외 strftime / appl
적용 전 > ### 적용 후
수치데이터를 불러올 때 단위 구분 기호로 ','콤마가 포함되어 숫자가 아닌 문자열로 인식→ replace 함수로 콤마 삭제 후 형변환이때, replace 함수 적용 시 .str 추가 입력세대수 Dtype object→ 변화 없음세대수 Dtype int32
딕셔너리로 지역코드 명 변환 output 지역코드 컬럼과 딕셔너리 맵핑 지역 주소 분할 및 데이터 프레임 생성 output > #### 행정동만 추출 output 시도 / 시군구 / 행정동별 분할
\[{'address_name': '제주특별자치도 제주시 용담삼동 2572-4', 'category_group_code': 'CE7', 'category_group_name': '카페', 'category_name': '음식점 > 카페 > 커피전문점 > 스타벅스'
월별 데이터 병합을 위해 월 컬럼 추가 가격 컬럼 추가 입력
품종 컬럼에 오타 천헤향 → 천혜향 으로 변경
xticks
주소지에 콤마로 나열된 주소를 행으로 추가하여 분리split 콤마로 분할하여 리스트 생성stack 으로 분리된 주소 리스트를 열로 이동
같은 시간대의 중복되는 값을 수정하기 위해 딕셔너리 적용
데이터프레임에서 월별 컬럼을 통해 계절 컬럼을 생성하기 위해 딕셔너리 생성, apply 함수를 통해 적용했을 때 발생해결방법 apply 함수에 적용할 데이터를 데이터프레임 형식으로 전달output
hue 옵션을 이용해 병합된 데이터를 histplot의 값으로 생성할 때 발생x 값을 입력해주면 됨참고
기존 데이터 프레임에 행 기준 리스트를 추가할 때ex)
배달 요청된 가게의 주소지 (라이더 픽업 주소) = 출발지주소25% - 9건 확인
g.fig.set_size_inches(11,5)
주소지에서 행정동을 분리한 뒤, 나머지 주소를 한 컬럼에 할당하도록 작성 split으로 띄어쓰기를 기준으로 행정동과 나머지 주소를 분리한다. → 띄어쓰기 기준으로 모두 분리시켰기 때문에 나머지 상세주소는 값이 콤마로 분리되어 리스트로 할당된다. join으로 분리된
dropna에서 subset으로 drop 여부를 결정할 컬럼을 설정한 뒤 how 설정 여부 차이설정된 컬럼에서 결측치가 하나만 있어도 삭제된다.지정된 컬럼에서 모두 결측지에 해당되는 경우에만 삭제한다.
소요시간을 구한 뒤, 데이터를 확인해보니 timedelta 형식의 데이터가 생성되었다. days 데이터를 제거하고 '분' 데이터만 가져오기 위해 dt.seconds를 이용하여 분 데이터로 변환하였다. 참고
엑셀 시트별 월 수를 데이터프레임 자체 연산을 시도했을 때 발생원인 : 데이터프레임에서 index 이름이 달라서 발생한 문제month_total생성한 데이터프레임에 index의 이름을 생성한다. \---> 결과로 NaN값 출력됨해당 시트의 월별 count값을 확인해보니
loc : 범례 위치, mode : 범례 목록을 가로로 확장ncol : 한 row마다 가로로 나열할 범례 수참고modetext_colortight_layout
제주도 행정구역 경계 데이터제주도 제세동기 설치현황 데이터→ 총 527개의 심제세동기가 설치되어 있음을 확인위도 경도의 데이터 형태가 object 이므로 float형으로 형변환데이터가 없는 지역은 지도에서 검은 배경으로 출력됨제세동기 설치 데이터에서 해당되는 법정동의
ax의 표기 방식을 변경한다. x축 ax.xaxis.set_major_formattery축 ax.yaxis.set_major_formatter
법정동 정보가 포함된 생활인구 데이터에서 연령대와 성별 컬럼을 생성한 뒤 특정 지역의 연령대별, 성별 생활인구 분포를 확인
설문조사에서 각 질문별 응답 비율을 확인하기 위해 반복문으로 질문마다 만족도 항목의 합계를 데이터프레임으로 병합함매우 그렇다 - 1그렇다 - 2약간 그렇다 - 3보통이다 - 4약간 아니다 - 5아니다 - 6전혀 아니다 - 7각 컬럼이 설문조사의 질문명이며, 만족도 조사
컬럼명이 아닌 컬럼의 iloc으로 drop할 대상을 명시하여 설정하는 방법 KeyError 위의 코드를 실행했을 때는 KeyError가 발생, 그래서 삭제하고자 하는 부분을 데이터 프레임으로 생성한 뒤 확인했다. iloc으로 특정 열을 데이터프레임으로 변환한 값
카카오 api로 주소의 위도 경도 데이터를 생성하는 코드를 실행시켰을 때 발생내용을 살펴봤을 때, 수집된 위도 경도의 길이와 입력한 데이터프레임의 길이가 달라서 발생 → 위도 경도 데이터가 추출되지 못한 주소가 있어 실제 담긴 리스트의 길이가 다른 것으로 추측되어 코드
initial = 초기 학습 범위period = 학습 간격 (~마다)horizon = 예측 범위→ 2년치 데이터 학습, 180일마다 1년치의 값을 예측한다.교차 검증 중에 사용할 컷오프 날짜 벡터입니다. 입력하지 않는 경우 (끝-horizon)에서 시작하는 작업은 초기
circle map