# CP949

7개의 포스트
post-thumbnail

[230206] 멋쟁이사자처럼 AI SCHOOL 8기 아파트 분양가격 데이터 EDA_박조은강사님' 복습

해당 포스팅의 내용은 '멋쟁이사자처럼 AI SCHOOL 박조은 강사님'의 수업을 토대로 작성되었습니다. 📝Today I learned 🚀 TIL 목차 🚀 > 사용한 라이브러리 > 데이터 불러오기 > 3-1. 기본 전처리 데이터 요약 결측치 확인 데이터 타입 변경 > 3-2. df_last 전처리 평당분양가격 구하기 규모구분을 전용면적 컬럼으로 변경 필요없는 컬럼 제거 > 3-3. df_first 전처리 melt 연도 월 분리 컬럼명 통일 데이터프레임 병합 > 집계 및 시각화 groupby로 데이터 집계 pivot table로 데이터 집계 - heatmap bar plot point plot box plot violin plot swarm plot 아파트 분양가격 데이터 EDA 1. 사용한 라이브러리 2. 데이터 불러오기

2023년 2월 6일
·
0개의 댓글
·

내일배움캠프 43일차

1. 오늘 내가 한 일! 프로젝트 시작! 오늘은 프로젝트 SA를 작성하고 오늘 하기로 정한 분량의 프로젝트를 성공하였다!!!너무나 감격😭😭✨ 2. 프로젝트 SA - DRF를 이용한 추천 서비스 시스템 프로젝트 [제주 모범음식점 추천서비스] [ERD] [API 설계] [팀원들 간의 약속] 토요일에 만나서 프로젝트 하기

2022년 11월 2일
·
0개의 댓글
·
post-thumbnail

Encoding

네트워크 공부를 하다보니, 인코딩이라는 것에 대해 제대로 이해할 필요가 있다고 생각했다. 왜 필요한지, 어떻게 사용하는지에 대해서 이해해보는 포스팅이다. ASCII ASCII American Standard Code for Information Interchange) 7 Bit로 하나의 문자 표현 128개의 문자 표현 가능 영어를 위한 인코딩 방식 한국어, 중국어, 일본어, 아랍와와 같은 다른 나라 언어 표현 불가 ANSI ANSI American National Standard Institute 7비트의 한계를 보완하기 위해 8비트 사용 256개의 문자표현 가능 0x00부터 0x7F까지는 ASCII와 동일 나머지 128개에 대해 다른 문자 표현 하지만 128개는

2022년 1월 31일
·
0개의 댓글
·
post-thumbnail

[Data Crawling] re ('cp949 codec can't encode character ... ') issue

요즘에 캡스톤 관련 작업으로 데이터 크롤링을 진행중인데, 크롤링 된 데이터를 csv파일로 쓰던 도중 아래와 같은 오류가 생겼다. 인코딩에 문제가 있는데... 찾아본 결과, Python3 부터는 ANSI 기준으로 작성된 파일만 핸들링 할 수 있다고 한다. 그리하여, 기존의 코드 f = open('path', 'w') 형식에 eoncoding 방식을 추가한다. -> f = open('path', 'w', encoding='UTF-8') 위와 같이 인코딩 방식을 정해주면 정상적으로 파일을 쓰거나 읽을 수 있다.

2021년 4월 2일
·
0개의 댓글
·

5-3.(1) FileEncoding

p.54 1. 한글인코딩 InputStreame객체는 파일의 인코딩 방시글 지정 가능 형식) new InputStreamReader(바이트기반 스트림 객체, 인코딩 방식); 2. 인코딩 방식 한글 인코딩 방식은 크게 UTF-8 & EUC-KR 두가지 원래 한글 윈도우는 CP949방식 사용 윈도우 개발한 마이크로소프트에서 EUC-KR로 확장하였기 때문에 MS949로 부름 CP949는 EUC-KR의 확장이며, 하위호환성 ANSI는 영어를 표기하기 위해 만든 코드 규격으로 자체에 한글이 없다가 나중에 EUC-KR(유닉스 계열), CP949(윈도우)이라는 식으로 한글이 포함됨. MS949 윈도우의 기본 한글 인코딩 방식(ANSI 계열) UTF-8 유니코드 UTF-8 인코딩 방식 영문자 및 숫자 : 1byte, 한글 : 3byte => 가변적 US-ASCII

2020년 9월 26일
·
0개의 댓글
·

EUC-KR(CP949)

EUC-KR은 한국 산업 표준으로 지정된 한국어 문자 집합으로 문자 하나를 표현하기 위해 2바이트를 사용합니다. 단, 아스키 코드 문자를 표현할 때는 1바이트를 사용하기 때문에 아스키 코드와 호환됩니다. EUC-KR은 모든 글자가 완성된 형태로만 존재하는 '완성형'코드입니다. 따라서 한글처럼 초성, 중성, 종성을 조합해 문자를 만들 수 없기 때문에 EUC-KR로 표현할 수 없는 한글이 일부 존재한다. 물론 EUC-KR로 표현할 수 없는 글자들은 일반적으로 잘 사용되지 않긴 한다. > CP949는 EUC-KR을 확장한 문자 집합으로 EUC-KR과 같은 문자열 인코딩이나, 더 많은 문자를 표현할 수 있습니다. 오늘날에는 EUC-KR로 표기하더라도 실제로는 CP949 문자 집합을 사용하는 경우가 많습니다. 영문자 'Hello'를 출력할 때는 아스키 코드와 동일하게 5바이트를 사용하지만 한글 '안녕하세요'를 출력하기 위해서는 10바이트를 사용한다. EUC-KR로 아스키 코드

2020년 9월 9일
·
0개의 댓글
·
post-thumbnail

Java - java.lang패키지

참고 p.181~ EqualsTest01.java EqualsTest02.java FileEncodingTest.java GetClassTest.java JavaLangBasic.java StringBufferTest.java StringTest01.java WrapperTest.java java.lang패키지 java프로그래밍에서 기본적으로 필요한 클래스들을 모아놓은 패키지이다. rt.jar - package - class String, Object, System... 1. Object Object클래스는 멤버변수없이 11개의 메서드로 되어 있다. 1) equals() 오버라이딩 하지 않고 쓸 때 EqualsTest01.java 참조변수가 가르키는 주소를 비교한다. 오버라이딩 하고 쓸 때 EqualsTest02.java 주소가 아닌 **해당 인스턴스가 가지고 있는 값

2020년 9월 2일
·
0개의 댓글
·