profile
학습기록
post-thumbnail

엑셀 내 특정 조건의 텍스트 파이썬으로 일괄추출

엑셀파일 작업 중 몇백개의 괄호 안 텍스트를 뽑아내야 할 일이 생겼다. 이 것을 일일히 작업하기에는 불합리적이었고, 뭔가 자동화를 하고 싶은 마음이 들었다. 파이썬을 통하여 원하는 텍스트들을 뽑아보자

약 7시간 전
·
0개의 댓글
·
post-thumbnail

네이버 블로그 파이썬을 통하여 웹 크롤링하기

만들게 된 계기 빌딩 구내식당 메뉴를 매일 받아보는 취지로 만들어보았다 해당 식당의 메뉴가 블로그 글을 매일 수정하는 방식으로 알려주기 때문에 전에 배웠던 웹크롤링을 어렵지 않게 사용할 수 있을 것 같은 느낌에 바로 도전 web crawling이란? >crawli

2022년 5월 6일
·
0개의 댓글
·
post-thumbnail

파이썬 프롬포트 활용

변수 _ 대화형 모드에서는, 마지막에 인쇄된 표현식은 변수 _ 에 대입됩니다. 이것은 파이썬을 탁상용 계산기로 사용할 때, 계산을 이어 가기가 좀 더 쉬워짐을 의미합니다. 예를 들어: 이 변수는 사용자로서는 읽기만 가능한 것처럼 취급되어야 합니다. 값을 직접 대입하지

2022년 4월 27일
·
0개의 댓글
·
post-thumbnail

데이터 레이크

데이터 레이크는 대규모의 다양한 원시 데이터 세트를 기본 형식으로 저장하는 데이터 리포지토리 유형입니다.

2022년 4월 26일
·
0개의 댓글
·
post-thumbnail

ETL / ELT 특성 및 차이점

E / T / L 각각 의미하는 바

2022년 4월 22일
·
0개의 댓글
·
post-thumbnail

베이지안(베이즈) 정리, 유도

$$P(H|E) = \\frac {P(E|H)P(H)} {P(E)}$$H(Hypothesis) : 가설, 어떤 사건이 발생하였다는 주장E(Evidence) : 새로운 정보P(H) : 어떤 사건이 발생하였다는 주장의 신뢰도P(H|E) : 새로운 정보를 받은 후 갱신된 신

2022년 3월 18일
·
0개의 댓글
·
post-thumbnail

회귀(Regression)

데이터를 가장 잘 설명하는 함수를 설정하여 입력값에 따른 결과값을 예측$$Y \\approx \\beta_0 + \\beta_1X$$$적절한 \\beta_0 \\; 과 \\; \\beta_1 를 \\; 찾기$loss function이 최소로 만드는 beta값을 만들기

2022년 3월 16일
·
0개의 댓글
·
post-thumbnail

결측치 취급

데이터를 다롤 때 비어있는 데이터시트가 있는 경우가 있다, 이 때 상황에 맞게 결측치를 대체하거나 혹은 삭제하여 분석을 진행한다

2021년 7월 26일
·
0개의 댓글
·
post-thumbnail

Cross-tabulation(교차분석) in Python

data를 chart를 통해 시각화 할 때, 혹은 정규화를 할 때 등서로 다른 두 가지 범주형 변수의 관계를 분석할 때 교차분석을 이용하게 된다https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas

2021년 7월 14일
·
0개의 댓글
·
post-thumbnail

형변환 (python)

데이터 분석을 위하여 작업하기 좋기 위하여 전처리가 필요하다raw data를 가져오다보면 "5,562" 와 같은 문자열 형태로 저장된 데이터가 존재하다이를 자료형을 변환하려고 해도 쉼표","가 존재하여 곤란한 경우가 있다아래와 같은 솔루션으로 이를 해결해보자

2021년 7월 14일
·
0개의 댓글
·
post-thumbnail

EDA(Exploratory Data Analysis)

pandas는 데이터 조작 및 분석을 위해 Python 프로그래밍 언어로 작성된 소프트웨어 라이브러리입니다. 특히 숫자 테이블과 시계열을 조작하기위한 데이터 구조와 연산을 제공합니다. 3-Clause BSD License에 따라 출시 된 무료 소프트웨어입니다.위 코드

2021년 7월 12일
·
0개의 댓글
·