profile
효율적인 걸 좋아해요
post-thumbnail

[Big query] 사용 함수

DATEDATETIMETIMESTAMPSELECT \* EXCEPT(column_name)FROM olist.olist_orderSELECT REPLACE(column_name 10000 AS column_name)FROM olist.olist_orderCAST(v

2024년 3월 9일
·
0개의 댓글
·

[Python] 실무 필수 문법

실무 필수 문법

2024년 2월 29일
·
0개의 댓글
·
post-thumbnail

[Python] Visualization

import numpy as npdf2 = df.Fare.sort_values(ascending = False)binsVal = np.arange(0,600,10)binsValplt.hist(df3, bins = binsVal)plt.xlabel('Fare')plt.y

2024년 2월 25일
·
0개의 댓글
·

[Python] pivot, concat, merge

pivot과 pivot_table은 두 함수 모두 데이터프레임을 재구성하여 새로운 데이터프레임을 생성하는데 사용되지만, 그들 사이에는 몇 가지 중요한 차이점이 있습니다.1\. 기능 차이: pivot 함수는 단순히 데이터프레임을 재구성하는 기능만 제공합니다. 반면, pi

2024년 2월 23일
·
0개의 댓글
·
post-thumbnail

[통계] 회귀분석 (2)

종속변수에 대한 독립변수들의 단위(scaling)을 통일시긴 계수 모든 독립변수를 같은 단위로 상정하고 비교 가능 원점(0,0)을 지나가 절편이 "0"임 해석이 어렵다 여러 독립변수의 상대적 중요도를 비교 가능 표준화 계수의 크기는 별도의 테스트를 해서 크다/작

2024년 2월 23일
·
0개의 댓글
·
post-thumbnail

[Python] time series

df.Yr_Mo_Dy = pd.to_datetime(df.Yr_Mo_Dy)Ans = df.Yr_Mo_DyAns = df.Yr_Mo_Dy.dt.year.unique()datetime.date(year, x.month, x.day)는 Python의 내장 모듈인 dateti

2024년 2월 22일
·
0개의 댓글
·

[Python] apply, map

선택된 income_category 값을 x로하여 매핑하라values_counts 개수세기sort_index 인덱스로 내림차순 정렬df'newEduLevel' = df.Education_Level.map(lambda x : if 'Graduate' in x else

2024년 2월 22일
·
0개의 댓글
·
post-thumbnail

[Python] Grouping

df.groupby('host_name').size()df.host_name.value_counts().sort_index()두가지 방법이 있다. groupby size 는 null 값도 세고value counts 는 null 값 제외df.host_name.value_

2024년 2월 22일
·
0개의 댓글
·

[Python] filtering & Sorting

loc와 iloc은 둘 다 pandas 데이터프레임에서 행이나 열을 선택하는데 사용되는 함수입니다. 그러나 두 함수는 서로 다른 방식으로 데이터를 선택합니다.loc: 라벨 기반의 데이터 선택 방식을 사용합니다. 즉, 행과 열의 라벨(이름)을 기준으로 데이터를 선택합니다

2024년 2월 22일
·
0개의 댓글
·
post-thumbnail

[통계] 회귀분석 (1)

회귀(Regression)이란 말은 어딘가로 돌아간다는 의미어디로 돌아가는걸까?주어진 독립변수로 종속변수를 예측하기 위해단순 회귀(Simple regression)독립변수 1개 / 종속변수 1개다중 회귀(Multiple regression)독립변수 2개 이상 / 종속변

2024년 2월 20일
·
0개의 댓글
·
post-thumbnail

[통계] 카이제곱 검정

t-test anova 같은 경우 연속형 종속변수, 명목척도(범주형) 독립변수만약 둘다 명목 척도라면? t-test,m ANOVA 못씀이때 사용하는 것이 교차분석변수가 명목척도 일 때,자료의 값은 개수여야함.앞의 t-test나 ANOVA의 경우 둘/셋 이상의 집단의 같

2024년 2월 20일
·
0개의 댓글
·
post-thumbnail

[Git] branch / tag / readme

branch merge / conflict / tag / readme

2024년 2월 17일
·
0개의 댓글
·

[Git] PUSH / PULL

중요한건 origin 을 넣어서 등록git remote add origin <remote_repo_url>git remote rename <기존 이름> <변경 이름>git remote set-url <기존 url> <변경 url>git rem

2024년 2월 16일
·
0개의 댓글
·

[Git] 3. 파일등록/수정/삭제

파일 만들기 add -> staged 상태 만들기 commit -> commit 보내기 git * add 는 조심하자! 쓰레기도 다올라감 파일 내용 바꿔쓰기 저장은 컨트롤 + D 파일 옮기기 mv log 보기

2024년 2월 16일
·
0개의 댓글
·
post-thumbnail

[Git] 2. 기본 사용

폴더 안으로 들어가서 해야함(.git 이 생김)반복 로그인을 줄이기 위해 토큰을 넣어줘야함local과 remote는 수시로 데이터를 주고 받음git clone http://token \~\~~@github.com/jjyinsight/test_project2.g

2024년 2월 16일
·
0개의 댓글
·
post-thumbnail

[Git] 1. VCS(version control system)

데이터가 날라가거나,협업하거나,이전 파일이 필요하거나, but, 소스코드 보안이 중요한 경우 사용을 기피함.협업이 가능해짐commit 하는 순간 배포되어 다수에게 버그 유발 가능인터넷 안되면 작업 불가자신만의 version history 가질 수 없음

2024년 2월 13일
·
0개의 댓글
·
post-thumbnail

[Sample project 3] BANK_demand forcasting and target marketing

sample project 3

2024년 2월 13일
·
0개의 댓글
·
post-thumbnail

[통계] One-way ANOVA (3) F-value와 사후검정

적어도 한 그룹의 평균은 다르다(NOT ALL means are equal)셋 중 한 그룹의 평균이 다르다는 것 뿐이다.One-way ANOVA 결과만으로는 어떤 그룹이 어떻게 다른지 알 수 없음그러므로, 유의하다는 결과가 나오면 자동으로 사후검정을 해야함일종의 여러

2024년 2월 10일
·
0개의 댓글
·
post-thumbnail

[R] One-way ANOVA 실습

통계를 하다 실습이 나와서 R을 이용해 ANOVA 분석을 해봤다.

2024년 2월 10일
·
0개의 댓글
·
post-thumbnail

[통계] One-way ANOVA (2) F-value

F-value 분산 분석

2024년 2월 10일
·
0개의 댓글
·