n213

'NoneType' object is not subscriptable 원인 : df = df.drop으로 썼음 해결 : df.drop(i, axis=1, inplace=True) 이렇게 작성함 dropna 원하는 행은 꼭 subset=['컬럼명'] 중복제거

2022년 9월 9일
·
0개의 댓글
·

n213[정규화 회귀모델, 릿지,라쏘]

[] len(df)를 나눠주는 이유는 ..? Modeling 모델링에 필요한 두 가지 전처리 Scaling scaler = StandardScaler() Encoding One-Hot encoding 기준모델 : 평균이용 다중선형회귀 OLS

2022년 9월 8일
·
0개의 댓글
·

함수 찐 찐 정복

람다함수는 익명함수 def가 정상함수 lambda 넘겨줄 인자들 (arguments) : 표현식(expression)lambda 함수는 return구문을 사용하지 않는다.

2022년 9월 7일
·
0개의 댓글
·
post-thumbnail

n211, 기준모델, 선형회귀모델, 다항선형회귀, 회귀평가지표

링크텍스트(https://colab.research.google.com/github/codestates/ds-section2-sprint1/blob/main/n211-linear-regression/n211-Linear-regression.ipynb\[]kin

2022년 9월 7일
·
0개의 댓글
·

[Python] [Pandas]

링크텍스트제주 날씨,인구에 따른 교통량데이터 : 출처 제주 데이터 허브 DataUrl = ‘https://raw.githubusercontent.com/Datamanim/pandas/main/Jeju.csv’url = 'https://raw.githu

2022년 9월 1일
·
0개의 댓글
·

scatterplot

2022년 9월 1일
·
0개의 댓글
·

Unnamed: 0 삭제하는 방법

Unnamed: 0을 DataFrame에서 삭제하는 방법1\. index_col=0drop 사용링크텍스트

2022년 9월 1일
·
0개의 댓글
·
post-thumbnail

3주차 문제정리하기

barplot, 이산형 자료에 대해 범주별로 빈도나 합계 등을 비교하는 데에 유용하다.df\['total_bill','tip'].plot(kind='box')tmp = '12,578'을 정수 12578로 변환하는 코드 변환코드append 세로로만 결합가능 is th

2022년 9월 1일
·
0개의 댓글
·
post-thumbnail

sklearn

#traintestsplit(X,Y,test_size =0.25) 평가세트를 새로 만듦 (학습에 사용되지는 않음) 25%정도 학습 경사하강법 Y(정답) =WX(입력) + b(잔차) model.predict('X') 학습된 규칙과 모델을 활용해 새로운 입력에 대한 예측 값 제공 model.fit(X,Y) : 학습

2022년 8월 22일
·
0개의 댓글
·

[martix]

링크텍스트수 또는 변수를 ()안에 행과 열로 배열2차원 형태의 array 또는 list로 나타냄행과 열의 개수는 매트릭스의 차원을 의미 .shape을 통해 확인두 매트릭스 일치 = 차원과 성분이 동일해야 함. 배열의 차원 확인벡터의 차원 확인 콤마 앞의 수는 벡터의 차

2022년 8월 17일
·
0개의 댓글
·
post-thumbnail

[vector]

x,y 화살표 밑면의 좌표dx, dy : x 및 y 방향을 따른 화살표의 길이 https://matplotlib.org/stable/api/\_as_gen/matplotlib.pyplot.arrow.html벡터의 실수배 연산을 벡터에 스칼라를 곱한다.벡터 :

2022년 8월 17일
·
0개의 댓글
·

list와 array차이

List 데이터를 연속적인 공간에 저장 순서를 가지며 각 원소에 차례로 index가 할당됨 서로 다른 자료형을 원소로 가질 수 있음 수치적 연산은 불가능

2022년 8월 17일
·
0개의 댓글
·
post-thumbnail

벡터

하나의 숫자(실수)를 나타냅니다.변수에 저장하여 표기할 수 있습니다.양수, 음수 모두 가능합니다.$a = 5 \\quad b = 1.81 \\quad c=-3e \\quad d=\\pi$스칼라 : 크기벡터 : 크기 + 방향이 존재순서를 갖는 1차원 형태의 배열로 lis

2022년 8월 17일
·
0개의 댓글
·

[Python][Pandas] dataframe 시각화

Colab한글 깨짐 현상 해결 방법plot 데이터 집합을 도표, 그래프로 표시plot 함수는 kind라는 옵션으로 다양한 그래프 시각화 가능kind 옵션: line bar hist box pie scatter area빈도수를 알아볼 때 사용

2022년 8월 15일
·
0개의 댓글
·

[Python][Pandas] [apply, lambda, map]

구체적인 로직을 적용하고 싶을 경우로직이 정의된 함수를 만들고, apply() 함수에 대입df'컬럼명'=df'컬럼명'.apply(replace_zero)dfdf'컬럼명'=df'컬럼명'.apply(lamda x:50 if x ==0 else x)df'컬럼명1'+'컬럼명2

2022년 8월 15일
·
0개의 댓글
·

[Python][Pandas] 결측값, 중복값 처리 [isnull(), notnull(), dropna(), fillna(), reset_index(), duplicated(), drop_duplicates()]

결측값 : 자료에 누락된 값NaN, N/A, NULL, 0값 등 다양한 방식으로 존재 fillna('결측값을 대체할 값')value_counts() : 값을 세어주는 함수를 통해서 최빈값 알아냄결측치 처리 과정에서, 데이터 프레임의 인덱스가 바뀌는 현상 발생reset_

2022년 8월 15일
·
0개의 댓글
·

[Python][Pandas] [astype('')][pd.to_datetime['컬럼명']]

datetimepandas에서 날짜와 시간 데이터를 처리 하기 위해 지원하는 자료형datetime 자료형 변환 : 연산가능 Timestamp : 변환완료.dt : 슬라이싱 준비df'컬럼' + df'컬럼'df'컬럼' - df'컬럼'df'컬럼' \* df'컬럼'df'컬럼

2022년 8월 15일
·
0개의 댓글
·

[Python] [Pandas] 데이터 Slicing [loc, iloc사용, 인덱스 이름 변경.set_index(), isin()]

행 가져오기 (df'행 시작 인덱스' : '행 끝 인덱스')행 가져오기는 연속적으로 데이터를 불러옴 열은 '컬럼명'지정 행은'index'지정열 하나 가져오기 (df'컬럼명' or df.컬럼명)범위 설정 df\[df.columns시작인덱스 : 끝 인덱스]df.loc'행'

2022년 8월 15일
·
0개의 댓글
·

[Python] [pandas] Join, Merge, Contact : 데이터 합치기

join 4가지 방식'Inner Join' : 교집합'Left Join' : 왼쪽 전체'Right Join' : 오른쪽 전체'Outer Join' : 합집합df.set_index('columns 중에 하나 쓰기')pd.merge(df1, df2, on='컬럼', how

2022년 8월 14일
·
0개의 댓글
·

[Python] pivot table, groupby, get_group, agg 사용하기

pd.pivot_table(df, index='행 인덱스', columns = '열 인덱스' , values = '조회하고 싶은 값', aggfunc='집계 방식')aggfunc : 'mean' 'sum' 'count'df.groupby('그룹명','그룹명2')df.g

2022년 8월 14일
·
0개의 댓글
·