데이터 정제 먼저, total_bedrooms 특성에 값이 없는 경우가 있는데, 이를 수정해보자. 방법에는 다음과 같이 세 가지가 있다. > 1. 해당 구역을 제거하기 > 2. 전체 특성을 삭제하기 > 3. 대체 : 누락된 값을 어떤 값으로 채우기 판다스의 dropana(), drop(), fillna() 메서드로 이런 작업을 간단하게 처리할 수 있다...
2장이 지나치게 길어지고 있다. 사실 분량이 많은 것도 맞기는 하다... 최대한 빨리 마무리하고 뒷내용으로 넘어가도록... 노력하겠다. 상관관계 조사하기 모든 특성 간의 표준 상관계수를 corr() 메서드를 사용해 쉽게 계산할 수 있다. 상관관계의 범위는 -1부터 1까지로, 1에 가까우면 강한 양의 상관관계, -1에 가까우면 강한 음의 상관관계를 가진...
사이킷런의 sklearn.model_selection 패키지 안에는 여러 가지 분할기 클래스를 제공한다. 모든 분할기는 또한 훈련과 테스트 분할에 대한 반복자를 반환하는 split() 메소드를 가지고 있다. 이 코드에서는 StratifiedShuffleSplit을 사용해 10개의 다른 계층 분할을 생성한다. 첫 번째 분할을 다음과 같이 사용할 수 있다....
describe 메서드는 숫자형 특성의 요약 정보를 보여준다. hist() 메서드는 모든 숫자형 형태에 대한 히스토그램을 출력할 수 있다. 이를 통해 알 수 있는 사실은 다음과 같다. 중간 소득이 US 달러로 표시되어 있지 않다. 따라서, 그 단위를 통일하는 것이 필요하다. 중간 주택 연도와 중간 주택 가격 그래프의 오른쪽 값이 심하게 높아지면서 그래프...

2장에서는 캘리포니아 주택 가격 데이터셋을 활용해 머신러닝 프로젝트를 처음부터 끝까지 직접 진행해보면서 배우는 것을 목표로 한다. 큰 그림 보기 문제 정의 풀고자 하는 문제가 무엇인지 먼저 정의하는 것이 필요함. 그렇게 하여 문제 상황을 정확히 파악하고, 해당 문제에 적합한 시스템을 설계하게 됨. 지금 문제는 레이블된 훈련 샘플이 있고, 여러 특성을 ...
1장 - 한눈에 보는 머신러닝 머신러닝이란? 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야 훈련 세트 : 시스템이 학습하는 데 사용하는 샘플 훈련 사례 (샘플) : 각각의 훈련 데이터 모델 : 학습하고 예측을 만드는 부분 정확도 : 성능 측정 지표 중 하나, 분류 작업에 많이 사용됨 머신러닝을 사용하는 이유 기존의 프로그...
클로저와 데코레이터 클로저란? 함수 안에 내부 함수를 구현하고 그 내부 함수를 리턴하는 함수 ex) 클래스를 통한 구현 (클로저 X) mul3 = Mul(3)에서 생성자를 통해 함수 내부의 m이 3으로 지정. mul3(10)을 통해 call 메소드가 호출됨. ex) 함수 안에 함수를 구현하는 방법 (클로저) 위와 같은 기능을 구현하고 있지만, 함...
클래스 (Class) 클래스는 자료형을 직접 만들 수 있는 도구다. 파이썬은 기본적으로 int, str 같은 자료형을 제공하지만, 사용자가 직접 자료형(클래스)을 정의할 수 있다. 클래스 정의하기 예시: 객체 생성하기 클래스 내부 함수 (메서드) 정의 생성자 (init) 이해하기 객체가 생성될 때 자동 호출되어 초기값을 설정함. self의 의...

함수 파이썬 함수의 구조 파이썬 함수의 구조는 다음과 같다. C, Java와 같은 언어처럼 리턴값과 매개변수의 타입을 명시하지 않아도 된다. 여러 개의 입력값을 받는 함수 만들기 매개변수 이름 앞에 *를 붙이면 입력값을 모두 모아 튜플로 만들어준다. *가 붙은 매개변수만 함수의 인자로 사용할 수 있는 것은 아니다. 다음과 같은 형태로도 사용할 수...
조건문 (if 문) if 문은 조건에 따라 실행 흐름을 제어하는 구문이다. 기본 구조 if 조건문: 실행할 문장1 실행할 문장2 조건문이 참(True)이면 들여쓴 문장들이 실행됨 들여쓰기는 공백 4칸 또는 Tab으로 통일해야 함 예시 money = True if money: print(“택시를 타고 가라”) # 출력됨 if ~ else 문 ...
크게 어려운 문제를 풀려고 시작한 건 아니고... 문제를 많이 풀어보면서 파이썬 문법과 친해지려는 목적이 가장 크다. 그래서 문제도 알고리즘보다는 단순 구현에 집중된 문제를 주로 보려고 하고, 이 글에서도 파이썬의 어떤 요소를 사용해서 문제를 해결했는지를 설명하고자 한다. 그러면 시작 1920 - 수 찾기 수 찾기 뭐 다양한 방법이 있을 수 있을 ...
개요 파이썬에는 다음과 같은 자료형이 존재한다. 숫자형 문자열 리스트 튜플 딕셔너리 집합 불 여기서는 각각의 자료형에 대해서 설명한다. 숫자형 숫자형에는 다음과 같은 종류가 존재한다. 정수형 실수형 : 다음과 같은 표현이 가능하다. 8진수와 16진수 : 각각 다음과 같이 표현한다. 이러한 숫자형 자료형을 연산자를 통해 연산 가능하다. 연산자는...

저번 학기에 이어 이번 학기도 캡스톤디자인과창업프로젝트 과목을 수강하고 있다. 현재 우리 팀의 연구는 끝났지만, 연구 과정에서 사용한 툴 한 가지를 소개하고자 한다. 바로 Oputna이다. Optuna란? 공식 사이트 Optuna는 최적화된 하이퍼파라미터를 찾아주는

저는 이번 학기 캡스톤디자인을 통해 멀티모달 환경에서의 연합학습이라는 주제로 연구를 진행하고 있습니다.연구에 도움이 될 만한 다른 연구를 찾아보는 중, fine-tuning을 위해서 엄청난 연산이 필요한 대규모 pre-trained 모델을 제한된 리소스로 학습을 진행해
7장 - 복수의 테이블 다루기 집합 연산 MySQL에서는 각 테이블을 집합, 그리고 그 안의 데이터 하나하나를 집합의 원소로 간주할 수 있다. 따라서 집합 연산을 통해 두 테이블 간의 연관관계를 이용하여 원하는 데이터를 추출하는 것이 가능하다. UNION 합집합을 구하기 위해서는 UNION 연산자를 사용한다. 예를 들어서, a 테이블과 b 테이블에서 합...