post-thumbnail

머신러닝 스태킹 앙상블 첫 시도

모든 피처 시각화 다 띄움산점도+회귀선 분석이 아주 직관적이라 마음에 들었다베이스모델 LGB 빠르고 데이터 안 가리고 좋음이상치 제거, 피처 엔지니어링 하나씩 넣어보면서 결정다른 모델은 다를 수도있지 않나? 맞지만 하나만 고른다면 최선선형 모델은 워낙 빨라서 베이스라인

2026년 1월 3일
·
0개의 댓글
·
post-thumbnail

선형회귀와 헷지

선형회귀는 예측만을 위한 도구가 아니라구조 파악의 도구로도 활용할 수 있다.y = a + bx + e절편a, 기울기b 의미는? 주식과 헷지에 대한 예시로 알아보자.b는 설명변수

2025년 12월 18일
·
0개의 댓글
·

머신러닝을 위한 데이터 전처리

1. 데이터 클리닝 -> 모델 학습에 방해가 되는 요소를 제거하거나 수정하여 데이터 품질을 올린다. 2. 데이터 트랜스포메이션 -> 데이터를 알고리즘이 다루기 좋은 형태/분포로 바꾼다. 3. 피처 엔지니어링 -> 모델 학습 성능을 높일 수 있는 새로운 변수를 만들어낸다. 내가 사용하려고 만든 작업 플로우는 아래와 같다. ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ...

2025년 12월 18일
·
0개의 댓글
·

SQL 을 조금 더 알아보자

** SELECT 와 별칭의 범위 GROUP BY 작동 원리 GROUP BY 와 SELECT HAVING 이 존재하는 이유 JOIN 의 실제 작동 원리 ## 1. SELECT 와 별칭의 범위 지난 글에서 SQL의 실제 작동 순서를 알아보았다 실제로는 SELECT의

2025년 12월 18일
·
0개의 댓글
·

SQL 공부를 시작할 때 반드시 알아야할 것

이 글을 누른 독자는 SQL을 학습하다 막혀서 검색한 사람일 것으로 가정하고 작성한다. 어떤 목적으로 SQL을 학습하는지는 모르지만 반드시 알아야할 것이 있다. 지금 SQL을 배우는 곳에서 분명히 예약어를 하나씩 알려줄 건데 그렇게 배우면 지식이 파편화돼서 힘들어지는

2025년 12월 18일
·
0개의 댓글
·