[Instant Gratification] Stacking & Solutions

김승혁·2024년 11월 20일

캐글

Solutions

NuSVC 모델
- NuSVC는 Support Vector Classification의 변형으로, 일반적인 SVM과 달리 nu라는 매개변수를 통해 서포트 벡터의 수와 학습 오류를 조절할 수 있습니다.
- 파라미터 설명:
  - probability: True로 설정하여 확률 추정치를 사용할 수 있게 합니다.
  - kernel: 'poly'로 설정하여 다항식 커널을 사용합니다.
  - degree: 커널 함수의 차수를 나타냅니다. 여기서는 4와 2로 설정되어 있습니다.
  - gamma: 'auto'로 설정하여 1/특성 수로 설정됩니다.
  - nu: 0.4로 설정되어 있으며, 이는 서포트 벡터의 비율을 의미합니다.
  - coef0: 다항식 커널에서의 상수 항입니다.
  - random_state: 모델의 재현성을 위해 난수 시드를 설정합니다.
Quadratic Discriminant Analysis
- QDA는 각 클래스가 동일한 공분산 행렬을 가진다고 가정하는 LDA와 달리, 각 클래스가 다른 공분산 행렬을 가질 수 있도록 합니다.
- 파라미터 설명:
  - reg_param: 정규화 매개변수로, 0.111로 설정되어 있습니다. 이는 모델의 복잡도를 조절합니다.
SVC 모델
- SVC는 Support Vector Classification으로, 고차원 공간에서 최적의 분리 초평면을 찾습니다.
- 파라미터 설명:
  - probability: True로 설정하여 확률 추정치를 사용할 수 있게 합니다.
  - kernel: 'poly'로 설정하여 다항식 커널을 사용합니다.
  - degree: 커널 함수의 차수를 나타냅니다. 여기서는 4로 설정되어 있습니다.
  - gamma: 'auto'로 설정하여 1/특성 수로 설정됩니다.
  - random_state: 모델의 재현성을 위해 난수 시드를 설정합니다.
K-최근접 이웃
- K-최근접 이웃(KNN)는 가장 가까운 K개의 데이터를 기반으로 클래스 레이블을 예측합니다.
- 파라미터 설명:
  - n_neighbors: 고려할 이웃의 수를 나타냅니다. 여기서는 16으로 설정되어 있습니다.
로지스틱 회귀
- 로지스틱 회귀는 이진 분류 문제에서 사용되는 회귀 분석 모델입니다.
- 파라미터 설명:
  - solver: 최적화 알고리즘을 지정합니다. 여기서는 'liblinear'로 설정되어 있습니다.
  - penalty: 규제 유형을 지정합니다. 여기서는 'li'로 설정되어 있습니다.
  - C: 규제 강도를 제어하는 매개변수입니다. 여기서는 0.05로 설정되어 있습니다.
  - random_state: 모델의 재현성을 위해 난수 시드를 설정합니다.

캐글에서 마크다운으로 문서 작성해놓으면 제대로 출력이 안 됨. 얼마 이따가 다시 수정하려고 보면 값이 깨져있음.

김승혁

열심히 사는 척

이전 포스트

Stacking

다음 포스트

[Instant Gratification] Stacking & Solutions

Solutions

Stacking

가우시안 믹스쳐 모델(GMM, Gaussian Mixture Model)

0개의 댓글