[Instant Gratification] Stacking & Solutions

김승혁·2024년 11월 20일

Solutions

  1. NuSVC 모델

    • NuSVC는 Support Vector Classification의 변형으로, 일반적인 SVM과 달리 nu라는 매개변수를 통해 서포트 벡터의 수와 학습 오류를 조절할 수 있습니다.
    • 파라미터 설명:
      • probability: True로 설정하여 확률 추정치를 사용할 수 있게 합니다.
      • kernel: 'poly'로 설정하여 다항식 커널을 사용합니다.
      • degree: 커널 함수의 차수를 나타냅니다. 여기서는 4와 2로 설정되어 있습니다.
      • gamma: 'auto'로 설정하여 1/특성 수로 설정됩니다.
      • nu: 0.4로 설정되어 있으며, 이는 서포트 벡터의 비율을 의미합니다.
      • coef0: 다항식 커널에서의 상수 항입니다.
      • random_state: 모델의 재현성을 위해 난수 시드를 설정합니다.
  2. Quadratic Discriminant Analysis

    • QDA는 각 클래스가 동일한 공분산 행렬을 가진다고 가정하는 LDA와 달리, 각 클래스가 다른 공분산 행렬을 가질 수 있도록 합니다.
    • 파라미터 설명:
      • reg_param: 정규화 매개변수로, 0.111로 설정되어 있습니다. 이는 모델의 복잡도를 조절합니다.
  3. SVC 모델

    • SVC는 Support Vector Classification으로, 고차원 공간에서 최적의 분리 초평면을 찾습니다.
    • 파라미터 설명:
      • probability: True로 설정하여 확률 추정치를 사용할 수 있게 합니다.
      • kernel: 'poly'로 설정하여 다항식 커널을 사용합니다.
      • degree: 커널 함수의 차수를 나타냅니다. 여기서는 4로 설정되어 있습니다.
      • gamma: 'auto'로 설정하여 1/특성 수로 설정됩니다.
      • random_state: 모델의 재현성을 위해 난수 시드를 설정합니다.
  4. K-최근접 이웃

    • K-최근접 이웃(KNN)는 가장 가까운 K개의 데이터를 기반으로 클래스 레이블을 예측합니다.
    • 파라미터 설명:
      • n_neighbors: 고려할 이웃의 수를 나타냅니다. 여기서는 16으로 설정되어 있습니다.
  5. 로지스틱 회귀

    • 로지스틱 회귀는 이진 분류 문제에서 사용되는 회귀 분석 모델입니다.
    • 파라미터 설명:
      • solver: 최적화 알고리즘을 지정합니다. 여기서는 'liblinear'로 설정되어 있습니다.
      • penalty: 규제 유형을 지정합니다. 여기서는 'li'로 설정되어 있습니다.
      • C: 규제 강도를 제어하는 매개변수입니다. 여기서는 0.05로 설정되어 있습니다.
      • random_state: 모델의 재현성을 위해 난수 시드를 설정합니다.

캐글에서 마크다운으로 문서 작성해놓으면 제대로 출력이 안 됨. 얼마 이따가 다시 수정하려고 보면 값이 깨져있음.

profile
열심히 사는 척

0개의 댓글