하이퍼파라미터 최적화 (Hyperparameter Optimization)

Ryu Jihoon·2024년 9월 24일

부스트캠프 AI Tech RecSys

목록 보기

19/27

하이퍼파라미터 최적화 (Hyperparameter Optimization)

1. 하이퍼파라미터란?

하이퍼파라미터는 모델 학습 전에 사용자가 직접 설정해야 하는 값들입니다.
하이퍼파라미터는 모델 성능에 큰 영향을 미치며, 최적의 값을 설정해야 과적합이나 과소적합을 방지하고 일반화 성능을 최대화할 수 있습니다.

주요 하이퍼파라미터 예시

Learning rate(학습률): 가중치를 업데이트하는 속도를 결정합니다.
Number of estimators: 앙상블 모델에서 사용하는 학습기의 개수를 결정합니다.
Regularization parameters(정규화 파라미터): 모델이 과적합되는 것을 방지하는 파라미터입니다.

2. 하이퍼파라미터 최적화 방법

2.1. Grid Search

Grid Search는 사전 정의된 하이퍼파라미터 값의 모든 조합을 시험하는 방법입니다.
여러 하이퍼파라미터 값들의 조합을 시도하여 최적의 성능을 발휘하는 조합을 찾습니다.

장점:

모든 가능한 조합을 탐색하므로 최적의 조합을 찾을 확률이 높습니다.

단점:

계산 비용이 매우 높고 시간이 오래 걸릴 수 있습니다.

from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import RandomForestClassifier

# 하이퍼파라미터 그리드 정의
param_grid = {
    'n_estimators': [50, 100, 200],
    'max_depth': [10, 20, 30],
    'min_samples_split': [2, 5, 10]
}

# GridSearchCV를 사용하여 최적의 하이퍼파라미터 탐색
grid_search = GridSearchCV(estimator=RandomForestClassifier(), param_grid=param_grid, cv=5)
grid_search.fit(X_train, y_train)

# 최적의 파라미터 출력
print(grid_search.best_params_)

2.2. Random Search

Random Search는 하이퍼파라미터 공간에서 임의로 조합을 선택하여 최적의 하이퍼파라미터를 찾습니다.
Grid Search처럼 모든 조합을 시도하지 않고, 지정된 수만큼 랜덤하게 탐색합니다.

장점:

Grid Search보다 계산 비용이 낮고, 더 효율적입니다.
적은 탐색으로도 좋은 결과를 얻을 가능성이 큽니다.

단점:

최적의 조합을 찾지 못할 가능성이 있습니다.

from sklearn.model_selection import RandomizedSearchCV
from sklearn.ensemble import RandomForestClassifier

# 하이퍼파라미터 범위 정의
param_dist = {
    'n_estimators': [50, 100, 200],
    'max_depth': [10, 20, 30],
    'min_samples_split': [2, 5, 10]
}

# RandomizedSearchCV를 사용하여 최적의 하이퍼파라미터 탐색
random_search = RandomizedSearchCV(estimator=RandomForestClassifier(), param_distributions=param_dist, n_iter=10, cv=5)
random_search.fit(X_train, y_train)

# 최적의 파라미터 출력
print(random_search.best_params_)

2.3. Bayesian Optimization

Bayesian Optimization은 이전 탐색 결과를 바탕으로, 후속 탐색을 효율적으로 수행하는 기법입니다.
확률 모델을 사용하여 유망한 영역을 집중적으로 탐색하므로, 적은 시도로 최적의 결과를 찾을 수 있습니다.

장점:

적은 시도로도 효율적인 탐색이 가능합니다.

단점:

구현이 복잡하고, 초기 탐색 과정에서 시간이 필요합니다.

2.4. Genetic Algorithms (유전 알고리즘)

유전 알고리즘은 자연 선택 과정에서 영감을 얻은 최적화 기법으로, 세대별로 하이퍼파라미터 공간을 탐색해 점차 최적의 조합에 수렴합니다.
돌연변이와 교배 개념을 사용하여 새로운 하이퍼파라미터 조합을 생성합니다.

장점:

매우 큰 하이퍼파라미터 공간에서 유용합니다.

단점:

탐색에 시간이 오래 걸릴 수 있습니다.

3. 하이퍼파라미터 최적화 전략 요약

방법	장점	단점
Grid Search	모든 조합을 시도하여 최적의 조합을 찾을 확률이 높음	계산 비용이 매우 큼, 비효율적일 수 있음
Random Search	계산 비용이 낮고 효율적	최적의 조합을 찾지 못할 수 있음
Bayesian Optimization	적은 탐색으로 효율적인 결과를 얻을 수 있음	구현이 복잡하고 초기 탐색 과정이 필요함
Genetic Algorithm	매우 큰 하이퍼파라미터 공간에서 유용	탐색에 시간이 오래 걸릴 수 있음

4. 요약

하이퍼파라미터 최적화는 모델 성능을 향상시키기 위해 중요한 과정입니다. Grid Search와 Random Search는 기본적인 최적화 방법이며, 더 나은 성능과 효율성을 원한다면 Bayesian Optimization이나 유전 알고리즘을 사용할 수 있습니다.

Ryu Jihoon

CSE Junior

이전 포스트

교차검증 앙상블 (Cross-Validation Ensemble) & 스태킹 앙상블 (Stacking Ensemble)

다음 포스트

하이퍼파라미터 최적화 (Hyperparameter Optimization)

부스트캠프 AI Tech RecSys

하이퍼파라미터 최적화 (Hyperparameter Optimization)

1. 하이퍼파라미터란?

주요 하이퍼파라미터 예시

2. 하이퍼파라미터 최적화 방법

2.1. Grid Search

2.2. Random Search

2.3. Bayesian Optimization

2.4. Genetic Algorithms (유전 알고리즘)

3. 하이퍼파라미터 최적화 전략 요약

4. 요약

교차검증 앙상블 (Cross-Validation Ensemble) & 스태킹 앙상블 (Stacking Ensemble)

선형 회귀의 가정 - 잔차의 정규성

0개의 댓글

하이퍼파라미터 최적화 (Hyperparameter Optimization)

부스트캠프 AI Tech RecSys

하이퍼파라미터 최적화 (Hyperparameter Optimization)

1. 하이퍼파라미터란?

주요 하이퍼파라미터 예시

2. 하이퍼파라미터 최적화 방법

2.1. Grid Search

2.2. Random Search

2.3. Bayesian Optimization

2.4. Genetic Algorithms (유전 알고리즘)

3. 하이퍼파라미터 최적화 전략 요약

4. 요약

교차검증 앙상블 (Cross-Validation Ensemble) & 스태킹 앙상블 (Stacking Ensemble)

선형 회귀의 가정 - ­잔차의 정규성

0개의 댓글

선형 회귀의 가정 - 잔차의 정규성