[반도체 제조공정 순서]
- 실리콘 잉곳(Ingot)에서 얻은 원형의 웨이퍼(Wafer)에서 시작해
- FAB(Fabrication) 공정에서 반도체 회로 형성
- 프로브 테스트(Probe Test) 및 패키지 테스트(Package Task) 공정에서 특성을 테스트하여 정상인지 판단
- 패키지 조립(Package Assembly)은 프로브 테스트를 통과한 웨이퍼에서 칩(Chip)단위로 외곽 표면을 형성하는 공정
- 패키지 테스트는 조립이 완료된 제품에 대해 조립 불량 및 잠재 불량을 최종 판정
[기존 연구들의 한계점]
1. 웨이퍼 빈 맵(Bin Map)에 군집화를 적용하여 칩 단위에서 불량의 종류를 식별하진 못함
- 보통 셀의 결점수인 FBC를 예측변수로, 단순한 2진 빈 맵이 독립변수로 사용됨
- 그래서 다양한 종류의 품질 문제를 모두 대표할 수 없었으며 원인 파악을 위한 관련 요인 판단에서 한계가 있었음
2. 또한 성능 평가에서 정확도(Accuracy)를 성능 척도로 사용함
- 이는 범주의 불균형이 극심한 반도체 데이터에서 성능의 왜곡을 가져올 수 있음
[제안하는 바]
1. 칩 단위의 반도체 품질을 예측하는 동시에 예측된 불량의 종류를 특성별로 나누어 식별하고 최종 품질의 예측 성능 또한 향상시킴
2. 다양한 특성으로 구성된 데이터를 활용하여 불량의 종류를 특성별로 나누고 품질 예측함
- 이를 위해 발생 불량에 군집화를 진행하고 특성별로 군집화된 불량을 사용하여 품질 예측 모델 구축함
3. ROC의 AUC(Area Under the ROC Curve)를 척도로 하여 결과 비교
- 추가로 현업의 현실적인 특이도 범위에서 민감도 향상을 확인하기 위해, Partial AUC를 통해 결과 비교
(+) SMOTE(Synthetic Minority Over-Sampling Technique)기법을 통해 불균형 해결함
(+) AIC(Akaike's entropic Information Criterion)를 척도로 단계적 변수선택(Step-wise Selection)기법을 사용하여 로지스틱회귀 예측 모델 구축함
(+) 10겹 교차 검증 (10-fold cross-validation)을 진행하여 성능 측정
'소수 범주의 복제에 따른 과적합을 줄이고 정보 소실의 위험성을 피하기 위해 SMOTE를 사용하여 불균형 문제를 해결'
'k-평균 군집화 기법과 자기조직화지도(Self-Organized Map) 군집화 기법을 사용함'
(1) k-평균 군집화
(2) 자기조직화지도 군집화
-> 데이터가 한 가지 종류의 불량으로 구성되었지만 2 혹은 3종류의 다른 특성을 보이는 불량들로 구성되어 있음
-> 군집 간 변수들의 다르게 형성된 통계치 특성을 통해 현업에서 불량의 종류를 구분, 불량 특성 분석의 단서로 활용할 수 있을 것임.
-> 군집화 적용 예측 모델이 평균적으로 약 3.75%p AUC가 개선됨
-> 10겹 교차 검증 결과를 Boxplot으로 나타낸 것임
-> 군집화 적용 예측 모델들이 전체적으로 약 3.75%p의 AUC 성능 향상이 있는 것을 가시적으로 확인 가능함.
-> 비군집 예측모델과 군집화 적용 예측 모델 간 p-value가 굉장히 작아 AUC 성능 차이가 유의하다고 할 수 있음.
-> 군집화를 적용한 방법들 내에서는 크게 유의하지 않았고, 과적합을 방지하기 위해 군집수는 2로 설정함.
-> 비군집 예측 모델 vs k=2인 k-평균 군집화 적용 예측 모델
-> 비군집 예측 모델 vs k=2인 k-평균 군집화 예측 모델의 특이도 허용 한도 100~70%내 성능인 Partial AUC를 ROC 커브상에 나타냄.
-> 특이도의 적용범위에 따라 성능차이가 있고 허용 한도 내에서 더 개선된 성능을 보임.
(+) 민감도를 높이기 위해 1종 오류의 허용 기준을 조건 없이 높게 가져갈 수 없는 반도체 제조의 현실적인 특성을 고려함
(+) 전체 특이도 범위의 AUC를 그대로 사용하지 않고 실제 허용되는 범위의 Partial AUC를 설정하는 것이 더 현실적으로 성능을 나타낸다고 할 수 있음
[향후 연구]
- 불량의 종류가 더욱 다양하고 보다 복잡도가 높은 공정 데이터에 대해서 더욱 다양한 군집수 결과가 나올 수 있음
- 사용된 머신러닝 기법들 외에 데이터의 특성을 여러 방향으로 분석하고 이에 맞는 추가 기법들을 탐색하여 보다 일반화된 연구를 수행할 필요가 있음.