설비 고장의 위험도 평가예측 및 위험도 진단모델 복기 및 계획

현빈·2023년 6월 28일
0

KCC2023 포스터 발표도 성공적으로 마무리 했고 종강도 했고 이제 다시 초심으로 돌아와 3페이지짜리 학부생 논문을 확장시키고자 한다.

KCC에 제출한 논문의 전체적인 개요를 보면
1. MTTR, MTBF, 부위별 가중치를 바탕으로 risk_impact, risk_likehood 추출
2. risk_impact, risk_likehood 바탕으로 K-means 클러스터링으로 총 위험도 등급 6개 추출
3. 모든 고장 내용에 위험도 등급 라벨링 후, 새로운 고장을 input으로 넣으면 Output으로 예상 위험도 추출하는 모델을 KoBERT, BERTClassification으로 생성
4. 해당 위험도 등급 내에서 LDA 토픽 모델링으로 위험도 등급 세분화 후 관리자의 판단 하에 가장 유사한 토픽 선택
5. 토픽 선택 후 해당 위험도 등급, 토픽 내에서 코사인 유사도가 가장 높은 데이터 부터 추출해서 관리자에게 제시한다.

내가 생각하는 문제점들은 다음과 같다.
1. 우리가 보유한 데이터에 MTTR,MTBF뿐 아닌 고장 내용, 그리고 부위별 상세 내용 역시 추가해서 군집화를 해야 보다 정확한 군집화가 될 것이다.
2. Kmeans가 아닌 계층 군집화를 적용해보아야 한다.
3. 위험도 등급을 추출하는 모델에서 LSTM,CNN, 머신러닝 등 여러 모델을 비교하지 않았다.
4. 관리자의 주관이 여전히 들어간다. LDA 토픽 모델링이 아니라 BERTopic으로 자동적으로 추출해주는 알고리즘을 만들면 어떨까?

이정도가 있다.
일단 발전을 위해 데이터 전처리부터 차근차근 다시 진행을 해야한다.

이번주 내로는 해당 호기의 부품 고장 내용에서 상세화 해서 계층화시키는 것이 1차 목표이다.

profile
안녕하세요

0개의 댓글

관련 채용 정보