2023.03.30 방향성 정립 및 생각

현빈·2023년 3월 30일
0

현재 중간고사 전까지 약 2주의 시간이 있다.
중간고사 시험 전 3가지 큰 테스크
1. AICE 시험
2. 품질경영학회 제출
3. 한국정보과학회 제출

1번은 토요일에 특강 들으면서 전체적인 복습 + 텐서플로우 사용법 익히면 큰 무리 없을 것 같다.

2번:
품질경영학회
현재 시스템상 문제점을 짚고 해결 방안을 제시할 수는 있을 것 같은데 이를 통해 정량적인 성과 지표나 스코어가 나오질 않는다.
방향성을 생각 해 보면

1. 품질경영학회

현 과정은 탄약 오작용 발생 시 현지 부대방문 조사 후 결과 보고서 작성하고 후속 조치를 취한다. 이떄 원인규명 불필요시 현지 부대방문 조사는 건너뛰고 바로 결과보고로 진행할 수 있다. 원인규명 불필요가 어떤 상황인지 더 조사해보자.

" 과거 사고와 원인규명결과 데이터 기반으로 사고 발생 시 원인규명 해결에 시간적, 비용적 효용 높이기 "
이게 결국 목표이다.

현재까지 진행 상황은 원인규명결과, 사고 내용을 LDA를 통해 토픽모델링 후 각각 사고 내용 별 해결 방안을 텍스트로 추출하는 것이다. 이것만으로는 너무 약한 것 같다. 문제 해결 방식이 좋지도 않고 LDA란 모델의 단점도 명확하기 때문에....

BerTopic을 추가로 진행해 coherence score 비교하는 것도 결국 어떤 모델이 더 좋은지 설명만 되고 이걸로 뭘 해결할지는 나오지 않는다. 여기에 PMI지수도 활용해야겠다.

그렇다면 한국정보과학회에 제출하고자 하는 것 처럼 사고 내용을 집어 넣었을 때 @@ 사고일 확률이 @@퍼센트, 그를 바탕으로 한 해결 방안 제시로 가야 하나? 과거 텍스트도 추출하고..

이렇게 하면 best 같은데 딥러닝 BERT나 LSTM을 쓰기에는 데이터가 300여개로 너무나도 부족하다. 회귀로라도 진행해볼까? 이것은 한번 생각을 하고 오늘 모델을 만들어야겠다.

2. 한국정보과학회

한국정보과학회는 어제 결정되었다. 논문 작성 경험을 한번 쌓아보고자 한다. 여기의 데이터도 품질경영학회와 비슷하지만 더욱 산업공학, 품질적으로 MTTR, MTBF를 바탕으로 진행한다.
전체적인 진행상황을 이야기하자면
1. MTTR, MTBF를 바탕으로 한 rist_impact, risk_likehood 도출
2. 1번 바탕으로 K-means를 통해 6개의 등급으로 군집화(근거 O)
3. 각 등급별 LDA를 바탕으로 주요 키워드 추출 완료
4. 등급별로 구분한 내용들을 딥러닝으로 학습 후 고장 등급 추출되는 알고리즘 개발하자.
5. 위 고장등급 추출 후 토픽모델링으로 추출한 데이터 기반 과거의 이력, 가장 비슷한 사고 유형 도출 후 도식화해서 준다.

위 학회에서 논문 방향은
1. 설비에서 현 위험 관리는 @@으로 관리자마다 주관적으로 평가한다.
2. 이에 과거 데이터를 바탕으로 위험 등급을 정량적 위험등급 평가를 제안한다.(완료)
3. 토픽 모델링을 바탕으로 위험 등급별 주요 인자를 도출하고 시각화한다.(시각화만 하면 완료 or BerTopic으로 하던가) (거의 완료)
4. 새로운 고장 내용 Input 시 관련 등급 도출, 비슷한 과거 이력 데이터 나오도록? (Bert나 KoBert 사용)
5. 관리자로 하여금 현재 하고있는 주관적 + 과거 정량적 데이터 기반의 추론으로 시간 및 비용의 품질적 향상을 기대한다.

이런 방식으로 진행해봐야겠다.

전체적으로 두 학회의 진행방식이 어쩌다보니 비슷해진 것 같은데 그 내에서도 다른 모델링을 적용하며 최대한 많은 방식을 습득할 수 있도록 해야겠다.

profile
안녕하세요

0개의 댓글

관련 채용 정보