POINT
팀원들과 조화롭게 협업하는 방법
큰 문제 없이 데이터 분석 & 발표 & 성과 얻는 법
상위 의사결정권자와 소통하는 법
- 실제 기업이 사용하는 데이터를 가지고 와서 데이터 분석 진행
- 공정 효율화/고도화 문제 해결에 대한 유의미한 결과를 얻었기 때문에 경험을 공유하고자 함
기계 손상, 노화, 기타 요인으로 공정이 멈추면 손해가 큼
→ 어떻게 해결할 수 있을까?
생산 공정에서 기계의 주요 고장 원인 파악
마모나 고장이 발생하기 전에 기계의 정상 작동 기간을 정량적으로 측정하기
추가 설명: 이는 임계 생산 능력으로 정의할 수 있는데, 자동차에 X마일마다 정비 및 오일 교환이 필요한 시기가 있는 것처럼, 유지보수가 필요하기 전에 이 기계가 최대로 작동하여 얼마나 많은 출력을 생산할 수 있는지에 대한 예측으로 이어질 수 있습니다.
미리 필요한 부품 제고를 파악하여 고장을 대비
Who: 누가 데이터 분석의 혜택을 받을 수 있나요?
What: 자주 고장 나는 기계 및 부품은 무엇인가요?
When: 언제 주로 고장이 발생하였나요?
Why: 고장이 발생한 주요 원인은 무엇인가요?
Where: 기계 별로 또는 기계에 있는 특정 부품 별로 분석할 수 있는 데이터가 있나요?
How: 데이터 분석이 어떻게 기계 고장의 패턴을 파악하거나, 기계 고장으로 인한 손실을 예측하고 예방하는데 사용할 수 있나요?
열 이름 | 설명 |
---|---|
ORDER_ID | IWC에서 발생한 작업을 고유하게 식별하기 위해 사용되는 ID입니다. |
PLANT_ID | Swire Coca-Cola의 모든 공장을 고유하게 식별하는 ID입니다. |
PRODUCTION_LOCATION | PLANT_ID의 위치를 나타냅니다. (Monza, Cota, Silverstone, Monaco, Roma, Suzuka) |
EXECUTION_START_DATE | 특정 문제 해결 작업이 시작된 날짜입니다. |
EXECUTION_FINISH_DATE | 특정 문제 해결 작업이 완료된 날짜입니다. |
ACTUAL_START_TIME | 특정 문제 해결 작업이 시작된 시간입니다. |
ACTUAL_FINISH_TIME | 특정 문제 해결 작업이 완료된 시간입니다. |
ACTUAL_WORK_IN_MINUTES | 해당 문제 해결에 걸린 실제 시간(분 단위)입니다. |
MAINTENANCE_PLAN | 유지보수 작업이 계획되었는지를 보여줍니다. 이 열이 비어 있다면, 해당 작업이 계획되지 않았음을 의미합니다. |
MAINTENANCE_ITEM | 예: 베어링 교체와 같은 특정 유지보수 작업을 설명합니다. IWC 시스템에 따라 특정 코드로 나타날 수 있습니다. |
MAINTENANCE_ACTIVITY_TYPE | 유지보수 작업이 계획되었는지 또는 계획되지 않았는지를 나타내는 열입니다. |
ORDER_DESCRIPTION | 기술자가 수행한 실제 작업과 관련하여 남긴 노트 및 설명입니다. |
MAINTENANCE_TYPE_DESCRIPTION | 유지보수가 예방적(문제를 방지하기 위한 작업)인지 또는 교정적(문제를 수정하기 위한 작업)인지를 설명합니다. |
FUNCTIONAL_LOC | IP 주소처럼 작동하며, 공장 내 기계(라인, 하위 공정 등)를 위치적으로 식별하는 데 도움을 줍니다. |
FUNCTIONAL_AREA_NODE_1_MODIFIED | 공장 내 기능적 영역, 예를 들어 생산, 기술 지원, HVAC 등을 나타냅니다. |
FUNCTIONAL_AREA_NODE_2_MODIFIED | 기능적 영역 하위의 특정 위치를 나타냅니다. (예: 블렌더룸, 어셈블리 라인 등.) |
FUNCTIONAL_AREA_NODE_3_MODIFIED | 특정 위치 내에서 이 작업이 수행되는 장비의 하위 집합을 나타냅니다. |
FUNCTIONAL_AREA_NODE_4_MODIFIED | 특정 라인 그룹 내에서 이 작업이 수행되는 위치를 나타냅니다. (예: 라인 번호를 포함합니다.) |
FUNCTIONAL_AREA_NODE_5_MODIFIED | 장비 유형별로 더 세분화된 위치를 나타냅니다. |
EQUIPMENT_ID | 유지보수 작업에 필요한 특정 부품(예: 충전기, 필러 등)을 의미합니다. |
EQUIPMENT_DESC | 해당 장비에 대한 설명을 나타냅니다. 일부 구성 요소는 분류되지 않거나 정보가 공개되지 않을 수 있습니다. |
EQUIPMENT_CAT_DESC | 작업이 기계, 차량, HVAC 시스템 등에서 수행되었는지를 나타냅니다. |
EQUIP_START_UP_DATE | 장비가 설치된 날짜를 나타냅니다. |
EQUIP_VALID_FROM | 장비가 기능을 시작한 날짜를 나타냅니다. |
EQUIP_VALID_TO | 장비를 사용해야 하는 마지막 날짜를 나타냅니다. |
데이터가 잘 주어졌을 때 회귀모델 구축이 가능하다는 결론
하지만 주로 사용한 모델은 회귀모델이 아닌 'Survival Analysis'
의료계에서 사용
시계열 데이터 분석에 유리
개체의 생존 확률이 시간에 따라 어떻게 바뀌는지 확인
의사결정권자가 보고 싶어하는 자료만 간추려서 보여주는 게 중요!
(핵심적인 것만 보여주기 & 인사이트 한 줄 정리)
→ "그래서 결론이 뭔데?"를 한 눈에 보여주기
분석적 해석 & 경영적 해석 나눠서 발표
발표에 참석한 사람들에게 맞춰서 발표 내용 만들기
(Background를 파악해서 그 사람들이 더 듣고 싶은 내용 위주로 발표 내용 작성하기!)
경영적 해석은 경영진&일반 대중을 타겟으로
(분석에 대한 이해가 없다고 가정)
경영진들은 RMSE, T-Test의 p-value에는 관심 없음
→ 예산, 효율성에 집중해 설명하기!
데이터 경향과 트랜드를 알수 있는 웹사이트:
https://towardsdatascience.com/
https://datarichard.simple.ink/
참고할 만한 유튜브:
https://www.youtube.com/watch?v=YFNQwo7iTNc
https://www.youtube.com/watch?v=Fley6IFhlC8
깃허브 데스크탑:
https://github.com/apps/desktop
감마 프리젠테이션:
https://gamma.app
조코딩님과의 인터뷰:
https://www.youtube.com/watch?v=J1nkQuhhYIg&t=155s