특강: 코카콜라 생산 공정 최적화 프로젝트

Suhyeon Lee·2025년 1월 9일
0

라이브 세션

목록 보기
34/37

POINT
팀원들과 조화롭게 협업하는 방법
큰 문제 없이 데이터 분석 & 발표 & 성과 얻는 법
상위 의사결정권자와 소통하는 법

  • 실제 기업이 사용하는 데이터를 가지고 와서 데이터 분석 진행
  • 공정 효율화/고도화 문제 해결에 대한 유의미한 결과를 얻었기 때문에 경험을 공유하고자 함
  • SCM
    • 생산 공정, 생상/제조 업체의 업무 효율화

프로젝트에서 배운 것

  • 체계적인 데이터 분석 프레임워크를 적용해,
    팀원들과 최소한의 인풋으로 최대의 아웃풋을 산출
  • 다양한 협업 도구 및 AI 도구를 적극 활용하여
    데이터 분석 프로젝트를 진행

분석 배경

  • 미국의 Swire Coca-Cola(스와이어 코카콜라)
    • 코카콜라 자회사 중 하나
    • 미국 13개 주에 있는 시장에 판매할 음료 1억 9,200만개를 매년 6개의 생산 공장에서 생산
  • 기본 주문량 중 94.4%만 생산할 수 있다는 단점
    → 비효율적인 프로세스로 인한 것
  • 기계를 다시 가동하는 데 소요되는 시간으로 인해 연간 약 6천만 달러의 손실 발생
    • 기계가 예기치 못한 기계적 결함, 유지보수, 마모 등으로 인해 생산 과정 중 가동을 중단하는 것이 손실의 주요 이유 중 하나
  • Swire Coca-Cola의 생산 분석 팀의 요구
    • 이러한 고장이 발생하는 이유와 시기를 파악
    • 이러한 고장 문제를 미리 대비함으로써, 고장으로 인한 생산량 손실이 발생하지 않도록 사전 계획 수립

분석 목적 및 질문

기계 손상, 노화, 기타 요인으로 공정이 멈추면 손해가 큼
→ 어떻게 해결할 수 있을까?

  • 생산 공정에서 기계의 주요 고장 원인 파악

    • 예시: 기계 X는 항상 이 시기에 고장이 발생하며 이 부품이 가장 자주 고장남
  • 마모나 고장이 발생하기 전에 기계의 정상 작동 기간을 정량적으로 측정하기

    추가 설명: 이는 임계 생산 능력으로 정의할 수 있는데, 자동차에 X마일마다 정비 및 오일 교환이 필요한 시기가 있는 것처럼, 유지보수가 필요하기 전에 이 기계가 최대로 작동하여 얼마나 많은 출력을 생산할 수 있는지에 대한 예측으로 이어질 수 있습니다.

  • 미리 필요한 부품 제고를 파악하여 고장을 대비

    • 추가 질문: 특정 기계에 동일한 부품을 자주 교체해야 하는 경우, 어떤 예비 부품을 미리 확보해 두면 공정 과정 최적화에 도움이 될까요? 만약 대비한다면, 기계당 연간 몇 개의 부품을 재고로 보유해야 할까요?

5W1H 프레임워크

Who: 누가 데이터 분석의 혜택을 받을 수 있나요?
What: 자주 고장 나는 기계 및 부품은 무엇인가요?
When: 언제 주로 고장이 발생하였나요?
Why: 고장이 발생한 주요 원인은 무엇인가요?
Where: 기계 별로 또는 기계에 있는 특정 부품 별로 분석할 수 있는 데이터가 있나요?
How: 데이터 분석이 어떻게 기계 고장의 패턴을 파악하거나, 기계 고장으로 인한 손실을 예측하고 예방하는데 사용할 수 있나요?

데이터셋 설명

  • IWC_Work_Orders_Extract.csv
    • 기업의 실제 데이터셋이라 기업의 허락없이 공개 및 공유가 불가능
    • 데이터셋에는 1,427,264개의 행으로 구성된 IWC에 입력된 모든 작업 정보가 포함되어 있음

각 열의 이름과 설명

열 이름설명
ORDER_IDIWC에서 발생한 작업을 고유하게 식별하기 위해 사용되는 ID입니다.
PLANT_IDSwire Coca-Cola의 모든 공장을 고유하게 식별하는 ID입니다.
PRODUCTION_LOCATIONPLANT_ID의 위치를 나타냅니다. (Monza, Cota, Silverstone, Monaco, Roma, Suzuka)
EXECUTION_START_DATE특정 문제 해결 작업이 시작된 날짜입니다.
EXECUTION_FINISH_DATE특정 문제 해결 작업이 완료된 날짜입니다.
ACTUAL_START_TIME특정 문제 해결 작업이 시작된 시간입니다.
ACTUAL_FINISH_TIME특정 문제 해결 작업이 완료된 시간입니다.
ACTUAL_WORK_IN_MINUTES해당 문제 해결에 걸린 실제 시간(분 단위)입니다.
MAINTENANCE_PLAN유지보수 작업이 계획되었는지를 보여줍니다. 이 열이 비어 있다면, 해당 작업이 계획되지 않았음을 의미합니다.
MAINTENANCE_ITEM예: 베어링 교체와 같은 특정 유지보수 작업을 설명합니다. IWC 시스템에 따라 특정 코드로 나타날 수 있습니다.
MAINTENANCE_ACTIVITY_TYPE유지보수 작업이 계획되었는지 또는 계획되지 않았는지를 나타내는 열입니다.
ORDER_DESCRIPTION기술자가 수행한 실제 작업과 관련하여 남긴 노트 및 설명입니다.
MAINTENANCE_TYPE_DESCRIPTION유지보수가 예방적(문제를 방지하기 위한 작업)인지 또는 교정적(문제를 수정하기 위한 작업)인지를 설명합니다.
FUNCTIONAL_LOCIP 주소처럼 작동하며, 공장 내 기계(라인, 하위 공정 등)를 위치적으로 식별하는 데 도움을 줍니다.
FUNCTIONAL_AREA_NODE_1_MODIFIED공장 내 기능적 영역, 예를 들어 생산, 기술 지원, HVAC 등을 나타냅니다.
FUNCTIONAL_AREA_NODE_2_MODIFIED기능적 영역 하위의 특정 위치를 나타냅니다. (예: 블렌더룸, 어셈블리 라인 등.)
FUNCTIONAL_AREA_NODE_3_MODIFIED특정 위치 내에서 이 작업이 수행되는 장비의 하위 집합을 나타냅니다.
FUNCTIONAL_AREA_NODE_4_MODIFIED특정 라인 그룹 내에서 이 작업이 수행되는 위치를 나타냅니다. (예: 라인 번호를 포함합니다.)
FUNCTIONAL_AREA_NODE_5_MODIFIED장비 유형별로 더 세분화된 위치를 나타냅니다.
EQUIPMENT_ID유지보수 작업에 필요한 특정 부품(예: 충전기, 필러 등)을 의미합니다.
EQUIPMENT_DESC해당 장비에 대한 설명을 나타냅니다. 일부 구성 요소는 분류되지 않거나 정보가 공개되지 않을 수 있습니다.
EQUIPMENT_CAT_DESC작업이 기계, 차량, HVAC 시스템 등에서 수행되었는지를 나타냅니다.
EQUIP_START_UP_DATE장비가 설치된 날짜를 나타냅니다.
EQUIP_VALID_FROM장비가 기능을 시작한 날짜를 나타냅니다.
EQUIP_VALID_TO장비를 사용해야 하는 마지막 날짜를 나타냅니다.

추가 설명

  • 공장 담당자는 어떤 문제를 발견하고 큰 빨간 버튼을 누릅니다. 이 문제는 IWC 작업 지시를 내릴 만큼 심각한 문제일 수도 있고 아닐 수도 있습니다. 약간의 수동 조정으로 기계가 곧바로 가동될 수도 있습니다. 이러한 작업 시간은 IWC에 기록되지 않습니다.
  • 자동차가 일정한 주행 거리에 따라 오일 교환이 필요한 것처럼 기계도 정기적인 유지보수가 필요합니다. 이를 '계획된 유지보수' 작업이라고 부르며 IWC에 기록됩니다. 예를 들어, 6주에 한 번씩 특정 베어링을 교체해야 하는 기계가 있다고 가정하면, IWC는 이를 예약하여 공장 담당자에게 6주에 한 번씩 기계를 끄고 이 베어링을 교체하라는 알림을 보냅니다. IWC는 이를 '예방적 유지보수'로 기록합니다.
  • 오류가 발생하면 기계가 자동으로 꺼질 수 있습니다. 이로 인해 조지는 IWC에서 작업 명령을 내리지만 기계가 문제를 해결하고 스스로 재가동하여 작업 지시가 더 이상 필요하지 않아 즉시 종료되지만, 작업 지시가 내려졌다는 사실은 잠재적 위험 신호이므로 언제, 왜 발생했으며 향후 어떻게 예방할 수 있는지 관찰하거나 연구할 필요가 있습니다.
  • 기계는 고장날 수 있습니다. 마모와 파손은 모든 기계의 수명 주기에서 자연스러운 부분입니다. 이런 일이 발생하면 '계획되지 않은 유지보수' 또는 '교정 유지보수'로 IWC 작업 지시가 발행되고 설명과 해결 방법이 기록됩니다.
  • 어떤 경우에는 수정 자체에 몇 분밖에 걸리지 않지만, 공장 관리자가 다른 업무로 바빠서 교대 근무가 끝날 때까지 작업 지시를 소급하여 기록하지 않을 수도 있습니다. 이러한 경우 실행 시작 시간과 실행 종료 시간에는 차이가 없지만 실제 작업 시간(분)이 신뢰할 수 있는 지표가 되어야 합니다.

알려진 고장 패턴

데이터 분석 프로세스

1. 비즈니스 문제 정의

  • 분석 배경
  • 분석 목표
  • 분석 방법
  • 분석 전제 및 가정
  • 분석 한계점

2. 데이터셋 추출 및 생성

  • 원본 데이터
  • 변형 데이터
  • 최종 데이터

3. 데이터 분석 과정 및 모델링

  • 데이터 프로파일링 & 카탈로그
  • 분석 지표
  • EDA
  • 데이터 전처리 & 클린징
  • 모델링 & 평가

4. 인사이트 및 결론 해석

  • 분석적 해석
  • 비즈니스적 해석

5. 발표 및 보고서

  • 발표 자료
  • 대시보드
  • 인포그래픽
  • 코드

6. 액션 아이템 & 비즈니스 적용 범위

  • 액션 아이템
  • 비즈니스 적용 범위

EDA & 모델링

TOC(Table Of Contents)

데이터가 잘 주어졌을 때 회귀모델 구축이 가능하다는 결론
하지만 주로 사용한 모델은 회귀모델이 아닌 'Survival Analysis'
의료계에서 사용
시계열 데이터 분석에 유리
개체의 생존 확률이 시간에 따라 어떻게 바뀌는지 확인

의사결정권자가 보고 싶어하는 자료만 간추려서 보여주는 게 중요!
(핵심적인 것만 보여주기 & 인사이트 한 줄 정리)
→ "그래서 결론이 뭔데?"를 한 눈에 보여주기

분석적 해석 & 경영적 해석 나눠서 발표
발표에 참석한 사람들에게 맞춰서 발표 내용 만들기
(Background를 파악해서 그 사람들이 더 듣고 싶은 내용 위주로 발표 내용 작성하기!)

경영적 해석은 경영진&일반 대중을 타겟으로
(분석에 대한 이해가 없다고 가정)
경영진들은 RMSE, T-Test의 p-value에는 관심 없음
→ 예산, 효율성에 집중해 설명하기!

포트폴리오로 활용하는 법

사용한 도구 리스트

  • 협업 도구
    • Trello
  • 코드 작성
    • Colab
  • 발표 자료 생성
    • Gamma
      • Google Docs 내용을 그대로 불러와서 Presentation으로 만들 수 있음!
  • AI 협업 도구
    • ChatGPT
    • Claude
    • Gemini
  • 포트폴리오
    • Github

핵심

  • 데이터 분석 프로세스를 잘 만드는 것이 가장 중요
  • One Source Multi Use
  • 도메인 자체에 대한 관심 & 실제 비즈니스에 기여할 수 있는지가 중요!

QnA

  • 공장에서 일하는 분들은 20일~30일 사이에 고장이 난다는 걸 경험적으로 느끼고 계실 수도 있겠다는 생각이 드는데용 튜터님이 하신 게 이걸 데이터적으로 보여주신 걸까요?
    • 공장이 한 곳에/서로 가까이 있는 게 아니라 전 세계에 존재하기 때문에 지역별 차이가 있고 공장 간 소통이 어려운 부분이 있어요!
    • 이러한 부분을 데이터적으로 처리해준다고 생각할 수도 있겠네요.
  • Github 써볼려고 유튜브 여기저기 봤는데 혹시 강의 추천해주실만한 곳 있나요?
    • Github Desktop을 활용하세요! 버튼 하나만 클릭하면 바로 사용 가능합니다.
      (Git 언어 사용하지 않아도 github 관리 가능)
  • 유튜버 추천
    • 노마드코더
  • 데이터 분석에 대한 새로운 정보와 최신 트렌드를 확인할 수 있는 곳이 있다면 어떤 사이트를 추천해줄 수 있는지 궁금합니다!
  • 말씀해주신 두번째에서 나만의 장점을 찾는 것이 있는데 데이터 관련 직군에서 흔한 하드스킬,소프트스킬 이외에 나만에 강점이 될수 있는 것들이 어떤 것이 있을까요?
    • "커리어 스킬"도 매우 중요합니다.
      → 그게 뭔가요…?
      • 내가 잘 하는 걸 보여주는 스킬입니다!
      • 모든 걸 다 잘할 수는 없으니 '내가 이런 걸 해 왔다' & '난 이런 걸 잘 하더라'를 보여주는 거에요.
        e.g. 데이터 분석 결과를 알아보기 쉽게 잘 정리하는 능력
  • 비전공자라고 하셨는데, 전공했던 부분에서 현재 삶에서 도움 받는 부분이 있으신지, 있다면 어떤 부분인지 궁금합니다
    • 전 법학/심리학 전공이었어요! 한국에서는 법학 전공이었는데 심리학을 너무 좋아해서 따로 강의를 들으러 다닐 정도였습니다.
    • 전공했던 부분 모두가 현재 삶에서 큰 도움이 되었어요!
  • 아마존에서 엔지니어 업무로 컨텍하셨다고 하셨는데 컨텍 루트가 깃허브나 벨로그 같은 사이트로 오셨나요? 아니면 다른 일하시면서 컨텍하게되셨나요?

데이터 경향과 트랜드를 알수 있는 웹사이트:
https://towardsdatascience.com/
https://datarichard.simple.ink/
참고할 만한 유튜브:
https://www.youtube.com/watch?v=YFNQwo7iTNc
https://www.youtube.com/watch?v=Fley6IFhlC8
깃허브 데스크탑:
https://github.com/apps/desktop
감마 프리젠테이션:
https://gamma.app
조코딩님과의 인터뷰:
https://www.youtube.com/watch?v=J1nkQuhhYIg&t=155s

profile
2 B R 0 2 B

0개의 댓글

관련 채용 정보