1. 왜 파이프라인이 필요할까?
PCF 계산은 단순히 숫자 몇 개 곱해서 끝나는 게 아닙니다.
- 데이터가 여러 부서/시스템에서 흘러들어오고,
- 단위 변환과 매핑이 필요하고,
- 검증을 거쳐야 최종 보고서에 들어갈 수 있습니다.
👉 따라서 데이터 흐름을 단계별로 설계한 파이프라인이 필요합니다.
이걸 잘 짜야 자동화·확장·검증이 가능해집니다.
2. 파이프라인 단계 개요
일반적으로 PCF 계산 파이프라인은 다음 7단계로 나눌 수 있습니다:
- 수집 (Data Collection)
- 정규화 (Normalization)
- 단위 변환 (Unit Conversion)
- 매핑 (Mapping)
- 합산 (Calculation)
- 검증 (Validation)
- 리포팅 (Reporting)
3. 단계별 설명
1) 수집 (Data Collection)
- 입력: 원자재 사용량, 전력/연료 사용량, 운송 거리, 공정별 데이터
- 출처: ERP, MES, 협력사 제공 파일, DB, IoT 계측기 등
- 1차 데이터와 2차 데이터를 구분해서 수집
2) 정규화 (Normalization)
- 수집된 데이터는 단위와 형식이 제각각
- 예: "연료 100리터", "연료 0.1톤", "연료 2,500MJ" → 모두 공통 단위로 변환 필요
- 이 과정을 거쳐야 계산에 들어갈 수 있음
3) 단위 변환 (Unit Conversion)
- 활동데이터를 배출계수 단위와 맞추는 과정
- 예: 전기 사용량(MWh) → kWh로 변환
- 예: 연료 톤 → MJ(열량) → 배출량으로 변환
4) 매핑 (Mapping)
- 활동데이터를 적절한 배출계수와 연결하는 단계
- 키: 항목 + 지역 + 연도 + 출처
- 예: “전력 사용량 100kWh, 한국 2023년” → 한국 2023년 전력 배출계수와 매핑
5) 합산 (Calculation)
- 매핑된 데이터 × 배출계수 × GWP
- 공정별, 제품별, 단계별로 합산
- 결과는 모두 CO₂e 단위로 합쳐짐
6) 검증 (Validation)
- 값이 정상 범위인지 확인
- 누락된 데이터나 잘못된 단위 체크
- 감사 로그(Audit Log) 남기기 → “누가 언제 어떤 데이터로 계산했는가” 기록
7) 리포팅 (Reporting)
- 최종 PCF 값 출력 (예: 제품 1개 = 130 kg CO₂e)
- 보고서에는:
- 목적·범위
- 데이터 출처
- GWP 세트
- 한계와 불확실성
- 다양한 포맷으로 출력:
- PDF 보고서
- Excel 데이터
- JSON/API (공급망 교환용, PACT 호환)
4. 간단한 흐름도
[수집] → [정규화] → [단위 변환] → [매핑] → [합산] → [검증] → [리포팅]
5. 개발자가 챙겨야 할 포인트
- 자동화: ERP/MES/IoT와 연동해 데이터 수집을 자동화
- 유연성: 새로운 배출계수·GWP 버전이 들어와도 쉽게 교체 가능
- 감사 가능성: 데이터 출처·단위 변환·계산 로그를 남겨야 검증 가능
- 출력 다양성: 내부 분석용, 외부 보고용, 공급망 공유용을 각각 맞춰야 함
6. 정리
- PCF 계산은 7단계 파이프라인으로 이뤄진다: 수집 → 정규화 → 단위 변환 → 매핑 → 합산 → 검증 → 리포팅
- 개발자는 이 흐름을 자동화·유연·검증 가능하게 설계해야 한다
- 이렇게 해야 기업이 요구하는 보고, 공급망 교환, 규제 대응까지 원활히 할 수 있다