1. 왜 데이터 구조가 중요할까?
PCF를 계산할 때는 단순히 "숫자 몇 개"만 넣고 끝나는 게 아닙니다.
데이터가 어떤 성격인지, 어디서 온 건지, 얼마나 신뢰할 수 있는지가 다 기록되어야 합니다.
👉 즉, 데이터 구조가 PCF의 뼈대예요.
뼈대가 잘못되면 계산도, 보고도, 비교도 무너집니다.
2. 활동데이터(Activity Data)
활동데이터 = 실제 사용량을 의미합니다.
예를 들어:
- 전기 사용량 (kWh)
- 천연가스 사용량 (m³)
- 트럭 운송 거리 (km × 톤)
- 플라스틱 원료 사용량 (kg)
이 데이터가 있어야 배출계수를 곱해서 배출량을 구할 수 있습니다.
💡 용어 풀이
- 활동데이터(Activity Data): 온실가스를 발생시키는 “활동의 양”.
- 예시: 휘발유 10리터, 전력 500kWh, 운송 100km(1톤).
3. 배출계수(Emission Factor)
배출계수는 단위 활동당 평균 온실가스 배출량입니다.
예시:
- 전력 1kWh 사용 → 0.5 kg CO₂e
- 휘발유 1ℓ 사용 → 2.3 kg CO₂e
- 트럭 운송 1톤·1km → 0.12 kg CO₂e
배출계수는 국가별·지역별·연도별로 다를 수 있습니다.
예를 들어 한국 전력의 배출계수는 석탄·가스 발전 비중에 따라 매년 조금씩 달라집니다.
💡 용어 풀이
- 배출계수(Emission Factor): 특정 활동 1단위당 발생하는 평균 온실가스 양.
- 출처: 정부 통계(국가 배출계수), 국제 DB(ecoinvent, DEFRA 등).
4. 1차 데이터 vs 2차 데이터
PCF 계산에서 가장 중요한 구분은 1차 데이터와 2차 데이터입니다.
-
1차 데이터 (Primary Data)
- 실제 현장에서 직접 측정·수집한 값
- 예: 공장의 전기 사용량, 실제 연료 구매량, 협력사가 제공한 재료 생산 데이터
-
2차 데이터 (Secondary Data)
- 데이터베이스나 문헌에서 가져온 대표값
- 예: 국제 DB(ecoinvent), 정부 보고서, 산업 평균값
👉 일반적으로 1차 데이터가 많을수록 정확하고 신뢰성 높은 PCF가 됩니다.
하지만 모든 단계를 다 측정하기는 어렵기 때문에, 일부는 2차 데이터를 활용합니다.
💡 용어 풀이
- 1차 데이터(Primary Data): 실제 측정된 데이터, 회사 내부에서 얻을 수 있는 값.
- 2차 데이터(Secondary Data): 문헌·DB·통계에서 가져온 평균값.
5. 데이터 품질 메타정보
데이터는 “값”만 중요한 게 아닙니다.
값을 해석하려면 그 맥락(메타데이터)도 기록해야 해요.
주요 항목:
- 지역성 (Geography): 어느 나라, 어느 지역 데이터인가?
- 연도성 (Time / Vintage): 어느 해의 데이터인가? (2015년 값 vs 2023년 값은 차이가 큼)
- 포괄범위 (Technology / Scope): 어떤 기술·공정 기준인가?
- 불확실성 (Uncertainty): 추정값인지, 실측값인지
예를 들어, “전력 1kWh = 0.5kg CO₂e”라는 배출계수가 한국 2023년 기준인지, 독일 2010년 기준인지에 따라 결과가 완전히 달라집니다.
💡 용어 풀이
- 메타데이터(Metadata): 데이터에 대한 데이터, 즉 출처·조건·범위를 설명하는 정보.
- 불확실성(Uncertainty): 값이 정확하지 않을 수 있는 정도.
6. 간단한 구조 그림
[활동데이터] × [배출계수] = [배출량]
│ │
│ └─ 출처, 연도, 지역, 불확실성
│
└─ 1차 데이터? 2차 데이터?
이 구조를 기반으로 최종 PCF 값을 산출합니다.
7. 정리
- 활동데이터: 실제 사용량 (전기, 연료, 원료, 운송 등).
- 배출계수: 단위 활동당 평균 배출량. 지역·연도별로 다름.
- 1차 데이터: 직접 측정한 값 → 정확도 높음.
- 2차 데이터: DB/문헌 값 → 보완용.
- 메타데이터: 지역, 연도, 기술, 불확실성 정보를 꼭 함께 기록해야 함.