[논문 리뷰] Automatic Detection of Manufacturing Equipment Cycles Using Time Series

박관용·2024년 8월 6일

Abstract

제조업체들은 경쟁력을 높이고 환경 영향을 줄이기 위해 점점 더 적은 에너지를 사용하려고 합니다. 기술을 구현하고 에너지 수요를 줄이기 위한 결정을 내리기 위해서는 에너지/전력 데이터가 필요합니다. 그러나 에너지 데이터는 종종 사용할 수 없거나, 사용할 수 있더라도 너무 집계되어 있어 유용하지 않거나, 정보를 접근하기 어렵게 만드는 형태로 제공되는 경우가 많습니다. 이 논문에서는 마지막 요점에 초점을 맞춥니다. 에너지 정보 투명성과 스마트 에너지 모니터링 시스템을 향한 일환으로, 본 논문은 제조 장비의 전기적 전력 주기를 자동으로 감지하고 분석하는 새로운 견고한 시계열 기반 접근 방식을 소개합니다. 새로운 패턴 인식 알고리즘은 전력 피크 클러스터링 방법을 포함하며, 다양한 공작 기계의 실제 센서 데이터 세트에 적용됩니다. 합성 시계열을 통해 측정 노이즈의 정도와 측정 샘플링 속도에 따라 주기 감지의 정확도가 거의 100%에 달할 수 있음을 보여줍니다. 또한, 이 논문은 제조 장비 주기의 통계적 부하 프로파일링 및 통계적 편차 분석이 자동 센서 및 프로세스 결함 감지에 어떻게 유용할 수 있는지를 설명합니다.

소개 및 배경

1.1 동기
"사물인터넷", "스마트 팩토리", "산업 4.0"과 같은 미래 개념을 처리하기 위해 딥러닝 및 기타 머신러닝 기술은 매우 중요합니다. 많은 연구들이 이상 탐지, 프로세스 제어, 최적화 및 예측을 위한 머신러닝 기술 개발에 중점을 두고 있습니다. 그러나 제조업에서는 센서 데이터의 아주 작은 부분(<1%)만이 실제로 시스템 효율성을 향상시키고 경제적 가치를 창출하는 데 사용됩니다.

포괄적인 센서 데이터의 잠재적 가치를 활용하는 한 가지 방법은 데이터 기반 모델링입니다. 충분한 데이터를 사용해 학습된 데이터 기반 머신러닝 모델은 매우 정확할 수 있습니다. 그러나 시간이 지나면서 영향 요인이 변경되거나 유사한 다른 시스템이 고려되면 모델 결과는 더 이상 신뢰할 수 없습니다. 또한 이러한 모델은 종종 가능한 한 많은 라벨링된 데이터가 필요하며, 이는 얻기 어렵거나 비용이 많이 듭니다. 산업 현장에서 센서 데이터가 활용되지 않는 주요 이유 중 하나는 적절한 센서 데이터 검증이 부족하기 때문입니다. 이는 수동 검증이 시간 소모적이며 전문가 지식을 필요로 하기 때문입니다. 기술 시스템과 특정 생산 영역에 대한 책임이 끊임없이 변화함에 따라 센서 시스템은 종종 제대로 유지되지 않습니다.

현재 산업 동향은 전력 및 에너지 모니터링 시스템(EMS)을 설치하는 것입니다. 이는 높은 에너지 비용, 법적 요구사항 및 세금 인센티브에 의해 촉진됩니다. 에너지 효율성을 높이기 위한 변화를 구현하려면 지속적이고 정확한 전력 모니터링이 중요합니다. 그러나 새로운 기능을 생산 환경에 추가하는 데는 센서 시스템 검증 및 유지보수 부족, IT 시스템의 복잡성 등의 어려움이 따릅니다.

직접적인 운영 상태 감지는 MTConnect 또는 OPC/UA와 같은 새로운 프로토콜을 사용하는 클라이언트 애플리케이션을 통해 가능합니다. 그러나 대부분의 제조 장비 시스템에는 이러한 인터페이스가 없습니다. 일반적으로 다양한 생산 센서 데이터는 원시 데이터 스트림으로 저장되고 시각화됩니다. 이는 상세하고 효과적인 에너지 모니터링 및 의사 결정에 충분하지 않습니다. 이를 해결하기 위해 원시 데이터 스트림은 수동 파라미터, 임계값 조정 또는 감독 라벨링 기반 학습 절차가 필요 없이 자동으로 처리되어 관련 정보를 추출하고 시각화해야 합니다.

에너지 관점에서 제조 장비와 관련된 가장 중요한 정보는 "작업" 운영 상태입니다. 이 상태는 일반적으로 하나 이상의 주기적으로 반복되는 제조 주기로 특징지어집니다. 예를 들어, 장비 고장 및 작업 중단으로 인한 불규칙한 중단은 "작업" 상태와 관련된 시간 비율을 변경합니다. 따라서 제조 장비의 에너지 효율성과 프로세스 편차는 특정 운영 상태에 따라 분석해야 합니다. 그림 1은 가공 사이클(MCs)의 자동 감지에 기반하여 절단기의 전력 곡선에서 "작업" 상태를 표시한 예를 보여줍니다. 그림 2는 두 가지 다른 MC 패턴이 감지된 복잡한 기계 도구의 예를 보여줍니다. 이 두 가지 MC 패턴 유형은 검사 시 명확하지 않습니다.

1.2 제조업의 전력 측정 데이터로부터 지식 획득

O’Driscoll 등은 이벤트 탐지기를 사용하여 총 전력 곡선에서 운영 상태와 구성 요소 활동을 인식하기 위해 감독 학습 절차를 개발했습니다. Teiwes 등의 방법은 전력 곡선에서 운영 상태를 인식하기 위해 많은 프로세스 특화 경계 조건과 임계값을 지정했습니다. 그러나 이러한 방법들은 변동하는 전력 수요 곡선이나 여러 운영 상태가 있는 경우에 대한 적용이 어렵습니다. Seevers 등은 모든 기계 도구와 시계열에 시간 소모적인 수동 조정이 필요 없는 자동화된 비감독 접근 방식을 제안했습니다.

Labbus 등은 전력 측정 데이터에서 네 가지 운영 상태(“작업,” “운영,” “대기,” 및 “꺼짐”)를 자동으로 감지하는 방법론을 개발했지만, 여러 작업 상태를 자동으로 감지할 수 없다는 한계가 있습니다. 패턴 인식 방법은 이러한 연구 격차를 메우는 데 유망할 수 있습니다. Labbus 등은 대부분의 기계가 반복적인 부하 프로파일을 보이기 때문에 패턴 인식 개념이 적용 가능하다고 언급했습니다.

1.3 시계열의 패턴 인식

제조 장비 상태 분석을 위한 다양한 시계열 기반 기술이 있습니다. 시계열 클러스터링은 크게 두 가지 범주로 분류됩니다: (1) 전체 클러스터링과 (2) 하위 시퀀스 클러스터링. 전체 클러스터링은 에너지 프로파일의 운영 상태를 감지하는 데 도움이 되지 않으며, 단순한 하위 시퀀스 클러스터링은 만족스러운 결과를 제공하지 않습니다. 시간 시퀀스 모티프를 발견하는 방법은 운영 상태와 가공 작업을 감지하는 데 유망합니다.

1.4 연구 접근법

본 논문은 제조 장비의 전력 주기를 자동으로 감지하고 분석하는 시계열 기반 접근법에 중점을 둡니다. 우리는 제조 장비가 가장 높은 평균 전력 수요를 가지는 “작업” 상태의 MC에 집중합니다. 제안된 접근법은 추가 정보 없이 모든 총 측정 시리즈에서 MC를 자동으로 인식할 수 있습니다. 이 방법론은 동적 생산 환경, 설정 시간 변화, 프로세스 이상 및 기타 불완전한 주기성의 영향을 견딜 수 있습니다.

논문은 다음과 같이 구성됩니다. 2장에서는 연구 방법론을 설명하고, 3장과 4장에서는 EMS 데이터에 대한 알고리즘의 검증과 적용을 다룹니다. 5장에서는 주요 결과를 논의하며, 마지막으로 6장에서는 요약과 결론을 제시합니다.

2 방법론
우리의 방법론적 접근 방식은 크게 다음 세 가지 주요 부분으로 나눌 수 있습니다:

MCs(패턴 가공 사이클)의 자동 인식과 하나 이상의 패턴 가공 사이클(PMC)의 계산;
통계적 표준 부하 프로파일링;
통계적 편차 분석.
전체 방법론의 핵심 요소는 2.1절의 PMC 감지의 일부인 전력 피크 클러스터링을 사용하는 새로운 견고한 주기성 감지 방법입니다. 한편으로, 우리의 연구의 참신성은 불완전하고, 부분적이며, 비동기적이고, 대략적인 주기성을 견고하게 감지하기 위해 개발된 피크 클러스터링 방법에 크게 의존합니다. 다른 한편으로는, 센서 데이터 스트림의 자동화된 분석 및 평가를 위한 포괄적 솔루션을 제공하기 위해 기존 접근 방식과 결합하는 것이 또한 새롭습니다. 이 포괄적 솔루션의 일부는 2.2절과 2.3절에 설명되어 있습니다. 2.2절에서는 계산된 PMCs를 사용하여 해당 PMC와 유사한 모든 MCs를 추출하고, 이러한 MCs로부터 통계적 표준 부하 프로파일을 도출하는 방법을 설명합니다. 이러한 통계적 프로파일은 다양한 기간에 대해 얻을 수 있습니다. 2.3절에서는 이러한 프로파일을 비교하여 중요한 통계적 편차를 감지하는 방법을 보여줍니다.

2.1 패턴 가공 사이클의 패턴 인식

하나 이상의 PMC를 계산하는 과정은 완전히 자동화되어야 하며 다양한 제조 장비에 적용 가능해야 합니다. 이를 달성하기 위해 몇 가지 방법적 단계와 계산 루프가 필요합니다. 주요 단계는 다음과 같습니다:

스무딩 방법을 사용한 PMC 주기 시간의 계산;
스무딩 방법으로 해결책을 찾지 못한 경우 피크 클러스터링 방법을 사용한 PMC 주기 시간의 계산;
MCs의 시작 시간 점 계산;
PMC(s)의 계산.
먼저, 원시 시계열 TS = y1, …, ym을 m개의 실수 값 변수의 정렬된 집합으로 시작하여, 다음 식에 따라 n 값의 중심 이동 평균을 구축합니다:

여기서 n은 특정 시간 간격 ta 내의 (NaN이 아닌) 값의 수입니다. 공작 기계의 경우, 일반적인 작업 주기가 1분을 초과하지 않으므로 15분의 시간 간격을 고려해야 합니다. 이는 기본 값 ta = 15분 또는 900초의 시간 간격 내에서 각각의 시계열 하위 시퀀스가 여러 번 반복됨을 보장합니다(예: 샘플링 속도가 1Hz이고 누락 값이 없는 경우 n = 900).

모든 이동 평균 중에서, 각각의 시계열 하위 시퀀스 내에서 가장 낮은 분산을 가진 최상의 해결책을 선택하기 위해 네 개의 최고 값을 선택합니다(표 1, 4행 및 5행 참조). 이러한 값은 제조 장비의 MCs의 최대 평균 전력 수요를 식별합니다. 네 개의 값은 테스트에 따라 최상의 결과와 최소의 계산 노력을 위한 타협으로서 선택되었습니다. 네 개의 선택된 이동 평균 값은 원래 시간 스탬프에 따라 서로 최소한 ta의 시간 거리를 가져야 합니다.

단계별 설명
원시 시계열 데이터 입력(TS)

데이터를 입력받아 처리 시작.
15분 평균값 계산

시계열 데이터를 15분 단위로 평균화하여 주요 시간 구간을 찾습니다.
상위 4개 시간 구간 선택

평균 값이 가장 높은 4개의 시간 구간을 선택하여 집중 분석.
스무딩 방법 적용

선택된 각 구간에 대해 두 가지 스무딩 방법(2단계, 4단계)을 적용하여 노이즈를 줄이고 패턴을 찾기 쉽게 만듭니다.
자기상관 함수 계산

각 스무딩된 시계열 세그먼트에 대해 ACF를 계산하여 주기성을 확인합니다.
피크 간 시간 차이 추출

ACF 피크 간의 시간 차이를 계산하여 주기 후보(tPMC)를 찾고, 그 중 표준 편차가 가장 낮은 값을 선택합니다.
tPMC 후보 출력 및 비교

각 스무딩 방법의 결과를 비교하여 비슷하면 선택, 다르면 피크 클러스터링으로 추가 분석.
피크 클러스터링

피크 클러스터링을 통해 tPMC 후보를 추가로 검증하고, 최종 후보를 필터링합니다.
최종 tPMC 후보 반환

최종적으로 유효한 tPMC 후보들을 반환합니다.

두 번째로, 원시 시계열(TS)에서 누락된 측정 데이터 포인트를 확인해야 합니다. 원시 시계열 TS의 누락 데이터를 추정하고 선형 보간 시계열 TSlin_interp를 계산하기 위해 선형 보간법을 사용합니다. 그런 다음 최대 이동 평균 값과 해당 타임스탬프 t를 기준으로, 시간 길이 ta를 가진 네 개의 시계열 하위 시퀀스 ymax,i (i = 1, …, 4)를 TSlin_interp에서 가져옵니다. 스크립트에서는 각 시계열 하위 시퀀스에 대해 최대 33%의 누락 값을 보조 조건으로 고려합니다. 그 후, 추출된 네 개의 시퀀스 ymax,i를 두 개의 독립적인 스무딩 계산 방법에 보내 PMC 시간 tPMC를 결정합니다 (표 1, 5-7행).

공작 기계의 일반적인 작업 주기 시간은 최소 20초에서 최대 120초까지의 경험적으로 정의 가능한 시간 범위를 가지므로, 스무딩 알고리즘에 대해 균일한 표준 매개 변수 값을 결정할 수 있습니다. 첫 번째 방법은 두 번의 스무딩으로 구성됩니다. 첫째, 이동 창 길이가 11초인 단순 중심 이동 평균(n = 11 데이터 포인트, 샘플링 속도 1Hz 기준)을 계산합니다. 두 번째로, 결과 스무딩된 시계열을 다시 한번 n = 25의 역방향 가우시안으로 스무딩합니다. 두 번째 스무딩 방법은 네 번의 스무딩으로 구성됩니다. 첫째, ymax,i를 중심 조화 평균(n = 21)으로 스무딩합니다. 둘째, 결과 시계열을 n = 11의 단순 중심 이동 평균으로 스무딩합니다. 셋째, n = 21의 역방향 가우시안을 수행합니다. 마지막으로, n = 21의 단순 중심 이동 평균을 다시 사용합니다. 이 처리 단계는 8개의 스무딩된 시계열을 생성합니다.

제조 장비의 성능에서 불규칙한 중단 기간(설정, 유지 보수, 수동 개입 등)이 발생하는 점을 고려할 때, 얻은 시계열을 여러 시간 세그먼트로 나누는 것이 유리합니다. 패턴 인식 알고리즘의 모든 추가 구성 요소는 서로 다른 세그먼트에서 선택하여 평가 매개 변수의 분산이 가장 낮은 최상의 솔루션을 선택할 수 있습니다. 따라서 각 스무딩된 시계열은 두 번 복제됩니다. 첫 번째 복제는 두 개의 절반으로 나누고 두 번째 복제는 세 개의 동일한 길이의 세그먼트로 나눕니다. 결과적으로 각 스무딩된 시계열 시퀀스는 6개의 다른 길이의 새로운 세그먼트를 생성합니다. 이러한 세그먼트 분할은 두 개의 스무딩 방법과 피크 클러스터링 방법이 24개의 다른 시간 세그먼트에 접근하여 최저 분산의 최상의 솔루션을 선택할 수 있게 합니다.

세그먼트 도출 후, 스무딩된 시계열 세그먼트의 자기상관 함수(ACF)를 계산합니다. ACF 피크 간의 시간 차이를 계산하여 tPMC를 가장 빈번하게 발생하는 시간 차이로 평가합니다 (표 1, 11행). 해당 시간 세그먼트 내 피크 간의 모든 시간 차이의 표준 편차는 24개 세그먼트 내에서 최상의 솔루션을 찾기 위한 평가 기준으로 사용됩니다. 그림 3은 두 번 및 네 번의 스무딩이 tPMC에 대해 다른 솔루션을 제공하는 경우를 보여줍니다. 그러나 일부 명확한 경우 두 스무딩 알고리즘이 동일한 결과를 제공합니다. 이 경우, 계산 집약적인 전력 피크 클러스터링을 피할 수 있습니다. 스무딩 방법과 ACF를 통한 유사성 검색이 공통의 특정 PMC 시간에 동의하지 않는 경우(표 1, 17행), 전력 피크 클러스터링을 사용하는 세 번째 계산 방법이 활성화됩니다. 전력 피크 클러스터링 방법은 다음 하위 단계로 구성됩니다:

두 번의 스무딩: 첫째, n = 5의 단순 중심 이동 평균; 둘째, n = 7의 중심 가우시안 (표 1, 20행).
전력 수요 곡선 피크의 특징 추출 (표 1, 22행).
특징 1: 전력 피크의 절대 값;
특징 2: 피크 주변 ±3 측정 지점의 절대 전력 범위;
특징 3: 피크 주변 ±3 측정 지점의 전력 분산;
특징 4: 이전 전력 피크까지의 시간 차이;
특징 5: 다음 전력 피크까지의 시간 차이.
모든 특징의 분산 상한 0.5와 Z-점수 정규화를 통한 저분산 필터링.
두 번의 루프를 가진 K-평균 클러스터링 (표 1, 23행).
여섯 개의 시간 세그먼트에 대해;
클러스터 수 i = 1, …, n에 대해 기본 값 n = 20과 종료 기준 (클러스터 수 증가와 함께 최적 클러스터의 분산이 더 이상 감소하지 않으면 루프 중단).
비정규화.
최고의 클러스터를 선택하기 위한 평가 기준은 클러스터 내에서 다섯 개의 특징 값의 평균 분산입니다. PMC 시간 계산을 위해서는 이 다섯 가지 기준뿐만 아니라 클러스터 내 피크가 서로 얼마나 떨어져 있는지를 나타내는 평가 기준도 필요합니다. 이는 클러스터된 전력 피크가 주기마다 한 번 발생하며 동질적인 시간 간격 tPMC를 가지는 클러스터를 찾기 위해서입니다. 따라서 다섯 개의 클러스터 특징 외에도 평가 특징이 추가됩니다. 이 평가 특징을 통해 클러스터 내 피크의 시간 차이를 고려합니다.

평가 특징 여섯 개의 평균 분산 v를 결정합니다. 모든 상위 클러스터 내에서 가장 빈번하게 발생하는 시간 차이는 tPMC입니다. 상위 클러스터는 최저 평균 분산 vmin을 가지는 클러스터와 평균 분산 v < 2*vmin인 모든 클러스터입니다.

tPMC가 결정되면, 가능한 MCs의 시작 시간 점은 네 번 스무딩된 전력 곡선에서 검색됩니다. 이는 곡선의 최소값입니다. 시간 창 tPMC를 시작점에 설정하여 여러 MCs를 감지하고 이를 평균화하여 PMC를 구성합니다. 그 후 get_MC()를 사용하여 감지된 PMCs의 신뢰성을 보장하고 여러 PMCs 간의 유사성을 피하며 너무 짧거나 긴 PMCs를 피하기 위해 몇 가지 후처리 단계를 수행합니다 (표 2, 39-41행).

PMC 후보 처리 루프

각 PMC 후보
𝑡
𝑃
𝑀
𝐶
,
𝑖
tPMC,i에 대해 반복 작업을 수행합니다.
𝑡
𝑃
𝑀
𝐶
,
𝑖
tPMC,i는 후보 PMC 시간을 나타냅니다.
4단계 스무딩

PMC 후보가 발견된 시간 구간에 대해 네 번의 스무딩을 적용하여 노이즈를 줄이고 데이터를 부드럽게 만듭니다.
최소 피크 검색

𝑡
𝑃
𝑀
𝐶
×
0.8
tPMC×0.8 범위 내에서 데이터의 최소 피크를 검색하여, 각 피크를 MC의 시작 시간으로 설정합니다. 이 과정은 주기성을 더 잘 감지하기 위해 사용됩니다.
MC 추출

각 최소 피크를 시작 시간으로 하여,
𝑡
𝑃
𝑀
𝐶
,
𝑖
tPMC,i 길이를 가진 모든 MC를 추출합니다.
CCF로 MC 시작 시간 조정

상호 상관 함수를 사용하여 추출된 MC의 시작 시간을 정밀하게 조정합니다. CCF는 두 시계열 간의 상관 관계를 계산하여 시간 지연을 조정하는 데 사용됩니다.
PMC 형성

각 데이터 포인트에 대해 중간 값을 계산하여 최종 PMC를 형성합니다. 이는 데이터의 중앙 경향을 대표하는 값입니다.
PMC 검증 및 조정

모든 MC를 검토하여 너무 길거나 짧은 경우 PMC를 조정합니다. 이는 PMC의 정확성을 높이기 위한 단계입니다.
PMC 후보 간의 유사성 검사

PMC 후보 간의 상관 계수를 계산하여 유사한 후보를 찾습니다. 상관 계수가 0.95보다 큰 경우 더 짧은 PMC를 삭제합니다. 이는 중복된 PMC를 제거하여 최적의 PMC를 선택하기 위함입니다.
최종 PMC 반환

최종적으로 선택된 PMC를 반환합니다.

2.2 통계적 표준 부하 프로파일링

이 단계에서는 결정된 PMC를 전체 측정 데이터 시리즈의 시간 길이 tPMC를 가진 모든 시계열 하위 시퀀스와 유사성 검사를 수행합니다. 서로 다른 시간 길이를 가진 왜곡된 시간 패턴의 경우, 동적 시간 왜곡(dynamic time warping)과 같은 유사성 검색 방법이 권장됩니다. 그러나 고정된 PMC 시간을 가진 자주 반복되는 자동화된 MC를 감지하기 위해, 교차 상관 함수(CCF)에 의한 유사성 검색은 충분히 정확합니다. CCF는 샘플링 빈도가 낮은 과정에 더 적합하며, 이는 전력 피크가 매우 높거나 매우 낮을 수 있기 때문입니다. 교차 상관 계수(cross corrcoeff)를 사용하면 고정된 길이에서의 유사성에 중점을 둡니다. 큰 일시적 이상치는 동적 시간 왜곡과 같은 거리 측정에서처럼 강하게 가중되지 않습니다.

PMC와 시계열 하위 시퀀스 간의 교차 상관 계수가 일정 한계값(기본값, 0.9)을 초과하면 해당 MC가 감지되고 필터링됩니다. 중복 감지된 MC의 경우, 가장 높은 교차 상관 계수를 가진 MC만 필터링되도록 합니다. 교차 상관 계수의 계산은 누락된 측정 값에 의해 왜곡될 수 있습니다. 분석에 실제 MC만 포함시키기 위해, MC 값의 최소 X%(기본값, 50%)가 존재해야 합니다.

PMC와 유사하여 높은 교차 상관 계수를 가지는 전력 수요 곡선의 매우 작은 피크가 MC로 잘못 인식될 수 있습니다. 이러한 잘못 인식된 MC는 매우 작은 전력 피크나 변동을 가지며, 이 때문에 이러한 "미니 MC"의 절대 표준 편차는 PMC의 모든 측정 점의 절대 표준 편차에 비해 매우 작습니다. MC의 표준 편차가 PMC의 표준 편차의 최소 일정 비율(기본값, 50%)에 해당해야 한다는 조건을 설정하여 무작위로 감지된 잘못된 "미니 MC"를 고려하지 않습니다. 그럼에도 불구하고, 50% 비율은 PMC의 평균 전력 소비량보다 훨씬 낮은 MC도 감지할 수 있도록 합니다. 이는 표준 부하 프로파일링의 목적이 해당 시간 동안 기계의 현재 상태를 정확하게 설명하는 것이기 때문에 중요합니다.

따라서 PMC의 각 측정 점에 대해, 측정 데이터 시리즈에서 MC를 필터링하여 측정 값을 수집하여 PMC의 각 측정 점에 대한 경험적 통계 분포를 생성합니다. 각 분포에 대해 다양한 기술 통계 파라미터(산술 평균, 중앙값, 사분위수, 표준 편차, 분산, 곡률, 왜도)를 결정할 수 있습니다. 이를 박스 플롯으로 시각적으로 표현할 수 있습니다. 예시는 4.2절, 그림 11에서 볼 수 있습니다. 인식된 패턴을 기반으로 가능한 많은 MC를 시계열에서 필터링하여 해당 기계의 표준 부하 프로파일을 생성합니다. 평균 표준 부하 프로파일은 각 측정 점에 대한 평균 전력 수요를 나타내는 대표적인 부하 프로파일입니다.

2.3 통계적 편차 분석
편차 분석의 목적은 MC의 각 측정 점과 각 MC의 전체 에너지 수요에 대한 전력 수요의 통계적 프로세스 제어입니다. 이를 통해 시간별 제어 한계를 설정할 수 있습니다.

얻은 데이터를 바탕으로 표준 부하 프로파일 형성 후 통계적 편차 분석을 수행합니다. 편차 분석은 이전 기간의 프로파일과 비교하여 개별 제조 장비의 전력 수요의 변화나 불규칙성을 보여줍니다. 초기 평가 후 가설 검정을 통해 유의한 편차가 있는지 확인합니다. 일반적으로 모수 검정과 비모수 검정을 구분합니다. 샘플 크기가 50보다 크면 샘플 분포가 결과에 영향을 미치지 않으므로 모수 검정을 선택할 수 있습니다. 값이 50보다 작은 샘플은 자동으로 분석에서 제외됩니다.

우리의 방법론에서는 표준 부하 프로파일의 각 측정 점 분포를 이전 기간의 동일한 측정 점 분포와 비교하고, 전체 평균 표준 부하 프로파일을 이전 기간의 평균 표준 부하 프로파일과 비교합니다. 각 날의 값을 이전 날, 일주일 전, 그리고 4주 전과 비교합니다. 개별 측정 점의 비교를 위해 두 표본 t-검정을 수행합니다. 데이터가 연결되어 있지 않기 때문입니다. 같은 제조 장비에서 다른 시간 동안 tPMC는 다를 수 있지만, 동일할 수도 있습니다. PMC 시간이 다르면, 연결되지 않은 샘플에 대한 t-검정을 사용하고, MC 길이가 같으면 짝지어진 t-검정을 선택합니다.

그 후, t-검정에 맞춰 통계적 편차의 효과 크기를 Cohen의 d로 결정합니다. 그룹 크기가 동일한 경우와 상이한 경우, 그리고 분산이 동일한 경우와 상이한 경우를 구분합니다. 우리의 경우 항상 분산이 상이하다고 가정합니다:

동일한 그룹 크기와 다른 분산의 경우:

Cohen의 d는 효과의 방향에 따라 양수 또는 음수가 될 수 있습니다.

3. 검증

이전 섹션에서 제조 장비 사이클 감지 및 분석을 위한 견고한 시계열 기반 알고리즘을 확립한 후, 이제 우리의 접근 방식을 검증합니다. 먼저, 패턴 감지 및 추출의 정확성을 평가하기 위해 합성 프로파일을 생성한 다음, 실제 EMS 데이터를 고려합니다. 또한, 측정 데이터의 완전성과 매개변수 변동에 대한 민감도 분석도 수행합니다.

3.1 합성 시계열

길이 60,000 데이터 포인트의 합성 시계열은 세 가지 입력 패턴을 무작위로 반복하여 생성되었습니다. 기본적으로 이상적인 합성 데이터 세트(V_1)를 바탕으로, [0, 1) 범위의 균등 분포에서 무작위 노이즈를 추가하여 V_2에서 V_6까지의 다른 데이터 세트를 생성했습니다. 노이즈가 추가된 합성 데이터 세트를 통해 우리의 알고리즘이 패턴을 감지할 수 있는 성능 한계를 확인할 수 있습니다.

V_1 및 V_4의 경우, 추가된 노이즈에도 불구하고 PMCs가 올바르게 감지되었습니다. 그러나 V_5와 V_6에서는 노이즈가 너무 높아 PMC를 감지할 수 없었습니다. 노이즈가 많아질수록 스무딩 및 클러스터링 알고리즘의 결과가 달라지며 명확한 솔루션을 찾기 어려워집니다. 이는 그림 6에서 합성 데이터 세트 V_1에서 V_4까지의 PMC를 나타냅니다.

입력 프로파일과 감지된 PMC를 사용하여 시간 시리즈에서 MC를 검색한 결과, 감지된 MC 수는 거의 차이가 없었습니다. 최소 교차 상관 계수 0.7은 통계적 불확실성을 제외하고 거의 동일한 수의 MC를 감지할 수 있음을 보장합니다.

3.2 실제 데이터 세트

합성 시계열 데이터에 대한 조사가 끝난 후, 실제 기계 공구의 전력 곡선을 기반으로 검증을 수행합니다. 데이터는 상업용 EMS에 의해 수집되었으며, 기계 공구마다 초당 전력 수요 데이터를 기록했습니다. 일부 값이 누락되거나 낮은 샘플링 속도로 측정된 경우도 있습니다. 이러한 상황과 그 정확성에 대한 영향을 조사합니다.

실험 결과, 교차 상관 계수(corrcoeff) 0.9에서는 PMC와 매우 유사한 MC만 감지되며, 이는 MC의 좋은 구분을 가능하게 합니다. 교차 상관 계수가 낮아지면 잘못된 MC가 감지될 가능성이 증가합니다. 다양한 기계 도구에 대해 최상의 데이터 완전성과 최소 교차 상관 계수의 조합을 결정하기 위해 테스트를 수행합니다. 데이터 완전성이 30%로 감소하고, 다양한 교차 상관 계수(0.6–0.9)를 시험합니다. 교차 상관 계수가 0.7인 경우, 개별적으로 잘못된 MC가 감지되며, 0.6으로 감소하면 잘못된 MC 수가 거의 모든 기계에서 크게 증가합니다. 따라서 교차 상관 계수의 하한값을 0.7로 정의하고, 최소 사이클 완전성을 50%로 설정합니다.

섹션 2와 3에서 선택된 기본값에 대한 철저한 검토와 후속 검증을 기반으로, "false positives"를 피하면서 자동 운용 가능성과 실용성을 보여줍니다.

박관용

이전 포스트