고장, 이상, 결함 등을 학문적으로 일컫는 말.이상을 감지하는 솔루션 vs 결함을 진단하는 솔루션이 차이가 남Fault Diagnostics: 이상이 발생한 원인에 대한 분석까지Fault Detection: 어떤 문제가 발생했음을 인식Prognostics: 고장이 발생
PHM은 데이터의 양이 많기 때문에 시간이 지날수록 기울기 소실이 일어나는 기존의 딥러닝 체계에서 기울기 소실이 일어나기 어려운 LSTM은 시계열 데이터 처리의 가장 기본으로 사용된다.가중치를 잘 초기화 하기 위해서 LSTM(Long Short-Term Memmory
진동 기초 용어 샘플링: 연속 값에서 변화하는 물리적 양의 측정 샘플링 주기: 두 개의 연속 샘플들 사이의 지속시간 샘플링 주파수: 균일하게 샘플링된 데이터에 대한 시간 단위당 샘플 수 샘플링 간격: 두 개의 연속된 샘플 사이의 단위 수 샘플링 속도: 균일하게
CNN(Convolutional Neural Network) CNN은 주로 이미지 분류에서 높은 정확도를 보이며, 많이 사용된다. 하지만 1차원 CNN은 이미지가 아닌 시계열 분석이나 텍스트 분석을 하는 데 주로 많이 사용된다. 여기서 1차원이라는 것은 합성곱을 위
np.empty: shape과 dtype을 입력받아 초기화되지 않은 배열을 만든다.np.power(m,n) = m^n, array와 실수, array와 array 사이에서도 가능.학습데이터셋 - NORMAL DATA데이터셋의 구조 - TIME, SENSOR전처리는 TI
웨이블릿 변환 임의의 신호를 웨이블릿으로 정의되는 함수들로 분해하는 방법 특정한 규칙에 따라 모델링된 웨이블릿 함수의 시간 스케일을 바꿔가며 원본 신호와의 상관 계수를 계산해 변환 가능. 웨이블릿을 시간축 방향으로 이동시켜가며 원본 신호와의 상관계수를 계산하고,
동적 신호를 분석하기 위한 훨씬 더 나은 접근 방식은 푸리에 변환 대신 웨이블릿 변환을 사용하는 것 웨이블릿 변환 푸리에 변환의 문제점은 주파수 영역에서 고해상도, BUT 시간 영역에서 0해상도. STFT 는 신호를 10개 부분으로 나누고 푸리에 변환이 두 번째
rotor fault detection of introduction motors using stator current signals and wavelet analysis Eccentricity related faults stator와 rotor 사이의 불균형한 ro
전이학습은 시간을 절약하는 방식으로 정확한 모델을 구축할 수 있다. 다른 문제를 해결할 때 학습한 패턴에서 시작하기 때문에 처음부터 시작하지 않아도 된다. 이를 사전 훈련된 모델을 사용한다고 표현하는데 VGG, Inception, MobileNet에서 모델을 가져와 사
딥러닝에서 가중치를 초기화하는 것은 매우 중요하다. 각 뉴런들은 가중치 값을 갖고 있고, 이것을 학습하여 어떠한 '지식'의 형태로서 문제를 해결한다. 첫 위치를 잘 정하는 것이 좋은 학습을 위한 조건이기 때문에 상황에 맞는 적절한 가중치 초기화 방법을 찾게 되었다.Ze
ckpt: 딥러닝 모델을 제외한 가중치만 있는 파일이다. 모델의 구조는 저장하지 않는다. pb: 모델 구조와 가중치 모두 저장된 파일. 그래프를 프리징시킨다라고 하면 pb파일을 만드는 것이다.h5: h5파일은 hdf5하고도 같은 말이며 Hierarchical Data
df.rename 으로 바꿀 수 있다. 오류 ValueError: Input X contains infinity or a value too large for dtype('float32'). 와 같은 에러가 발생할 시 null값을 확인하는 것이 최우선이지만, 소수
모델을 전이학습시키려고 for 문으로 인덱스를 사용하여 불러오더니 타입이 모델에서 리스트로 변경되었다. 이 문제점을 다음과 같은 방법으로 해결하였다.
전이 학습을 통해 기본적으로 한 Task에서 배운 것을 다른 Task에서의 일반화를 향상시키기 위해 이용할 수 있다.컴퓨터 시각에서 신경 네트워크는 대개 이전 계층의 가장자리, 중간 계층의 모양 및 후기 계층의 일부 직무별 특징을 탐지하려고 한다. 전이학습에서는 초기층
MFCC Mel-Frequency Cepstral Coefficient의 약자로 한글로 풀이하면 멜 주파수 중심 계수이다. Mel은 사람의 달팽이관을 모티브로 따온 값이라고 생각하면 된다. 달팽이관의 각 부분은 각기 다른 진동수를 감지한다. 이 달팽이관이 감지하는 진
달팽이관의 특성을 고려해서 낮은 주파수에서는 작은 삼각형의 필터를 가지고, 고주파 대역으로 갈수록 넓은 삼각형의 필터를 가진다고 생각하면 된다.그래서 위와 같은 삼각형 필터 n개를 모두 적용한 필터를 멜 필터 뱅크라고 부른다. 그래서 멜 스펙토그램이라는 특징이 만들어
DCT 멜 스펙토그램을 dct 처리하면 얻게되는 연관계수를 mfcc라고 한다. 즉 mel scale로 변환한 스펙토그램을 더 적은 값들로 압축하는 과정이라고 할 수 있다. 이미지를 압축하는 과정에서도 쓰이는 변환이다.
개념 비지도 Anormaly Detection 중 하나로 현재 갖고 있는 데이터 중 이상치를 탐지할 때 주로 사용된다. tree 기반으로 구현되고, 랜덤으로 데이터를 split하여 모든 관측치를 고립시키며 구현된다. 변수가 많은 데이터에서도 효율적으로 작동한다는 장점
FFT(Fast Fourier Transform)연산을 수행할 때, 화면에 포착된 신호의 앞과 끝이 일치하지 않는 경우가 발생할 수 있다. 이렇게 이어지는 윈도우와 완벽하게 일치하지 않는 불연속에 의해서 발생하는 이슈에 대해서 다루는 것이 window라고 불리는 테크닉
전후
푸리에 변환은 신호를 무한한 시간 동안을 대상으로 하기 때문에 유한한 시간의 샘플을 사용하면서 샘플의 끝 구간의 문제로 인해 오류 정보를 가지게 된다. 어치파 현실적으로 활용하려면 샘플의 수는 제한될 수 밖에 없으니 오류를 해결할 방법을 만들어야 한다. 이를 해결하기
구름(rolling)요소 베어링의 외륜, 내륜, 구름요소 혹은 케이지에 결함이 발생하면, 구름요소가 결함부를 지나면서 베어링 고장 주파수의 충격 가진이 생선된다. 이로 인해서 베어링의 고유 진동수에서 진동이 발생하게 되고, 베어링 고장 주파수가 고유 진동수에 의해서 진
진동수의 단위로 독일의 과학자 하인리히 루돌프 헤르츠의 이름에서 유래되었다. 사이클과 역수 단위를 가지며 1초 동안에 1000개의 파동이 지나가면 1000Hz이다. 1 헤르츠는 진동 현상이 있을 때, 1초에 한 번 왕복 운동이 반복됨을 의미한다.분당 회전수로 총 회전
설비의 결함분석을 위해 스펙트럼의 주파수 하모닉 성분을 확인하게 되는데, 하모닉은 설비진단에서 공공으로 명명된 1X의 배수 성분을 말하며, 스펙트럼에서 나란히 회전주파수의 간격을 두고 피크로 확인된다.하모닉이 발생하는 원인은 여러 가지가 있으나 주로 비선형, 비대칭파형
DAQ 장치는 Data AcQuisition 의 줄임말로 데이터를 수집하는 장치를 말한다.분석프로그램은 DAQ 장치를 통해 수집한 센서의 데이터를 처리하는 프로그램으로 fft, psd, octave 분석 등의 다양한 기능을 가지고 있다.양면테이프는 진동을 측정하고자 하
진동을 통한 설비진단을 하기 위해서 기본적으로 알고 있어야 할 세가지진폭주파수위상위상은 기준에 대한 비교각도를 의미한다. 절대위상측정을 하는 구체적인 방법은 우선 RPM 센서를 설치하고 원하는 센서를 읽어서 반복된 구간을 도시하여 비교지점을 체크한 후, 그 차이를 직접
주어진 진동신호를 별다른 처리 없이 딥러닝 모델의 입력 신호로 사용하고 모델의 출력값으로 목표로 하는 컴프레서의 건전성 상태를 MAPPING한다.많은 데이터를 0.012씩 잘라 윈도윙했을 때도, 모델을 훈련시키기에 충분한 데이터의 양이 존재함.데이터 불균형 해결. SU
정상 데이터만으로 LSTM 구조의 Generator와 Discriminator를 학습하여 정상 데이터의 분포를 학습함새로운 input의 optimal latent space를 기방으로 생성한 reconstructed sample과 input의 reconstruction
sklearn의 one-hot-encoding 할 시, 순서대로 인코딩되지 않는다. 알파벳의 순서별로 인코딩되는데, 정확히 알아보기 위해 categories를 사용할 수 있다.
Type Error: Can't convert CUDA tensor to numpy gpu에 할당되어 있는 텐서를 넘파이로 변환할 때, 생기는 에러gpu에 할당되어 있는 텐서는 넘파이로 변환되지 못한다..cpu()를 사용하여 gpu에 할당된 텐서를 cpu 텐서로 변환해
보편적인 모델을 만들기 위한 생각 센서에 측정되는 값은 설비 안의 모든 진동이 합쳐져서 나온 것 원래 센서에 측정되는 값은 1차원의 값이 아니라 적어도 수백차원의 값이 그냥 합쳐진 것 fft 그래프에서 hz 마다 진폭 x cosine + b 의 값이 존재한다. 이
대충은 알고 있는 사안들이지만 짚고 넘어가야할 것 같다.다중 클래스 분류는 두 개 이상의 클래스가 있고, 각 인스턴스가 해당 클래스 중 하나에만 할당될 수 있는 분류 작업이다. 예를 들어 동물 이미지를 개, 고양이 또는 새와 같은 범주로 분류하는 경우 각 이미지는 이러
GNN의 배경 기존 머신러닝은 유클리드에 잘 적용된다. 그 이유는 선형회귀와 같은 머신러닝 모델들이 대부분 가정하는 것이 특징이 서로 독립적이기 때문이다. 유클리드 데이터가 아닌 것들은 그래프 또는 트리 구조를 가진 데이터를 말한다. 그래프틑 연결된 edge들이 방
실무 입장에서는 복잡한 모델을 이용하여 성능을 높이기보다는 scoring 산출 방식등을 변경하여 사용하는 것이 효율적최적 모델을 선정하는데 평가 기준 지표에 대한 연구 필요point outliercontextual outliercollective outlierlocal
pycaret으로 비정상을 탐지하는 빠른 코드 제조 가이드라인
setup이 로드되어야 한다.setup의 파라미터는 classification, regression, anormaly 에 따라 달라질 수 있다.model()compare_models()Setup된 데이터를 각각 머신러닝 모델에 적용 후 비교한다.create_model(
쓰는 이유 시계열 클러스터링에 대한 가장 일반적인 접근 방식은 시계열을 각 시간 인덱스에 대한 열이 있는 테이블로 평면화하고 k-means와 같은 표준 클러스터링 알고리즘을 직접 적용하는 것이다. Unsupervised learning으로 하지만 시계열로 되어 있는
압력배관에 센서를 설치해 압력 오차범위를 벗어나면 경고오일과 같은 연료에 대해 주로 모니터링공동현상유체의 속도 변화에 의한 압력 변화로 인해 유체 내에 공동이 생기는 현상을 공동현상이라고 한다. 공동현상은 빠른 속도로 액체가 운동할 때, 액체의 압력이 증기압 이하로 낮
데이터에 상관관계가 0.8보다 큰 열이 많은 상황에 직면했을 때, 변수 간의 다중공선성이 높다는 것을 의미한다. 다중공선성은 불안정한 계수 추정 및 개별 변수가 대상 변수에 미치는 영향을 해석하는 일에서 문제를 일으킬 수 있다.해결방법은 다음과 같다.중복 변수 제거기능
동일한 컬럼을 여러 개 추가하면 해당 컬럼의 중요도가 증가할까? 동일한 데이터가 반복되면 모델이 학습할 수 있는 새롭거나 유용한 정보를 제공하지 않는다. 또한 모델에서 해당 컬럼에 대해 가중치를 주는 방법은 존재하지 않음 pca는 데이터 세트의 차원을 줄이고 정보
예제 풀이
다음과 같은 방법으로 confusion matrix를 구할 수 있다. 이 때 label은 labelencoding 한 숫자로 변환되는데 이를 다시 decoding 가능하다.위와 같은 방법으로 변환 가능하다.Seaborn heatmap에서 parameter는 다음과 같다
정상 데이터가 가진 특징을 기반으로 이와 다른 결과가 발생하였을 때, 비정상 데이터로 탐지사전학습 모델을 활용하여 학습 과정 없이 정상 데이터의 feature를 추출하여 비정상 이미지를 탐지하는 모델 제안정상 데이터의 특징을 효과적으로 저장하여 적은 양의 정상 이미지