시계열 분석은 데이터가 수집된 도메인에 따라 분석의 목적과 해석 방식이 달라진다.
그렇기 때문에 데이터에 시계열 분석을 적용하고자 할 때는 해당 분야에서 자주 사용되는 용어를 미리 파악하는 것이 필요하다.
이 글에서는 의료, 금융, 리테일, 기상, 천문, 뇌신경 등 주요 도메인별 시계열 데이터의 특성과 함께 분석 시 자주 등장하게 되는 용어들을 정리해 보았다. 시계열 분석을 도메인에 맞게 해석하고 적용하기 위해 반드시 이해하고 있어야 할 부분이라 생각된다.
아직 각 도메인에 대한 경험이 부족하기 때문에 용어 정리가 미흡할 수 있다.
데이터를 분석하게 되는 상황이 오면 그때 제대로 뜯어보는 것도 중요하지만, 도메인에 따라 시계열이 어떤 의미를 가질 수 있는지 더 넓은 시각으로 이해하기 위해 기본적인 용어들을 정리해 보았다.
의료 시계열하면 바로 떠오르는 것에 생체 신호 등이 있다.
의료 시계열 데이터는 환자의 생체 상태를 연속적으로 모니터링하여 즉각적인 반응, 이상 탐지, 치료 반응 분석 등에 활용된다. 대부분 초 단위 또는 밀리초 단위의 짧은 단위에서 높은 해당도를 가지는 시계열이다. 실시간성(real-time)과 급격한 변동이 중요하게 작용하므로 해석의 민감성이 중요한 특징이다.
주요 분석 대상은 심박수(HR), 뇌파(EEG), 산소포화도(SpO₂), 체온, 호흡률 등이며, 질병 조기 감지나 응급 상황 예측을 위한 이상치 탐지와 주기적 패턴 분석이 중요하다.
시간 간격이 일정하지 않은 경우도 많아 전처리가 핵심이 된다.
ECG / EEG
→ 심전도 / 뇌전도
→ 심장 또는 뇌의 전기적 활동을 시간 순서대로 측정한 생체 신호HRV (Heart Rate Variability)
→ 심박변이도
→ 자율신경계 반응, 스트레스, 심장 건강 상태 평가 지표SpO₂ (Peripheral capillary oxygen saturation)
→ 혈중 산소 포화도
→ 산소 공급 상태를 나타내며, 90% 미만이면 저산소증 의심ICU Monitoring
→ 중환자실 실시간 모니터링
→ ECG, SpO₂, 호흡률, 혈압, 체온 등 다중 생체 신호의 시계열 통합 모니터링Artifact
→ 센서 접촉 불량, 움직임, 전기적 간섭 등으로 발생하는 비생리적 잡음Baseline Drift
→ 신호의 기준선이 서서히 변하는 현상 (ECG에서 호흡에 의한 기준선 흔들림 등)Epoch
→ 분석 단위 시간 구간 (보통 1초 또는 0.5초 단위로 나누어 처리)Sampling Rate
→ 초당 데이터 수집 횟수 (Hz 단위, EEG는 256Hz 또는 512Hz 사용)ERP (Event-related Potential)
→ 특정 자극(시각, 청각 등)에 대한 뇌의 시간적 반응
→ 자극 후 수백 ms 동안의 신호를 분석하여 인지 반응을 해석함Vital Signs
→ 생체 징후(ECG, 혈압, SpO₂, 호흡률 등)의 시계열 데이터를 통칭Telemetry
→ 원격 생체 신호 모니터링 시스템
→ 주로 병원 내에서 사용되며 중앙 모니터에 실시간으로 시계열 데이터를 전송Trend Alarm
→ 시계열 데이터를 기반으로 한 임계값 기반 경고 시스템
→ e.g., 심박수가 10분간 꾸준히 감소할 경우 경고 발생
주가, 환율, 거래량 등 가장 대표적인 시계열 데이터 중 하나로, 예측보다 위험 관리와 이상 탐지에 많이 활용된다.
금융 데이터는 시장 참여자의 심리, 경제 흐름, 글로벌 이벤트가 수치로 반영된다. 초 단위 고빈도 데이터부터 연 단위 장기 시계열까지 다양한 시간 해상도를 가진다. 추세 분석, 리스크 예측, 이상 탐지, 자산 가격 예측이 주요 목적이다.
금융 시계열은 자기상관성이 강하고, 외부 변수의 영향으로 인해 비정상성을 보이는 경우가 많다. 따라서 로그 수익률 계산, 차분, 변동성 추정(ARCH/GARCH 모델 등) 등이 자주 활용된다.
계절성과 이벤트 효과도 매우 민감하게 작용한다는 특징이 있다.
OHLC
→ 시가(Open), 고가(High), 저가(Low), 종가(Close)
→ 캔들차트(Candlestick chart)의 기본 구성 요소로, 주가 흐름을 요약 표현함Volatility
→ 수익률의 표준편차로 측정되는 가격의 변동성
→ 위험(Risk)을 측정하는 주요 지표, GARCH 모델 등에서 활용Moving Average(MA)
→ 과거 일정 기간 동안의 가격 평균
→ 단기(5일), 중기(20일), 장기(60일, 120일) 등 다양한 길이로 사용하며 추세 분석에 활용됨RSI(Relative Strength Index), MACD(Moving Average Convergence Divergence)
→ 모멘텀과 추세 전환을 포착하는 기술적 분석 지표Return
→ 수익률
→ 보통 로그 수익률(log(Pₜ/Pₜ₋₁))로 계산하며, 분포가 더 정규성에 가까움Seasonality
→ 특정 시점(월, 분기 등)마다 반복되는 수익률의 패턴
→ 배당 월, 회계 연도 마감, 연말 랠리 등이 대표적Stationarity
→ 평균과 분산 등 통계적 특성이 일정한 상태
→ ARIMA, GARCH 등 시계열 모델의 전제 조건Log Return
→ 로그 수익률
→ log(Pₜ / Pₜ₋₁)로 계산되며, 일반 수익률보다 안정적인 분포 특성을 보여 통계 모델링에 적합Volume
→ 거래 활발도(거래량)를 나타내며, 가격 변동과 함께 분석되어 매수·매도 심리를 파악하는 데 사용Drawdown
→ 최고점 대비 하락률
→ 자산 가치가 고점에서 얼마나 떨어졌는지를 나타내는 지표, 리스크 평가에 사용Sharpe Ratio
→ 수익 대비 위험의 비율
→ 동일한 수익률이라도 변동성이 작을수록 더 높은 성과로 평가됨High-Frequency Data
→ 초 단위, 밀리초 단위의 거래 정보
→ 고빈도 트레이딩(HFT)에서 사용되며, 매우 짧은 시간 간격의 시계열로 분석됨Cointegration
→ 두 개 이상의 비정상 시계열이 장기적으로 안정적인 관계를 가질 때
→ e.g., ETF와 기초자산 간 관계, 스프레드 트레이딩 전략에 활용Volatility Clustering
→ 큰 변동 후 큰 변동, 작은 변동 후 작은 변동이 이어지는 현상
→ GARCH 모델이 이 특성을 반영하여 시계열의 위험 예측에 활용
리테일 분야에서는 고객의 구매 행동이 시간 흐름에 따라 어떻게 변화하는지를 파악하는 것이 핵심이다. 제품별 판매량, 방문자 수, 장바구니 크기 등이 시계열 형태로 수집되며 프로모션 효과, 반복 구매, 시즌별 수요 변화, 이탈률 등을 분석한다.
리테일 시계열은 주기적인 패턴(월간, 계절별)과 마케팅 캠페인에 의한 비정상적 수요 증가를 동시에 다뤄야 한다. 시계열 분해, 이상 감지, 시차 효과 분석 등이 자주 사용되며 고객 세그먼트별 행동 흐름도 시계열 분석의 주요 대상이다.
Sales Velocity
→ 단위 시간당 판매 속도 (예: 일간 판매량 증가율)
→ 제품별 혹은 카테고리별로 시계열 분석에 자주 사용Stock-Out Rate
→ 특정 시간 동안 품절이 발생한 비율
→ 판매 손실 추정 및 공급 계획 시 중요한 시계열 변수Promotion Calendar
→ 정기적 프로모션 일정표 (예: 매월 마지막 금요일 세일)
→ 주기적 패턴 탐지 또는 계절성 보정 시 활용Customer Cohort
→ 유입 시점 기준으로 고객을 그룹화하여 장기 구매 추세를 분석
→ 월별 유지율, 월별 평균 구매액 등의 시계열 지표 생성Repeat Purchase Rate
→ 일정 기간 내 재구매한 고객의 비율
→ Retention 지표와 함께 시계열로 추적하여 마케팅 효과를 평가Inventory Turnover
→ 재고가 소진되는 속도
→ 월별 또는 주별 분석을 통해 공급/재고 최적화를 위한 시계열 모델에 활용Markdown Timing
→ 가격 인하 시점이 매출에 미치는 영향
→ 가격 변경 후 며칠 뒤 수요가 반응하는지 lag 효과와 함께 분석Sell-Through Rate
→ 입고된 제품 중 일정 기간 내 실제로 판매된 비율
→ 주별·월별 트렌드 파악 및 재고 효율성 평가에 중요Lead Time
→ 주문부터 제품 입고까지 걸리는 시간
→ 시계열 상 재고 예측, 공급망 분석, 수요 충족률 계산에 핵심 요소Demand Forecast Error(DFE)
→ 예측 수요와 실제 수요 간의 차이
→ 예측 모델의 정확도를 시계열로 모니터링하고 개선할 때 사용Seasonal Index
→ 각 월이나 주별로 평균 대비 얼마나 높은 수요가 발생하는지를 나타냄
→ 계절성을 수치화하여 시계열 모델에 반영Price Elasticity Over Time
→ 가격 변화에 따른 수요 민감도를 시계열로 분석
→ 시간 흐름에 따른 탄력성 변화를 통해 프로모션 시점 최적화 가능Cannibalization Effect
→ 신상품이나 프로모션이 기존 상품 판매를 얼마나 잠식했는지
→ 시계열 판매 패턴을 통해 기존 제품의 매출 감소 시점 분석 가능Day-of-Week Effect
→ 요일에 따른 방문자 수·구매율의 시계열 패턴
→ 특히 오프라인 매장이나 식음료 리테일에서 주간 리듬 분석에 중요Lagged Demand Impact
→ 특정 마케팅 이벤트, 프로모션, 가격 변화가 며칠 후 수요에 어떤 영향을 주는지
→ 시계열 모델에서 lag 변수로 반영하여 효과 측정
기상 데이터는 명확한 계절성과 주기성을 가진 시계열 데이터의 전형이다. 매일, 매시간 측정되는 기온, 강수량, 풍속, 습도 등의 데이터를 통해 기후 변화 탐지, 예보, 이상 현상 탐지가 이루어진다. 특히 기후 정상값(Climate Normals)과의 비교를 통해 기상이변을 식별할 수 있다.
기상 시계열은 일반적으로 데이터 수집이 오랜 기간 동안 누적되어 있고, 계절성의 패턴이 뚜렷하기 때문에 분해 분석, 예측 모델(Prophet, SARIMA), 이상 탐지 알고리즘이 자주 사용된다. 예측 정확도가 사회 전반에 영향을 미치므로 실용성이 매우 높다.
Rainfall Intensity
→ 일정 시간(예: 1시간) 동안 내린 강우량
→ mm/hr로 표현되며, 단기 강우량 예측이나 홍수 위험 분석에 활용Anomaly Detection
→ 평년과 다른 이상 기후, 급격한 변화 등 예외적 패턴을 탐지
→ 장기 기후 모니터링 및 이상 강수/온도 이벤트 탐색에 사용Climate Normals
→ 과거 30년간의 월별/일별 평균값으로, 현재 데이터를 비교 평가하는 기준선
→ e.g., “평년보다 2도 높다”Seasonal Cycle
→ 계절별 반복되는 주기성 (겨울의 저온, 여름의 강수 증가 등)
→ 일반적으로 연 단위(12개월) 주기성을 의미함Forecast Horizon
→ 예측 모델이 다루는 시간 범위
→ 단기(13일), 중기(12주), 장기(수개월~수년)로 나뉨Precipitation
→ 비, 눈, 우박 등 모든 형태의 강수/강설을 포함
→ 총 강수량 또는 강수 발생 유무(이진값)로 활용됨Drought Index
→ 특정 지역의 건조 정도를 나타내는 지표 (SPI, PDSI 등)
→ 누적 강수량 기반의 장기 시계열로 분석됨Temperature Anomaly
→ 기준 연도의 평균 기온과의 차이
→ 기후 변화 분석에서 장기 추세로 활용Air Quality Index(AQI)
→ 대기 오염 수준을 지수화한 값 (PM2.5, NO₂, O₃ 등 포함)
→ 시간대별 오염도 변화 시계열 분석에 사용Wind Speed / Direction Series
→ 풍속 및 풍향의 시계열 정보
→ 태풍 예측, 해양 기상 분석 등에서 활용Evapotranspiration(ET)
→ 토양에서 증발되는 수분과 식물의 증산량 합산
→ 수문 순환 분석 및 농업 기상 모델에 포함됨Heatwave / Cold Spell Events
→ 연속적으로 이상 고온/저온이 지속되는 구간
→ 이벤트 발생 여부와 기간을 시계열에서 추적Snow Cover Extent
→ 눈이 덮인 지역 면적의 변화
→ 위성 기반 시계열로 기후 모니터링에 활용Extreme Event Frequency
→ 폭우, 태풍, 한파 등 극한 기상 현상의 발생 빈도
→ 장기 시계열로 기후 위험도 평가에 사용
천문 및 자연과학 시계열은 장기적인 패턴을 포착하는 데 중점을 둔 데이터다. 이 시계열은 주기적이지만 예측이 어려운 자연 현상을 분석하는 데 쓰인다.
대표적으로 태양 흑점 수, 지자기 지수, 우주 방사선 수치 등이 있으며, 보통 수년~수십 년 단위의 주기를 분석하거나 예외적 활동을 감지하는 데 사용된다.
자연 현상은 인위적 조작이 불가능하고, 외부 변수의 영향이 적기 때문에 순수한 자연적 주기성을 관찰하기에 적합하다. 이 분야에서는 주파수 분석(Fourier Transform), 이동 평균, 시계열 분해가 자주 활용된다.
Sunspot Number
→ 태양 흑점의 개수를 측정한 값
→ 태양 활동 지표로 사용되며, 시계열적으로 약 11년 주기성을 가짐Solar Cycle
→ 흑점 수, 태양 복사 에너지 등 태양 활동의 반복 주기
→ 평균 11년 주기(사이클 24~25 등으로 구분)로 분석Geomagnetic Index (Kp Index)
→ 지자기 폭풍의 강도를 나타내는 지수 (0~9 스케일)
→ 지자기 교란과 오로라 발생 가능성을 예측Cosmic Ray Count
→ 우주에서 지구로 도달한 고에너지 입자의 개수
→ 태양 활동이 강할수록 감소하며, 시계열 분석으로 장기 방사선 환경 추정 가능Solar Flare
→ 태양 표면에서 방출되는 고에너지 폭발 현상
→ 시간 단위로 발생 시점, 지속 시간, 강도를 기록한 이벤트 시계열로 분석Aurora Index
→ 극지방 오로라 발생 가능성을 나타내는 수치 (AE Index, OVATION 모델 기반 등)
→ Kp 지수와 연동되며 시간대별 시계열로 활용F10.7 Solar Flux
→ 태양에서 오는 10.7cm 파장의 무선 신호 세기
→ 태양 복사 에너지의 지표로, 일 단위 시계열로 사용됨Total Solar Irradiance(TSI)
→ 지구가 받는 태양 복사 에너지 총량
→ 기후 시뮬레이션 및 지구 복사 수지 모델에서 사용됨Planetary A Index(Ap Index)
→ Kp 지수를 하루 단위로 평균화한 값
→ 지자기 교란의 하루 단위 변동을 시계열로 표현Magnetopause Position
→ 지자기권의 외곽 경계 위치 변화
→ 태양풍 압력에 따라 시계열적으로 수축/확장됨Solar Proton Events(SPEs)
→ 태양 플레어 또는 CME로부터 발생한 고에너지 양성자 유입 이벤트
→ 방사선 경고 시스템이나 인공위성 보호 시나리오에서 중요Lunar Phase Series
→ 월령(月齡)의 주기적 변화 (29.5일 주기)
→ 조수 간만의 차, 생태계 리듬 등과 관련된 분석에 활용Earth Rotation Variability (LOD)
→ 지구 자전 속도의 미세한 변화 (Length of Day, LOD)
→ 밀리초 단위의 변화도 시계열로 축적되며 지각 운동이나 대기 영향 분석에 사용
뇌 신호 분석은 수 밀리초 단위의 초고해상도 시계열 분석을 필요로 하는 특수한 분야이다. 자극에 대한 반응, 주의 집중 상태, 수면 단계 분석 등 다양한 목적으로 EEG, fMRI 등의 데이터를 수집하며, 시간-주파수 분석이 핵심적이다.
신경과학 시계열은 짧은 시간 동안의 미세한 변화를 정밀하게 포착해야 하기 때문에 시계열의 미세 구조 분석, 잡음 제거, 주파수 대역별 에너지 분석이 중요하다. 각 실험은 반복 수행되며, 특정 자극(자극 시간 기준 epoch)을 중심으로 분석된다.
EEG Channel: 뇌파를 측정한 위치
→ 두피에 부착된 각 전극(채널)의 위치 (Fp1, Fz, Cz 등)
→ 각 채널은 뇌의 특정 영역에서 시계열 신호를 수집Alpha / Beta / Gamma Waves
→ 뇌파의 주파수 대역
→ α(8–12Hz): 휴식, β(13–30Hz): 집중, γ(30Hz 이상): 고차원 인지 등 상태와 연관Frequency Band Analysis
→ 특정 주파수 대역별로 뇌파 활동의 세기를 비교
→ 주의력, 졸림, 스트레스 등의 지표로 사용ERP (Event-Related Potential)
→ 특정 자극(시각, 청각 등)에 대한 뇌의 시간적 반응
→ 평균화된 파형으로 구성되며 밀리초 단위 분석에 적합Spectral Power
→ 주파수별 에너지 크기 (전력 스펙트럼 밀도)
→ 정신 상태나 질병과의 연관성 분석에 사용Time-Frequency Analysis
→ 시간과 주파수 정보를 동시에 고려하는 분석 방식 (Wavelet Transform 등)
→ 뇌파의 순간적인 변화를 더 정밀하게 추적할 수 있음Baseline Correction
→ ERP 등에서 분석 전 일정 구간을 기준선으로 잡아 신호를 정규화
→ 자극 전 상태와의 차이를 보기 위함Epoching
→ 연속된 EEG 데이터를 자극 전후로 일정 시간 구간(Epoch)으로 잘라 분석
→ 자극-반응 시계열을 정렬하여 평균 ERP 생성에 사용Trial Averaging
→ 여러 번의 자극에 대한 뇌 반응을 평균내어 노이즈를 줄이고 주요 반응을 부각
→ ERP에서 필수적인 처리 단계Artifact Removal
→ 눈 깜빡임, 근육 움직임, 전기적 간섭 등으로 발생하는 잡음을 제거
→ 시계열 전처리의 핵심 단계 중 하나 (ICA, thresholding 등 활용)PLV (Phase Locking Value)
→ 뇌 영역 간 위상 동기화 정도를 측정하는 지표
→ 시간에 따른 영역 간 상호작용 분석에 사용Connectivity Analysis
→ 두 개 이상의 뇌 채널 간의 상관관계 또는 인과 구조를 시계열적으로 분석
→ 기능적 연결성(FC), 유효 연결성(EC) 등을 포함Resting-State Dynamics
→ 자극이 없는 상태에서 측정된 자발적 뇌파의 시계열 특성
→ 우울증, 불안, ADHD 등에서 기저 신경 상태를 비교 분석하는 데 사용PSD (Power Spectral Density)
→ 주파수 영역에서 시계열 신호의 에너지 분포를 추정
→ FFT 또는 Welch’s method 등으로 계산됨BCI (Brain-Computer Interface) Time Series
→ 실시간 EEG 신호를 해석하여 컴퓨터 제어나 피드백을 제공하는 시스템
→ 시계열 예측, 분류, 이벤트 감지와 직접 연결됨
익숙하지 않은 도메인에서 어떤 속성들을 다룰 수 있는지 이해해 볼 수 있는 흥미로운 시간이었다. 관심있는 분야라면 간접 경험이라도 어떻게든 가까이 두려고 하는 것이 중요하겠다는 생각이 들었다.
시계열 데이터는 그 자체로도 다루기 복잡하지만 여기에 도메인 고유의 문맥과 용어가 더해지면 해석과 분석의 난이도는 훨씬 더 올라가겠다는 것도 예상할 수 있다. 지금은 이렇게 주요 용어들만 정리해 보았지만, 실제로 분석을 수행할 때는 분석 대상 분야의 특성과 용어를 정확히 이해하는 시간을 충분히 가져야겠다.
이 글에서 정리한 분야별 용어와 개념이 앞으로 도메인 특화 시계열 데이터를 다룰 때 확장해 나갈 수 있는 기반이 되었으면 한다.