Adsp 준비 (7)

Spirit Lab·2025년 5월 15일


1.ERP: 기업 자원 관리 시스템 (재무, 회계, 생산)
2. NEIS: 국가 교육행정정보시스템
3. KMS: 지식 관리 시스템 (조직 내 지식 저장 및 공유)
4. RTE: 실시간 업무처리 가능한 기업 환경 또는 시스템 구조


왜 맞췄는데 바꾸는 거냐


이거 좀 헷갈림


분석 준비도 점검
데이터 인프라 준비 상태 - 조직 문화 및 리더십 - 인력 역량 - 분석 업무 파악

분석 업무파악은 무엇을 분석하느냐에 관한 것
(분석 업무 라는 말이 들어가면 됨)
분석기법의 적절성은 어떻게 분석하느냐에 관한 것

6단계

업데데모평전

업무이해-데이터이해-데이터준비-모델링-평가-전개


집중형 조직 구조는 조직 내 별도의 분석 전담조직을 독립적으로 구성하는 것으로써 분석 업무의 중복 또는 이원화의 이슈가 있다.
한마디로 짬맞음

기능 중심의 조직 구조는 별도의 분석 전담 조직을 구성하지 않고 해당 업무 부서에서 분석을 수행함으로써 국한된 분석 수행 문제
한마디로 전문성 나락

분산구조는 분석조직 인력들을 현업부서로 배치하여 분석 업무를 수행함으로써 분석이 집중되지 못해 신속한 실무적용이 어렵다.
한마디로 겉돌음


마할라노비스는 통계적 개념이 포함된 거리이며 변수들의 산포를 고려하여 이를 표준화한것임


다차원 척도법: 2차원 혹은 3차원 공간상에 점으로 표현, 유클리드 거리사용


matrix: 2차원 행렬, 동일 타입 저장
array: 다차원 배열, 동일 타입 저장
vector: 1차원 연속 값, 동일 타입 저장
list: 다양한 타입을 혼합해서 저장 가능

홀드아웃(Hold-out)은 전체 데이터를 훈련/검증 세트로 나누어,
새로운 데이터에 대한 일반화 성능을 평가하고 과대적합을 막는 방법입니다

선수 1군으로 올리기 전에 홀드해서 훈련/검증해서 내보내는 (out) 것

명목척도 : 남/여 , mbtI .. 양적인 데이터와 무관함

순서척도 : 1>2>3 .. , 만족>매우만족 등 한정적

등간척도 : 온도, 섭씨, 화씨.. 등등

비율척도 : 거의 모든 수치형 데이터가 포함 키, 몸무게 ,소득 등등

정상시계열로 전환하는 방법

추세가 있는 경우(평균이 일정하지 않은 경우): 차분

계절성을 갖는 비정상시계열의 경우: 계절차분

분산이 일정하지 않은 경우: 변환(자연로그)

데이터에 따라 차분 또는 변환으로 정상시계열을 만든다


검증용 데이터는 직접 학습에는 사용되지 않지만,
모델 조정과 과적합 방지 등 학습 과정의 중요한 일부로 사용

학습은 모델을 만드는 과정,
검증은 모델이 잘 만들어지고 있는지 점검하는 과정
교과서와 시험 문제는 다르듯이
학습데이터와 검증데이터는 엄연히 다름

교차검증: 데이터를 여러 조각으로 나눠가며 학습과 검증을 반복해서
모델이 특정 데이터에만 치우치지 않도록 평가하는 방법
대표적으로 Hold Out, K겹 교차검증
데이터가 적어도 유용 과적합 줄일 수 있음 데이터 손실 없음 but 연산량 많아서 비용 증가

profile
For the champagne

0개의 댓글