250220 TIL

수이·2025년 2월 20일
0

🟡 TIL

목록 보기
13/41

팀스터디

아티클스터디

데이터 리터러시(Data Literacy)를 올리는 방법

  • 요약 : 데이터 리터러시의 중요성과 향상법

    • 데이터/실험 기반 사고방식
      • 업무 진행 시 실험을 하는 방식으로 진행
      • 문제 정의 - 솔루션 - 측정 지표의 프로세스
    • 분석 흐름대로 데이터를 탐색할 수 있는 환경
      • 데이터맵 : 문제 정의에 도움 인풋 지표와 아웃풋 지표간 관계를 표현한 관계도 제작
      • 대시보드 : 지표의 현재 수준 확인 가능
    • 이 과정을 도와주는 분석가
      • 데이터 분석가 역량 있는 분석가 채용 구체적 Job Description 공지
      • 데이터 플랫폼 데이터를 빠르게 준비해 사용할 수 있는 구조 필요
  • 주요 포인트 : 데이터 리터러시는 개인의 역량도 중요하지만 그를 받쳐주는 환경도 중요하다는 것을 깨달았습니다. 어떤 팀에 가느냐에 따라 성장 속도도 달라질 것 같네요.

  • 핵심 개념 :

    • 데이터 리터러시 : 데이터를 활용해 문제를 해결할 수 있는 능력
  • 용어 정리 :

    • 데이터 레이크 : 모든 원천데이터가 적재되어있는 곳
    • 데이터 웨어하우스 : 데이터를 추출할 수 있도록 구조화된 곳
    • 데이터 카탈로그 : 데이터레이크/웨어하우스 내 어떤 데이터가 있는지 쉽게 확인할 수 있도록 만들어주는 것

팀원 공통 인사이트
단순한 데이터 분석을 넘어 실질적인 실행 방안을 제시하는 것이 중요하며, 이를 효과적으로 구현하기 위해 적절한 환경 또한 뒷받침되어야 합니다.

개인스터디

ADsP 자격증 챌린지 7주차

중요부분 ✅표시!

통계 분석의 이해

통계

분석하고자 하는 특정집단을 대상으로 수행한 조사나 실험을 통해 얻은 자료 및 요약된 형태의 표현

  • 모집단
    정보에 대한 대상
    우리가 보고싶은 전체의 대상

    • 유한모집단 : 유한 개의 개체
    • 무한모집단 : 무한 개의 개체 / 개념적으로 상정된 모집단

통계 자료 획득 방법

  • 전수조사 : 대상 집단 모두 조사
    많은 비용과 시간이 소요됨
  • 표본조사 : 모집단을 대표할 수 있는 표본을 추출하여 조사
    표본의 대표성을 신뢰할 수 있어야 함
    • 표본 : 조사하는 모집단의 일부
    • 모수 : 모집단에 대해 알고자 하는 값(모집단의 특성치)
    • 통계량 : 모수를 추론하기 위해 구하는 표본의 값
      데이터를 요약한 수치

표본 추출 방법✅

  • 단순 랜덤 추출법 : 임의로 선택해 추출
    ex) 사다리타기, 제비뽑기

  • 계통 추출법 : 순서대로 나열한 후 n개의 구간으로 나누고, 첫 구간에서 하나를 임의로 선택한 후 K개씩 띄워 표본 추출

  • 집락(군집) 추출법 : 몇 개의 집락이 결합된 형태로 구성
    일부 집락을 랜덤으로 선택하고 선택된 각 집락에서 표본 임의 선택

  • 층화 추출법 : 이질적인 원소들로 구성된 모집단에서 각 계층을 고루 대표할 수 있도록 표본 추출
    유사한 것끼리 몇개의 층으로 나눈 후, 각 층에서 표본을 랜덤하게 추출

    • 비례 층화 추출법 : 각 집락별로 추출되는 데이터 개수를 전체 데이터 분포의 비율과 동일하게 유지하여 표본 추출
    • 불비례 층화 추출법 : 전체 데이터 분포를 반영하지 않고 각 집락에서 원하는 개수의 데이터를 추출

측정과 척도✅

  • 질적척도 : 범주형 자료, 숫자 크기 차이 계산 X
    • 명목척도
      어느 집단에 속하는지
      ex) 성별, 출생지, 대학교
    • 순서척도
      특성이 가지는 서열관계
      ex) 선호도, 신용도, 학년, 순위
  • 양적척도
    수치형 자료, 숫자 크기 차이 계산 가능
    • 구간척도
      속성의 양 측정, 간격이 의미가 있는 자료
      ex) 온도, 지수
    • 비율척도
      절대적 기준인 0값이 존재하고 모든 사칙연산이 가능, 정보多
      ex) 무게, 나이, 연간소득, 시간, 거리, 제품가격

기술통계와 추리통계✅

  • 기술통계
    데이터에서 특징을 뽑아내기 위한 기술
    기초적 통계
  • 추리통계/통계적 추론
    미래의 일에 대해 추측하는것 (부분으로 전체 추측)
    회귀분석, 시계열분석

기초 통계용어

  • 자료 : 데이터
  • (모)평균(기댓값) : 산술평균 / 가장 대표적
  • 중앙값 : 자료를 순서대로 나열했을때 가운데 위치한 값
  • 최빈값 : 데이터 집합에서 가장 자주 등장하는 값
  • 분산 : 데이터의 흩어진 정도
  • 표준편차 : 분산의 제곱근
  • 백분위수 : 특정 백분율 위치에 있는 데이터값
  • 첨도 : 자료가 평균에 얼마나 밀집해있냐
  • 왜도 : 확률분포의 비대칭도
    • 0인 경우 : 좌우대칭
    • 양수 : 왼쪽으로 밀집
    • 음수 : 오른쪽으로 밀집
  • 상관분석 : 두 변수간 관계를 분석 / 공분산, 상관계수 활용
    • 공분산 : 두 변수간 상관관계
      양수 : 선형관계
      음수 : 음의 선형관계
  • 상관계수 : 선형 관계의 강도와 방향

데일리퀘스트

SQL - 동물 수 구하기
SQL - 동명 동물 수 찾기
SQL - 아픈 동물 찾기
Python - 숫자 비교하기
Python - 두 수의 합
Python - 두 수의 나눗셈


일기

오늘 요약사진 .. ..

  • ADSP 7주차 복습✅ 아답터🔼 모의고사 2회✅ 오답노트🔼
    오답노트 판 짜놓기는 성공 . . . 이제 다시 쭈욱 풀어봐야 한다 근데 3과목에서 너무 틀리는 게 많아서 아답터 강의 다시 듣고 있는데 나 진짜 박대갈이인가 라는 생각이 듬🥲 내일은 다 빼고 아답터 > 모의고사 > 오답노트만 하는 걸 목표로 해야겠다 토요일이 벌써 시험이라니 믿기지가 않고요..네네..

  • SQL 코드카타 5-7✅
    쉬웠는데 HAVING 절 개념을 아직 제대로 못 잡는 것 같아서 쥐피티햄한테 한번 더 물어봤다 WHERE랑 구분할 것 잊지마 알겠니? 알겠냐고

  • Python 코드카타 5-7✅
    파이썬을 나는 처음 공부로 잡았어서 기억 나는 게 없으면 어떡하지? 했는데 아직까지는 EZ. 반복문 나올때쯤엔 또 이마 빡빡 때리고 있을 것 같다

  • 직무특강에서 느낀점

    • 본인의 발자취를 자신있게 소개하고 설명할 수 있다는 게 굉장히 멋있다고 생각했음 튜터님들 짱이다
    • 떠먹여주는 연습을 하자
    • 자신만의 도메인 가질 것
    • 프로젝트+대회 참여(개인경험) 너무너무 중요하다

오늘도 직무세션이 연달아 있어서 개인 시간이 없었다
생각보다 개인 공부 시간이 업서....
모의고사 풀고 자야지 🥲

0개의 댓글

관련 채용 정보