250228 TIL

수이·2025년 2월 28일
1

🟡 TIL

목록 보기
19/45

팀스터디

아티클스터디

  • 요약 : 데이터 아키텍처의 개념
    • 원천 데이터 → 추출, 형태 가공
    • ETL
      • 용도에 맞게 변형
      • 추출(Extraction) → 변환(Transformation) → 적재(Load)
    • 데이터웨어하우스
      • 구조화된 데이터를 저장하는 곳
      • 필요할 때 빠르게 조회할수있도록 설계
    • 데이터레이크
      • 정형 뿐 아니라 반정형, 비정형 데이터도 저장
      • 웨어하우스의 한 종류
    • 데이터 마트
      • 특정 부서나 목적에 맞는 일부 데이터만 필요할때 사용
      • 작은 규모 → 효율적 관리와 접근, 성능 증가
      • 맞춤형 데이터 제공 → 정확하고 효율적인 의사결정 가능
      • 보안과 보호 → 민감한 데이터를 다루는 조직에 특장점
    • 활용사례
      • 기업 내부 핵심 부서별 활용
      • 개발 및 테스트 환경
      • 데이터 전문가
      • 일반적인 운영 및 보고
      • 건강, 교육, 공공, 물류 등 다양한 분야에서 활용
  • 주요 포인트 :
    • 데이터 아키텍처의 개념에 대해 전반적으로 이해할 수 있어 좋았습니다! 엔지니어를 희망하는 게 아니더라도, 기본적으로 회사마다 사용하는 데이터 아키텍처가 다를테니 미리 특성에 대해 잘 알아두는 게 중요하겠네요.
    • 들어보거나 이미 알고 있는 개념들이 등장하네요. 공부를 착실히 해나가고 있다는 의미인 것 같아 좋습니다😗
  • 핵심 개념 : 데이터 아키텍처
    • 시스템이 어떻게 구성되며 동작하는지 원리를 나태나는 원칙
    • 조직이 데이터를 수집, 저장, 처리 및 관리하는 방법을 설계하고 구현하는 일련의 과정 또는 체계
  • 용어 정리 :
    • OLTP : 트랜잭션 데이터 (ex. 구매내역, 입출금내역)
    • ERP, CRM : 전사 데이터
    • 서드파티 : 외부에서 제공되는 데이터
    • 웹/로그 데이터 : 사용자 발자취
    • IoT : 사물인터넷

팀원 공통 인사이트
데이터 아키텍처의 특성과 활용 방법에 대해 잘 알아두자!

기초분석

발표회 피드백

  • ppt 제목이 직관적이라 마음에 들었다.

  • count를 보는 것도 좋지만, 고객 수가 늘거나 줄테니까 비율이나 고객당 평균 장바구니 제거 횟수같은 지표를 만들어서 비교했다면 좋을 것 같다

  • VIP 선정기준에 대해 설명이 좀 부족한 것 같다. 코드를 같이 보여줬다면 좋았을 것 같다.

  • 전체적인 분석의 흐름이 좋았고, 특히 해결방안에서 리서치가 있었던 점이 좋았다.

개인스터디

데이터 분석 파이썬 종합반 1주차

출력문 Print

  • 화면에 값을 출력하는 데 사용
  • 여러 값을 출력할 때는 쉼표(,)로 구분

print("Hello, World!")

변수

=은 같다는 뜻이 아니라 담는다는 뜻으로 이해하는 게 좋음

age = 25
name = "Alice"

변수를 사용한 연산

double_age =  age * 2
print("나이의 두 배:", double_age)

자료형 확인

print(type(age))   # <class 'int'> 출력
print(type(name))  # <class 'str'> 출력
print(type(25)) # <class 'int'> 출력
print(type(25.0)) # <class 'float'> 출력

자료형

1) 문자열(string)

작은 따옴표나 큰 따옴표로 감싸서 선언

name = "Alice"
greeting = 'Hello, World!'

문자열 연산

full_greeting = greeting + " My name is " + name
print(full_greeting)  # "Hello, World! My name is Alice" 출력

문자열 메서드 활용

sentence = "python programming is fun"
print(sentence.upper())         # 대문자로 변환하여 출력

2) 숫자열

num1 = 10 # int
num2 = 3.14 # float

숫자열 연산

# 사칙연산 가능 
sum_result = num1 + num2
diff_result = num1 - num2
product_result = num1 * num2
division_result = num1 / num2
integer_division_result = num1 // num2
remainder_result = num1 % num2

print("합:", sum_result)
print("차:", diff_result)
print("곱:", product_result)
print("나누기:", division_result)
print("정수 나누기:", integer_division_result)
print("나머지:", remainder_result)

숫자열 메서드 활용

num3 = -7.89
abs_result = abs(num3)   # 절댓값 계산
round_result = round(num3)  # 반올림 계산

print("절댓값:", abs_result)
print("반올림:", round_result)

2-1) 정수형(integer)

소수점 이하의 부분이 없는 숫자
연산 결과도 항상 정수로 나옴

# 정수형 변수 선언
num1 = 10
num2 = -5

# 정수형 변수끼리의 연산
sum_result = num1 + num2
print("합:", sum_result)  # 출력: 합: 5

# 정수형 연산 결과
print("합의 자료형:", type(sum_result))  # 출력: 합의 자료형: <class 'int'>

2-2) 실수형(float)

소수점 이하의 부분을 포함하는 숫자
연산 결과도 항상 실수로 나옴

# 실수형 변수 선언
num3 = 3.14
num4 = -0.5

# 실수형 변수끼리의 연산
product_result = num3 * num4
print("곱:", product_result)  # 출력: 곱: -1.57

# 실수형 연산 결과
print("곱의 자료형:", type(product_result))  # 출력: 곱의 자료형: <class 'float'>

3) 불린(Boolean)

참 또는 거짓을 나타내는 데 사용
조건식 평가 시 중요

# Boolean 변수 선언
is_raining = True
is_sunny = False



# 비교 연산자를 사용하여 Boolean 값 비교
x = 10
y = 5

greater_than = x > y
print(greater_than)  # True 출력

결측값 (NaN)

Not A Number
수치형 데이터에서 발생
데이터 정제 및 처리 과정에서 자주 다루어짐

정의할 수 없는 숫자
0으로 나누는 연산이나 유효하지 않은 수학적 결과를 나타낼 때 사용

# 0으로 나누는 연산
result = 1 / 0
print(result)  # 출력: Infinity

import math

# 유효하지 않은 수학적 연산
result = math.sqrt(-1)
print(result)  # 출력: nan

import pandas as pd

# NaN을 포함한 데이터프레임 생성
data = {'A': [1, 2, None],
        'B': [3, None, 5]}
df = pd.DataFrame(data)

print(df)
# 출력:
#      A    B
# 0  1.0  3.0
# 1  2.0  NaN
# 2  NaN  5.0

입력문(input)

사용자로부터 키보드로 입력을 받는 함수
사용자와 상호작용하여 프로그램 만들기 가능

# 예시 1)
name = input("이름을 입력하세요: ")
print("안녕하세요,", name, "님!")

# 예시 2)
num1 = int(input("첫 번째 숫자를 입력하세요: "))
num2 = int(input("두 번째 숫자를 입력하세요: "))
sum = num1 + num2
print("두 숫자의 합은", sum, "입니다.")

퀴즈

  • 1) 숫자 자료형 값을 변수에 저장하고 출력하기
    • 퀴즈: 다음 두 수의 합을 구하여 출력하세요.
      • 첫 번째 수: 15
      • 두 번째 수: 27
num_1 = 15
num_2 = 27

print(num_1 + num_2)
  • 2) 문자 자료형 값을 변수에 저장하고 출력하기
    • 퀴즈: 다음 문장을 변수에 담고 출력하세요.
      • "Python은 데이터 분석과 인공지능 분야에서 매우 인기 있는 프로그래밍 언어입니다."
quiz2 = '"Python은 데이터 분석과 인공지능 분야에서 매우 인기 있는 프로그래밍 언어입니다."'
print(quiz2)

데일리퀘스트

SQL - 흉부외과 또는 일반외과 의사 목록 출력하기
SQL - 가격이 제일 비싼 식품의 정보 출력하기
SQL - 이름이 없는 동물의 아이디
SQL - 조건에 맞는 회원 수 구하기
SQL - 중성화 여부 파악하기


일기

  • Python 종합반 1주차✅
  • SQL 코드카타 19-23✅
  • 기초분석 발표✅
  • 다면평가 / KPT회고

드디어 이번 주가 끝났다🥲 지옥같은 일주일.. 오늘 바로 튜터님들 피드백이 이뤄질 줄 몰랐는데 발표가 끝나자마자 바로 피드백이 들어와서 놀랐다 스스로는 살짝 근거가 부족하지 않나 했는데 그 점을 지적하셔서 역시라고 생각함

그래도 무사히 발표를 끝마쳤다는 점에 만족합니다.....😊
조가 곧 바껴서 다면평가도 진행했는데 난 꽤 냉정하게 썼는데 이거 팀원들한테 전달된대서 좀 머쓱ㅎ

다음주에는 본격적으로 파이썬 공부 조져야지~!!@!@#

2개의 댓글

comment-user-thumbnail
2025년 2월 28일

고생 많았슴니다아

1개의 답글

관련 채용 정보