데이터 분석 9일차 (파이썬 5일) 파이썬 종합반 1주차
📌 파이썬에서 가장 많이 사용하는 출려문 print 함수
📌 화면에 값을 출력하는데 사용
📌 괄호 안에 출력하고자 하는 값을 넣어주고 여러 값을 출력할 때는 쉼표(,)로 구분함
print("Hello, World!")
결과: Hello, World!
x = 10
print("변수 x의 값은", x, "입니다.")
결과: 변수 x의 값은10입니다.
# 데이터 분석 결과
num_records = 1000
# 결과 출력
print("총 ", num_records, "명의 레코드가 분석되었습니다.")
📌 무언가 담을 수 있는 바구니 같은 존재!!
# 변수 선언과 할당
age = 25
name = "Alice"
# 변수 사용
print(name) # "Alice" 출력
print("나이:", age) # "나이: 25" 출력
# 변수를 사용한 연산
double_age = age * 2
print("나이의 두 배:", double_age) # "나이의 두 배: 50" 출력
📌 주요 자료형으로 정수(int), 실수(float), 문자열(str), 리스트(list), 튜플(tuple), 딕셔너리(dict) 등이 있다.
✔️type 함수 사용하면 해당 변수가 어떤 자료형인지 알수 있다!
# 변수의 자료형 확인
print(type(age)) # <class 'int'> 출력
print(type(name)) # <class 'str'> 출력
📌 문자열은 작은 따옴표(' ') 또는 큰따옴표(" ")로 감싸서 선언한다.
# 문자열 변수 선언
name = "Alice"
greeting = 'Hello, World!'
💡문자열과 함께 메서드 사용
# 문자열 메서드 활용
sentence = "python programming is fun"
print(sentence.upper()) # 대문자로 변환하여 출력
결과: PYTHON PROGRAMMING IS FUN
📌 정수(int)나 실수(float) 형태의 숫자열을 변수에 할당
# 숫자열 변수 선언
num1 = 10 <--정수
num2 = 3.14 <--실수
- 숫자열 연산
🐍 파이썬 연산 정리
| 연산 | 연산자 | 예제 | 결과 |
|---|---|---|---|
| 덧셈 | + | 7 + 2 | 9 |
| 뺄셈 | - | 7 - 2 | 5 |
| 곱셈 | * | 7 * 2 | 14 |
| 나눗셈 | / | 7 / 2 | 3.5 |
| 제곱 | ** | 7 ** 2 | 49 |
| 몫 | // | 7 // 2 | 3 |
| 나머지 | % | 7 % 2 | 1 |
- 숫자열 함수와 메서드
# - 절댓값 abs() 함수, 반올림 round() 함수 사용법
num3 = -7.89
abs_result = abs(num3) # 절댓값 계산
round_result = round(num3) # 반올림 계산
print("절댓값:", abs_result)
print("반올림:", round_result)
- 정수형과 실수형의 차이점
# 정수형 변수 선언
num1 = 10
num2 = -5
# 정수형 변수끼리의 연산
sum_result = num1 + num2
print("합:", sum_result) # 출력: 합: 5
# 정수형 연산 결과
print("합의 자료형:", type(sum_result)) # 출력: 합의 자료형: <class 'int'>
# 실수형 변수 선언
num3 = 3.14
num4 = -0.5
# 실수형 변수끼리의 연산
product_result = num3 * num4
print("곱:", product_result) # 출력: 곱: -1.57
# 실수형 연산 결과
print("곱의 자료형:", type(product_result)) # 출력: 곱의 자료형: <class 'float'>
📌 True(참) 또는 False(거짓) 두 가지 값만 가지는 데이터 타입
# Boolean 변수 선언
is_raining = True
is_sunny = False
# 비교 연산자를 사용하여 Boolean 값 비교
x = 10
y = 5
greater_than = x > y
print(greater_than) # True 출력
📌 데이터를 다룰 때 값이 비어 있거나 정의되지 않은 경우를 나타낸다.
💡NaN(Not a Number)은 데이터에서 결측치(missing value)를 나타내는 특수한 값입니다. 주로 수치형 데이터에서 발생하며, 특히 데이터 과학이나 머신 러닝 분야에서 데이터 정제 및 처리 과정에서 자주 다루어진다.
- 수학 연산에서 발생하는 NaN
# 0으로 나누는 연산
result = 1 / 0
print(result) # 출력: Infinity
import math
# 유효하지 않은 수학적 연산
result = math.sqrt(-1)
print(result) # 출력: nan
- 데이터프레임에서의 NaN
import pandas as pd
# NaN을 포함한 데이터프레임 생성
data = {'A': [1, 2, None],
'B': [3, None, 5]}
df = pd.DataFrame(data)
print(df)
# 출력:
# A B
# 0 1.0 3.0
# 1 2.0 NaN
# 2 NaN 5.0
📌 input() 함수는 사용자로부터 키보드로 입력을 받는 함수
name = input("이름을 입력하세요: ")
print("안녕하세요,", name, "님!")
↑
이걸 실행하면 "이름을 입력하세요: "라는 메시지가 표시되는 이름을 입력 받는 화면이 출력됨.
이름을 입력하면 전체 문장이 출력된다!
num1 = int(input("첫 번째 숫자를 입력하세요: "))
num2 = int(input("두 번째 숫자를 입력하세요: "))
sum = num1 + num2
print("두 숫자의 합은", sum, "입니다.")
↑
사용자로 부터 숫자 두개를 입력 받아 덧셈 수행함
int를 사용해서 문자열을 정수로 변환해줘야만 두 숫자의 합이 출력된다!