Numpy Array NumPy는 Python에서 수치 데이터를 다루기 위한 강력한 라이브러리이다. numpy array: numpy가 제공하는 homogeneous multi-dimensional array 데이터 타입
Summary Statistics 데이터의 속성을 요약하는 숫자를 의미한다. Summarized properties include frequency, location and spread Examples: location - mean, spread - stand
두 변수가 서로 연관되어 있다는 것은 무슨 의미인가?예를 들어, "공부 시간"과 "시험 점수"가 있을 때, 공부 시간이 늘어날 때 시험 점수도 함께 높아진다면, 이 두 변수는 "연관되어 있다"고 말할 수 있다.이러한 연관성을 수학적으로 어떻게 표현할 수 있는가?

Similarity and Dissimilarity Similarity 두 데이터 객체가 얼마나 비슷한지에 대한 수치적 측정값이다. 객체들이 더 비슷할수록 (값이) 더 높다. 보통 [0,1] 범위 안에 있다. 근접도

머신러닝 모델은 숫자를 입력값으로 받아들임 → 문자열 혹은 범주형 데이터를 적절히 숫자로 변환(encoding)하는 과정이 필요하다.범주형 데이터 (categorical data)nominal data: 순서가 없는 범주형 데이터 (성별, 도시명…)
Linear Regression이란? 종속 변수(Dependent Variable)와 하나 이상의 독립 변수(Independent Variable) 간의 관계를 선형적인 함수(직선)로 모델링하는 기업이다. Deterministic Models 무작위성이 없다고 가