[머신러닝을 위한 기초수학] - 집합

Yerin Kim·2023년 4월 17일
0
post-thumbnail

집합 >> 여러 값들의 모음
a collection of distinct and well-defined things(or elements)
구분이 명확하고 사람에 따라 기준이 달라지지 않으며, 다양한 object(또는 요소)가 들어갈 수 있다.

  1. Enumerating Elements(Roster Form):
    요소들을 중괄호 { }로 묶어 나열하여 집합을 나타내는 것 = 열거법(로스터형)
    예를 들어, 1부터 10까지의 짝수로 이루어진 집합은 {2, 4, 6, 8, 10}와 같이 나타낼 수 있다.
    집합의 요소가 적을 때 유용하다.

    Set = {element , element , …, element }

  2. Set Builder:
    Set builder notation은 집합을 나타내는 또 다른 방법
    집합 내의 요소를 설명하는 조건과 조건을 충족하는 요소들을 정의하는 식으로 이루어져 있다.

    일반적인 형태는 {x | P(x)}
    여기서 x는 집합의 요소를 나타내는 변수이며, P(x)는 집합의 요소들을 정의하는 조건이다.
    예를 들어, 1부터 10까지의 짝수로 이루어진 집합은
    {x | x는 1부터 10까지의 짝수이다}와 같이 나타낼 수 있다.
    이 방법은 집합의 요소가 무한하거나 요소들을 규칙 또는 조건으로 나타내기 쉬울 때 유용하다.

    Set = {element | element’s condition}
    -> element는 x, condition은 조건을 의미

집합은 그림으로 표현 가능하다 >> Venn Diagram

Common Number Sets
수학에서의 일반적인 숫자 집합

  1. 자연수(Natural Numbers) : 모든 양의 정수를 포함하는 집합으로, 1, 2, 3, 4, 5 등이 있다.

  2. 정수(Integers) : 모든 자연수와 음의 정수를 포함하는 집합으로, ..., -3, -2, -1, 0, 1, 2, 3, ... 등이 있다.

  3. 유리수(Rational Numbers) : 분수 p/q로 나타낼 수 있는 모든 수의 집합으로, 여기서 p와 q는 정수이고, q는 0이 아니다. 예를 들어, 1/2, 3/4, -5/7, 0 등이 있다.

  4. 무리수(Irrational Numbers) : 유리수가 아닌 모든 실수의 집합으로, √2, π, e 등이 있다.

  5. 실수(Real Numbers) : 유리수와 무리수를 모두 포함하는 수의 집합으로, -∞, ..., -3, -2, -1, 0, 1, 2, 3, ..., +∞ 등이 있다.

  6. 복소수(Complex Numbers) : a + bi 형태로 나타낼 수 있는 모든 수의 집합으로, 여기서 a와 b는 실수이고, i는 허수 단위(즉, i^2 = -1)이다. 예를 들어, 3 + 2i, -4 - i 등이 있다.

|A| = 원소들의 갯수 = 크기를 의미
ex. A = {2,3}일 때 |A| = 2
ex. B = {a, b, c, d, e}일 때 |B| = 5

Equal Sets 동등한 집합 A = B

A = B ⟷ [(∀a ∈ A) ∈ B] ∧ [(∀b ∈ B) ∈ A]

  1. '=' 를 기준으로 왼쪽과 오른쪽이 같다는 의미
  2. (∀a ∈ A) ∈ B : 집합 A가 가지고 있는 모든 원소들은 집합 B에 포함된다.

예를 들어, {1, 2, 3}과 {3, 2, 1}은 순서는 다르지만 같은 요소를 가지므로 동등한 집합이다.

Subsets and Supersets 부분집합과 상위집합

A ⊆ B

  1. 집합 A의 모든 원소가 집합 B의 원소인 경우, A는 B의 부분집합
  2. ⊆ 기호는 "부분집합"을 의미

예를 들어, {1, 2}는 {1, 2, 3}의 부분집합이다.

Proper Subsets 진부분집합

A ⊂ B

  1. 집합 A의 모든 원소가 집합 B에 속하지만, 집합 B에는 집합 A에 없는 원소가 적어도 하나 존재하는 경우, A는 B의 진부분집합
  2. ⊂ 기호는 "진부분집합"을 의미

예를 들어, {1, 2}는 {1, 2, 3}의 진부분집합이다.
{1, 2}의 모든 원소가 {1, 2, 3}에 속하지만, 3은 {1, 2}에 속하지 않기 때문

공집합(∅ 또는 {})은 모든 비어있지 않은 집합의 진부분집합이다.
진부분집합의 개념은 조합론, 확률론 및 위상학과 같은 다양한 수학적 응용 분야에서 유용하게 사용

Operations on Sets
일정한 규칙을 통해 새로운 집합을 만들어내는 과정
즉, 집합에 대한 연산

  1. Unary Operations f : A ⟶ B
    한 개의 집합을 대상으로 하는 연산이며, 입력으로 하나의 집합을 받아 출력으로 새로운 집합을 생성
    Power set는 어떤 집합 A의 모든 부분집합들의 집합
    수식으로 나타내면, 𝒫(A) = {X | X ⊆ A}이다.

    만약 A = {1,2} 라면, 𝒫(A) = {{}, {1}, {2}, {1,2}} 이 된다. >>> A에 대한 Power set
    빈 집합 {} 도 A의 부분집합이므로, 𝒫(A) 에는 항상 빈 집합이 포함됨

    Power set의 크기(cardinality)는 집합 A의 원소 개수가 n개라면, 2의 n승
    따라서, |𝒫(A)| = 2^n 이다.
    예를 들어, A = {1,2,3} 이라면, |𝒫(A)| = 2^3 = 8이다.

    A에 포함되지 않은 원소들을 모은 집합을 A^c로 표현 >>> A의 여집합

  2. Binary Operations f : A × B ⟶ C
    A와 B라는 두 개의 집합이 있을 때, 이들의 교집합, 합집합, 차집합, 대칭 차집합, 카르테시안 곱 등을 구할 수 있다.

    1) 교집합(Intersection)은 A와 B의 공통된 원소로 이루어진 집합을 의미(A ∩ B)
    예를 들어, A = {1, 2, 3}이고 B = {2, 3, 4}이면, A와 B의 교집합은 {2, 3}이다.

    2) 합집합(Union)은 A와 B의 모든 원소를 포함한 집합을 의미(A ∪ B)
    예를 들어, A = {1, 2, 3}이고 B = {2, 3, 4}이면, A와 B의 합집합은 {1, 2, 3, 4}이다.

    3) 차집합(Set Difference)은 A에서 B에 포함된 원소를 제외한 원소로 이루어진 집합을 의미(A - B)
    예를 들어, A = {1, 2, 3}이고 B = {2, 3, 4}이면, A와 B의 차집합은 {1}이다.

    4) 대칭 차집합(Symmetric Difference)은 A와 B에 모두 속하지 않은 원소로 이루어진 집합을 의미(A △ B)
    예를 들어, A = {1, 2, 3}이고 B = {2, 3, 4}이면, A와 B의 대칭 차집합은 {1, 4}입니다.

    5) 카르테시안 곱(Cartesian Product)은 A와 B의 모든 순서쌍을 포함한 집합을 의미(A × B)
    예를 들어, A = {1, 2}이고 B = {3, 4}이면, A와 B의 카르테시안 곱은 {(1, 3), (1, 4), (2, 3), (2, 4)}이다.

    추가 예) A = {1, 2}, B = {x, y}일 때, A × B는 {(1, x), (1, y), (2, x), (2, y)}와 같이 4개의 원소를 가진 집합

    카르테시안 곱은 주로 선형대수학, 해석학, 그리고 컴퓨터 과학 등의 분야에서 사용되며, 예를 들어 벡터의 내적과 행렬의 곱셈에서 중요한 역할을 한다.

    추가) 집합은 교환법칙과 분배법칙이 성립한다.

서로소 집합(disjoint sets) : 공통 원소가 없는 집합

  1. 두 집합 A와 B가 서로소일 때, 그들의 교집합은 공집합으로 표현되며, ∅로 나타낸다.

  2. 수학적으로는 A ∩ B = ∅으로 표현한다.

    예를 들어, A = {1, 2, 3}이고 B = {4, 5, 6}인 경우, A와 B는 공통된 원소가 없기 때문에 서로소 집합이며, 그들의 교집합은 공집합이다 -> A ∩ B = ∅

    확률론에서 두 사건 A와 B의 교집합의 확률은 A와 B가 서로소인 경우 항상 0이다.
    그래프 이론에서는 서로소 집합을 사용하여 그래프의 독립적인 정점 집합을 나타낼 수 있다.

집합에서 Partition데이터 분석에서 군집화(clustering)와 관련된 문제를 다룰 때 사용
데이터 분석에서 군집화는 유사한 특성을 가진 데이터들을 하나의 그룹(군집)으로 묶는 과정을 의미

  1. 군집화 문제에서는 주어진 데이터셋에서 서로 유사한 데이터끼리 그룹화하는 방법을 찾는 것이 핵심
    이를 위해서는 데이터들 간의 유사도를 정의하고, 이를 기반으로 군집화 알고리즘을 적용해야한다.

  2. 군집화 문제는 다양한 분야에서 활용
    예를 들어, 고객 데이터에서 고객 그룹을 찾아 마케팅 전략을 수립하는 것이나,
    생물학 연구에서 유전자를 유사한 유전자군으로 묶어서 연구하는 것 등이 그 예시

profile
내일의 나는, 오늘의 도전으로 만들어진다!

0개의 댓글