Small Data -> Big Data
λ°°μΉ μ²λ¦¬ -> μ€μκ° μ²λ¦¬(Kafka)
μμ¬ κ²°μ -> μ ν/μλΉμ€ νμ§ κ°μ
μλΉμ€λ³ μ μ© μλ² -> K8s λ±μ 컨ν μ΄λ κΈ°μ μ¬μ© -> λͺ¨λ Serviceκ° Dockerλ‘ λμ΄μΌ νλ€.
λ°μ΄ν° νμ§κ³Ό κ°μΈμ 보 보νΈ
DBT -> DAκ° λ§μ΄ μ¬μ©ν¨
λ°μ΄ν° νλ«νΌ 2022 : ννλ°μ΄νΈ κ·λͺ¨μ κΈλ‘λ² νμ₯
λ°μ΄ν° νλ«νΌ 2022 : λ°μ΄ν°λ₯Ό λΉμ¦λμ€ μΈμ¬μ΄νΈλ‘ μ ννκΈ°
μΏ ν‘μ΄μΈ λ°μ΄ν° νλ«νΌ : λ°μ΄ν° κΈ°λ°μ λΉμ¦λμ€ μ λ΅ λ° μ±μ₯ : μ€μ κΈ°λ°μ νμ΄νλΌμΈμΌλ‘ λ°μ΄ν° μμ§, μ²λ¦¬ λ° νμ©νκΈ°
μΏ ν‘ SCM μν¬νλ‘μ° : ν¨μ¨μ μ΄κ³ νμ₯ κ°λ₯ν low-code, no-code νλ«νΌ κ°λ°
λ²ν·νλ μ΄μ€ Airflow λμ κΈ°
λ°μ΄ν° μμ§λμ΄μ μ’μΆ©μ°λ κ²μ κ°λ°κΈ°
κ΄κ³ μ μ° μμ€ν μ Kafka Streams λμ νκΈ°
μ€λμ μ§ A/B ν μ€νΈ νλ«νΌ ꡬμΆκΈ°
μ΄λ€ λ°μ΄ν°λ₯Ό λμμΌλ‘ν κ²μΈκ°?
-> Kaggle λ±λ± μ°Έκ³
μ΄λμ κ·Έ λ°μ΄ν°λ₯Ό μΆμΆν μ μμκΉ?
κ·Έ λ°μ΄ν°λ‘ 무μμ ν΄λ³Ό μ μμκΉ?
λ°μ΄ν°
μ μ: λ€μν μμ€(μ: λ°μ΄ν°λ² μ΄μ€, API, μΉ, μΌμ λ±)μμ λ°μ΄ν°λ₯Ό μμ§νλ κ³Όμ μ
λλ€.
μμ λꡬ: Apache Nifi, Apache Kafka, AWS Kinesis.
νλ: λ‘κ·Έ νμΌ μμ§, API νΈμΆ, μΉ μ€ν¬λν λ±μ ν΅ν΄ λ°μ΄ν°λ₯Ό κ°μ Έμ΅λλ€.
μ μ: μμ§λ λ°μ΄ν°λ₯Ό μ μ₯νμ¬ μ΄ν μ²λ¦¬ λ° λΆμμ μ¬μ©ν μ μλλ‘ μ€λΉνλ κ³Όμ μ
λλ€.
μμ λꡬ: κ΄κ³ν λ°μ΄ν°λ² μ΄μ€(SQL), NoSQL λ°μ΄ν°λ² μ΄μ€(MongoDB, Cassandra), λ°μ΄ν° λ μ΄ν¬(HDFS, AWS S3).
νλ: λ°μ΄ν°λ² μ΄μ€μ μ μ¬, λ°μ΄ν° λ μ΄ν¬μ μ μ₯.
μ μ: μμ λ°μ΄ν°λ₯Ό λΆμ κ°λ₯ν ννλ‘ λ³ννλ κ³Όμ μ
λλ€.
μμ λꡬ: Apache Spark, Apache Beam, AWS Glue.
νλ: λ°μ΄ν° ν΄λ μ§, κ²°μΈ‘μΉ μ²λ¦¬, λ°μ΄ν° ν΅ν© λ° λ³ν, ETL(Extract, Transform, Load) μμ
μν.
μ μ: λ°μ΄ν°λ₯Ό λΆμνμ¬ μΈμ¬μ΄νΈλ₯Ό λμΆνκ³ , μμΈ‘ λͺ¨λΈμ κ°λ°νλ κ³Όμ μ
λλ€.
μμ λꡬ: Python (pandas, scikit-learn, TensorFlow, PyTorch), R.
νλ: νμμ λ°μ΄ν° λΆμ(EDA), ν΅κ³ λΆμ, λ¨Έμ λ¬λ λͺ¨λΈ κ°λ° λ° νκ°.
μ μ: λΆμ κ²°κ³Όλ₯Ό μκ°ννμ¬ μ΄ν΄νκΈ° μ½κ² νννλ κ³Όμ μ
λλ€.
μμ λꡬ: Tableau, Power BI, matplotlib, seaborn.
νλ: λμ보λ μμ±, 리ν¬νΈ μμ±, λ°μ΄ν° μκ°ν.
μ μ: κ°λ°λ λͺ¨λΈμ μ€μ νκ²½μ λ°°ν¬νμ¬ μ΄μνλ κ³Όμ μ
λλ€.
μμ λꡬ: Flask, FastAPI, Docker, Kubernetes, AWS SageMaker.
νλ: λͺ¨λΈμ APIλ‘ λ°°ν¬, μ§μμ μΈ λͺ¨λν°λ§ λ° μ μ§λ³΄μ.
μ μ: λ°μ΄ν° νμ΄νλΌμΈμ λͺ¨λ λ¨κ³λ₯Ό μλννμ¬ ν¨μ¨μ±μ λμ΄λ κ³Όμ μ
λλ€.
μμ λꡬ: Apache Airflow, Luigi, Prefect.
νλ: μμ
μ€μΌμ€λ§, νμ΄νλΌμΈ λͺ¨λν°λ§ λ° κ΄λ¦¬.