
Numpy: 고성능 수치 계산용. (Pandas의 뿌리!)
Pandas: 표(DataFrame) 형태로 데이터를 자유자재로 요리하는 도구.
Matplotlib: 파이썬 시각화의 기본. (커스터마이징 자유도가 높음)
Seaborn: Matplotlib을 기반으로 더 예쁘고 복잡한 통계 차트를 쉽게 그려줌.
'지리 데이터(Geo)' 특화 도구
정적 크롤링 (가볍고 빠름)
requests: 웹 서버에 데이터를 달라고 요청하는 배달원.
BeautifulSoup: 받아온 HTML 뭉치에서 원하는 정보만 쏙쏙 뽑아주는 집게.
동적 크롤링 (느리지만 강력함)
Selenium: 브라우저를 직접 조종하는 아바타. (로그인, 클릭, 무한 스크롤 등 사람의 행동이 필요할 때 사용)




[데이터 주고 받는 기술]
- Webhook
특정 이벤트가 발생했을 때 자동으로 지정된 URL로 데이터를 전송하는 프로세스
ex) power automate에서 팀즈 웹후크를 이용해 함수 실행마다 팀즈 채널에 메세지 보내기
우리가 팀즈의 http post url에 전송하는 거임.
- REST API
인터넷 주소(URL)를 통해 서버에 데이터를 요청하거나 수정하는 가장 대중적인 방식


서버리스 환경에서 API 호출 로직을 구현

실시간으로 쏟아지는 방대한 데이터를 유실 없이 받아내고 순서대로 보관하는 '대용량 데이터 입구'.
뒷단(Stream Analytics 등)에서 데이터를 처리하기 전까지 안전하게 지켜주는 완충 작용(Buffer)을 함.
Event Hubs가 없다면? 센서에서 데이터가 빗발칠 때 뒷단이 조금이라도 느려지면 데이터가 그대로 사라져 버림.
[IoT 센서/웹후크] → (데이터 발송) → [Event Hubs] → (데이터 보관) → [Stream Analytics] → (SQL로 분석) → [Power BI]
데이터가 어떤 모양이어야 하는지 적힌 '표준 설계도'를 보관하고 관리하는 저장소
별도의 리소스(보통은 Azure Event Hubs namespace 안에 포함됨)로 존재
보내는 쪽이 데이터를 보내기 전에 Schema Registry에서 "나 이 설계도(ID)대로 보낼게"라고 등록합니다.
데이터에는 설계도 자체가 아니라 '설계도 번호(ID)'만 살짝 붙여서 보냅니다. (데이터 크기가 줄어듭니다!)
받는 쪽은 데이터에 붙은 ID를 보고 Schema Registry에서 설계도를 찾아와 데이터를 정확하게 해석합니다.

Event Hubs로 들어오는 실시간 데이터를 설정된 시간이나 용량 단위로 묶어서 자동으로 Azure Storage(Blob/Data Lake)에 저장해주는 기능 = 코딩 없이 원본 데이터를 즉시 저장소에 백업하는 기능
왜 필요한가?
Event Hubs는 자체적으로 '데이터를 전송하는 능력'이 거의 없어서 다른 곳으로 보내려면 이 설정을 켜줘야함.

하나 또는 여러 개의 input을 받아 실시간 스트림 데이터와 참고용 데이터를 쿼리로 결합하고(SQL 쿼리로 데이터를 가공), 가공된 데이터를 목적에 맞게 여러 곳(Output)으로 분기하여 전송.
✅ 핵심 요약
다중 입출력: 입력 소스들을 JOIN(결합)하여 분석하고, 결과물을 실시간 대시보드나 DB 등 여러 저장소로 동시에 보낼 수 있음.
시간의 기준: 데이터가 시스템에 도착한 시간이 아닌, 현장에서 실제로 발생한 시간을 기준으로 처리할 것.
Tip: 쿼리 작성 시 TIMESTAMP BY 문구를 사용하여 발생 시간을 명시해주는 것이 정확한 분석의 핵심!

Stream Analytics에 output으로 연결하면 별도의 새로고침 없이도 신규 데이터가 즉각 반영되는 실시간 시각화 보드를 구현할 수 있음.

데이터를 임베딩 모델에 통과시켜 벡터로 바꾼 후 (벡터 검색이 필요한 경우에만)
cosmos DB에 전달하면
1. 자동으로 인덱싱
2. 나중에 질문이 들어왔을 때 우리가 정한 Distance Function을 써서 관련 데이터를 빠르게 찾아줌.

![]() |
|---|
비용관리 모델 택1
RU/s(요청 단위): 처리량을 미리 예측하고 예약. 지속적이고 예측 가능한 트래픽에 최적.
서버리스: 사용한 만큼만 지출. 간헐적이거나 예측 불가능한 트래픽에 최적.
내부 계층
cosmosDB 계정(리소스 그룹 내부)> DB> container

<아직 실습 중>

파이썬으로 웹 UI를 만들 수 있음. 제공해주는 컴포넌트 사용법만 알면 됨.
자연어를 SQL로 바꿔줌.

AI 모델을 제공.
사용 한도 내에서 무료인 LLM API 제공 서비스
| Groq | Github | Google AI Studio |
|---|
충분한 GPU가 있다면 로컬 LLM 도구를 설치
| Ollama | LM Studio |
|---|

대용량의 실시간 스트리밍 데이터를 안정적으로
수집하고 전달하는 분산 메시징 시스템

실시간으로 스트리밍 데이터를 처리하고 분석하는
분석 스트림 처리 프레임워크

처리된 데이터를 저장, 검색하고, 머신러닝 모델을 통합하는 검색 엔진
