파일 기반 DB라서 경로/권한 문제가 바로 영향을 미침ㅠ
pandas DataFrame을 바로 테이블로 등록 가능하고, SQL로 즉시 조회 가능함!
Prometheus + Grafana 구조
데이터 수집(백엔드)과 시각화(UI) 역할을 분리하는 이유
Windows Exporter 사용법
로컬·서버의 CPU, 메모리, 디스크 지표를 Prometheus로 수집 후 Grafana 대시보드에 표시
Elasticsearch
8.x 버전에서 설치 시 기본 비밀번호·CA·토큰이 자동 생성, 클러스터 확장 시 토큰이 필요하다는 것
Logstash JDBC
MariaDB 커넥터 설정
Kibana 인덱스 조회 및 시각화
Elasticsearch 데이터가 Kibana에서 어떻게 나타나는지 확인
크롤링 데이터 중 일부 페이지에서 태그 구조가 달라서 에러 처리 로직이 부족했음.
DB 저장 전 컬럼 타입과 길이를 미리 설계 안 해서 중간에 계속 에러가 발생.
API 수집 시 실패한 요청이나 빈 데이터 페이지에 대한 예외 처리 로직이 부족했다.
MariaDB 적재 시 대량 데이터 삽입에 대한 성능 최적화를 처음부터 적용하지 못했다.
DuckDB 연결 오류 → 환경 충돌이었다….
MariaDB 테이블 설계부터 크롤링 컬럼 길이, 인코딩까지 처음부터 세팅해보기.
SQL 문제 풀 때 MySQL/MariaDB 전용 문법과 다른 DB 문법 비교 학습.
크롤링한 데이터를 CSV로 저장해서 분석까지 연결해보기
중간중간 실무에서 어떤 방식과 흐름이 쓰이는지 강사님이 직접 설명해주셔서 상당히 유익한 시간이었다고 생각한다.
다만 진행 속도와 시간 제약 때문에 내가 작성한 코드나 흐름을 직접 리뷰해보는 시간이 없었던 점은 조금 아쉬웠다.
어쩔 수 없는 부분이지만 따로 시간을 내어 혼자 코드를 점검·정리하고, 잘못된 부분이나 개선 포인트를 직접 찾아보는 습관을 들여야겠다.