세션
Let’s Logging Like a Pro! (정도현)
-> 세션 소개 내용 보기


파이썬의 표준 로깅 라이브러리인 logging을 소개해주었다.
Worst Practice
- 로깅이 아예 없는 것이다. 운영 시 fail 나면 어디서 실패했는지 알기 어렵다.
- 개발 시 print 구문을 사용하고 배포 시 까먹으면 사용하지 않는 코드가 많아진다.
- with open() 구문은 자동으로 close, exit을 호출하기 때문에 로그 파일을 쓸 때마다 I/O가 발생한다.


Python Standard Logging
- getLogger() : 로거 생성
- main_logger, sub_logger 2개를 생성해 propagate=True 옵션을 주면 상위 단의 로거 정보를 가져올 수 있다. Flask, sqlalchemy와 같이 로깅 모듈을 따로 가진 애들과 함께 사용하기 좋다.



로그 레벨 설정
- StreamHandler: 콘솔에 출력
- TimedRotatingFileHandler: 설정한 시간에 로그 파일이 rotate
- when=“midnight”: 자정에 업데이트
- BackupCount=15: 보관할 로그 파일의 최대 개수. 16개가 되면 가장 과거의 로그 파일 하나를 삭제함
- QueueHandler / QueueListener: 로그 출력도 파일 I/O가 발생하기 때문에, 이 부분을 최소화하기 위한 방식.
- log.start(), stop() 코드를 명시적으로 작성해야 동작함
10년 이상의 파이콘 데이터로 DuckDB와 벡터 임베딩을 활용하여 기술 트랜드 인사이트 찾기 (박조은)
-> 세션 소개 내용 보기

"파이콘 10년 치의 데이터를 정형 데이터로 변환해 트변환해 트렌드를 파악해보기"를 목표로 진행한 프로젝트에 대해 소개해주었다.

데이터 수집
- py-video-data 프로젝트를 통해 PyVideo.org 사이트에서 파이콘 데이터를 수집했다.
- 유튜브에서 파이콘 플레이리스트 url은 직접 찾아서 MCP 입력으로 사용했다.
- DuckDB를 사용했는데, pandas는 모든 데이터를 메모리에 로드하고 사용해 데이터가 커지면 느려지는 반면 DuckDB는 그렇지 않은 장점이 있기 때문이다.
- 자막 데이터는 저작권 이슈가 예상되어 수집하지 않고 수집하는 코드만 공유했다.

데이터 분석
- 임베딩한 결과는 tensorflow embedding projector를 사용해 시각화했다.
- 직접 차원 축소할 필요 없이 임베딩한 결과인 임베딩 벡터만 입력하면 알아서 시각화 해주는 장점이 있다.
- 고차원 데이터이기 때문에 유사도 계산에는 보통 유클리드 보다는 코사인 값을 사용했다.(방향 정보를 활용하기 위해서)
- csv 대신 parquet 포맷을 사용해 데이터 압축률 50% 이상 높임. parquet은 메타데이터를 가지고 있기 때문에 파일 용량이 작으면 오히려 parquet 보다 csv 용량이 커지는 경우도 있지만, 용량이 작을 때는 큰 차이가 없기 때문에 그냥 parquet 쓰는게 낫다.
- 미국, 유럽, 한국 총 세 국가의 세션을 분석했는데 연도별 키워드가 비슷한게 인상적이었다.
좋아하는 기술을 나누다 보니, 커뮤니티와 책이 생겼습니다 (유현아)
-> 세션 소개 내용 보기

AI 전공자는 아니지만 JAX 라이브러리를 공부하기 시작한 것을 계기로 책 집필까지 이어졌다고 한다. 좋아하는 기술을 꾸준히 학습하고 공유하는 과정에서 JAX KR 커뮤니티 운영진으로 활동하게 되었고, 강연 기회도 얻게 되었다고 한다. 특히 “좋아하는 기술을 공부하고 나눈다”는 태도는 이번 파이콘 행사의 취지와도 맞닿아 있고 핵심을 정확히 짚는 메시지였다.
부스

둘째 날에는 부스를 많이 돌아다녔다.
모든 것을 파이썬으로 개발한 손금 & 관상을 볼 수 있는 토룡점이 있어, 나는 관상으로 나랑 닯은 뱀을 알아보았다. 파이썬 로고와 같은 뱀을 주제로 잡은 부분이 재미있었다. 나는 따뜻한 인디고뱀!!!
mediapipe 라이브러리로 얼굴에서 특징점을 추출하고, 관련 정보를 뱀 정보와 함께 프롬프팅으로 LLM에게 넘기면 뱀을 추천해주는 구조였다. 결과지를 출력하는 모듈까지 파이썬 래퍼로 개발했다 해서 정말 파이썬의 활용은 무궁무진한 것 같다.


다양한 기업과 커뮤니티에서 부스를 운영하며 제품과 서비스를 소개하고 있었다. 모든 부스를 방문하면 돌림판 이벤트에 참여해 상품을 받을 수 있었는데, 참여율을 높이는 데 최적화된 방식이었다. 마지막에 받은 수제 캔디에는 파이썬 로고가 새겨져 있어 더욱 특별하고 귀여운 기념품으로 남았다.
마무리하며
평소 ‘언젠가 공부해야지’ 하고 미뤄두었던 부분들에 대해 다시금 경각심을 일깨울 수 있었고, 파이썬을 좋아하는 사람들이 모여 함께 즐길 수 있는 장이 마련되어 더욱 뜻깊었다.
- rag chunking 방식을 공부해 검색에 미치는 영향 확인. 나아가 파일 파싱, 청킹, 임베딩, 검색으로 구성된 RAG 전체 파이프라인을 만들어 각 구성요소 옵션이 바뀔 때 어떤 영향을 미치는지 확인할 수 있는 데모 페이지가 있으면 좋겠음
- logging 모듈 옵션 공부 후 로그 파일 보완