서론
07/18 ~ 09/10 : 기업 참여 프로젝트(파이널 프로젝트)
09/01 : 병합 마무리 및 프로젝트 테스트 / 기업 참여 멘토링
09/02 : 최종발표 준비 / 산출물 보완
09/03 : 최종발표 준비 / 산출물 보완
09/04 : 최종발표 준비 / 산출물 보완
09/05 : CI/CD 설계 / 산출물 보완
이번 주는 산출물과 최종PPT 자료를 만드는 데 많은 시간을 쏟았습니다.
그리고, 월수금 3일간 기엄참여 멘토링을 진행했고, 주말에도 개인 멘토링을 통하여 이력서 첨삭하였습니다.
1. 파이널 프로젝트
각 팀원들은 기능적으로는 모두 완성됐고, 병합도 완료 됐습니다. 팀원이 맡은 추가적인 기능으로 '뉴스레터' 기능도 막바지에 들어가 있습니다. 동시에 배포 과정과 테스트 단계에 돌입했습니다.
CI/CD 같은 경우 팀원 A와 B, 2명이 전반적으로 맡아서 작업을 하게 되었고, 설계서 같은 경우 아래와 같이 제가 만들어 보며 소통했습니다.
Developers → GitHub(SCM) → Jenkins(CI) → Image Registry(ECR 등) → Kubernetes(Preview/Stage/Prod) → Observability(ELK/Prometheus/Grafana) → Notifications/Storage(Slack,S3)
AI요약이 좀 더 정제되서 나오게 하기 위해서 기본 모델의 '3줄 요약'(정답요약) 과 직접 '프롬프트를 입력해 만든 요약'(요약문)을 비교하여 나타냈습니다.
1. ROUGE-1/2/-L: system(요약문) ↔ reference(정답요약)
- 전처리(소문자, 특수문자 제거, 공백 정규화) → 토큰화 →
- ROUGE-1/2: 요약/정답의 n-gram 멀티셋 겹치는 개수로 P/R/F1 계산
- ROUGE-L: 두 문장 토큰열의 최장공통부분수열(LCS) 길이로 P/R/F1 계산
2. COMPRESSION(압축): original(원문) ↔ system(요약문)
- “원문 대비 요약 길이 비율”로 표현
- 현재 함수는 요약길이 / 원문길이(작을수록 많이 줄임)로 계산
3. NUMERIC_MATCH: original ↔ system
- 날짜/숫자/금액 정규식으로 원문에서 뽑힌 숫자들 중 요약에 남아있는 비율(Recall 성격).
4. KEYWORD_COVERAGE: title(or original) ↔ system
- 원문(또는 제목)에서 유니그램 상위 topN과 바이그램 상위 topN/2를 후보로 추려 바이그램에 가중치 2, 유니그램 가중치 1로 가중 Recall을 계산.
- 경계 정규식으로 부분일치(예: AI가 AIs 안에 묻히는 것) 방지.
프로젝트의 마지막으로 최종 발표만 남아있습니다. PPT는 제가 전반적으로 제작하며 팀원들과 멘토님이 피드백해주고 부분 부분 채워주며 만들어 가고 있습니다.
2. 마무리
프로젝트를 하며 설계와 바뀌는 부분이 많았는데 설계 부분에서 정교하게 해놓은 탓에 빠르게 변경할 수 있어 좋았습니다.
기존에 하던 프롬프트 엔지니어링을 조금 더 다룰 예정입니다.
09/08 : PPT 자료 제출 / CI/CD 배포
09/09 : 최종 발표 준비
09/10 : 최종 발표 / 수료
이력서, 자소서 작성