
Project Preface
1.꾸준히 QA업무(데이터 검수, 품질검수)관련해서 관심이 많았음
2.알바 플랫폼에서 꾸준히 올라오기에, 공격적으로 지원
- 현금흐름 옵션 : 물론 떨어지거나 무응답이 대다수. 왜죠?경력자인데..
- 개인적인 판단
- 재택근무/ 건당 금액등 업무대비 강도가 낮고, 자율성이 높거나, 적은 금액으로도 꽤 만족할만한 복지.
- 개발자적인 시선
- mlOps, devOps로 경력을 쌓기전 실무의 대용량데이터(실제 Metadata)를 raw 한 상태로 볼수있다! 그리고 실제 검증, 검수 할 수 있는 기회라고 판단
- 올해 2026/1/8~ 정책평가연구원에서 (언제넣었는지도 모르겠는데요) 감사하게도 연락을 주셔서 진행했음
- 주제: 정부에서 발표한 기업 경제활동친화성지표(59)개 가 있음. 이를 각 지자체별 자치법규(조례 및 행정 데이터)내 규제사항을 매칭하여 찾은 AI가 크롤링해 추출한 값에 대해 평가/검증.
- 오류or이상치: 개인이 AI가 찾은 조례를 보고 검수자가 판단해서 맞는지 확인 및 재검수
- 빈칸 : 찾아서 수치 및 세부조항 재입력
- 그 외 : 59개 지표에 맞추어 만든 연구소의 AI 플랫폼 내 평가등급(S-D) 중 "가장 낮은 레벨 D-허용범위가 까다롭고/좁음/즉, 규제가 심함"에 맞춘건지 수치, 데이터가 기준에 맞게 들어갔는지 최종 확인
- 제출 대상: 상공회의소
- OT: 1차 검수때 3명인가 모임 (OT때 모인 모두다 인서울 중상급이라 ... 이 알바에.. 고급인력이라니 놀랐음)
- 원장님 이력: 박근혜 대통령비서실 경제수석비서관 출신의 어마무시한 경력의 무려!! 성균관대 경영학부 교수님 출신...!
- 업무툴 : 카카오채널로 소통. 갑자기 어디선가(?) 1명을 추가 구인하셔서 총 연구소의 담당자급인 연구원 포함 총 5명이서 검수를 진행
- EXCEL 내 D(이상유무),E (조항내용)<-검수자 작업//G(참고조례).H(세부조례내용) <-AI가 크롤링한 결과값
Phase1
- 1차 검수 : 59개 지표중 /13개 담당 , 4000개라시던 데이터는 어느새 엑셀 토탈 3000행이 되었다 (*두 열다 채워야하니 실제 작업은 TWICE! 2배..)
- 1차 총평: 1차 품질 데이터에 대한 제대로된 관리가 부재. 질문을 하라고 하셨지만 다들 재택근무+ 과도한 업무량으로 이해 제대로 이행을 한건지 의문이 듬. 데이터자체에 대한 일관된 지표가 부재했고. 서로 다른 판단값을 입력
Issue Logs
- 제한시간은 4일. (목~ 일요일(1/11) 자정 전까지)
- 첫날, 1//8 : 개발팀장님이 엑셀 데이터가 준비가 안되서 그냥 흘러갔다
- 둘째날 1/9 : 여전히 준비가 안된 모양.
혼자 근무하시는건가?QA담당자가 별도로 없나
- 오후 늦게 전달받음/ 그제서야 정확한 지표 및. 담당 범위와 데이터량 파악
- 시작일: 1/9부터 작업진행, 재택근무라 그나마 다행인데, 문제는 나의 경우 잘못된 범위를 파악해서 남의것 먼저 해버림...
- 물론, 개인적인 실수였으나 전달에 좀 미비가 있었다.
- 카톡에 올리셨다고 했는데 공지로 고정되어있지 않아 메시지가 올라가는 바람에, 제대로 체크못함.
- 당연히 엑셀을 쪼개서 줬을줄 알아서, 필터가 되어있길래(?) 그냥 차례로 했음
- 실제 내 영역을 무려 1/11 일요일...에 알았다..세상에.
- 카톡 채널에... 아니 내 담당 영역(경영학과 답게, 비용 산정이 주를 이룸) 아닌 조례(부지분할, 주차장, 조경 계획등)에 대해 질문 많이 드렸는데 왜... 검수자들이 왜 아무말도 안한건지도 아직도 의문.
Mid phase
- 1/9-1/10 까지 법조항 (행정법에 대해 정확히 파악하는 법률전문가들은 전혀~아니였음...) 세부 조례사항, 수치가 없다고 느껴지는 내 판단에 의문이 들때 질문을 계속 올렸음
- 내 기준은 아래와 같음 (D,E열을 채울때 D는 간단혹은 자율적인 이유, E는 세부)
- 빈칸 -> 수치값/이상유무등 + 세부조례(별표 이미지파일이 긁어질경우 그세부내용까지) 채우면 됨
- AI가 찾은 수치/조례/수치값이 애매하다 판단-> 일단 엑셀데이터내 다른 열에이에 대한 사유도 적어놨길래(AI생성) 이를 가지고 회사 내 플랫폼 기준에 대해 꼬치꼬치 캐물음
- 그냥 잘못참조/오판/혼돈으로 AI 이상치 -> 내가 키워드 바꿔서 찾음 (하수도 -> 수자원,수도, 공공하수도 ,공유자산-> 공공자산, 공리자산) <- 이게 거의 노가다급.
Issue Logs
- 아직 거기까진 세부 기준이 없다/신경쓰지말고 결과값만 봐달라/조례내 항,목 보시고 "개별"로 판단하신걸 D에 적어달라는 연구원님의 답변
너무 많은 시간이 소요된다고 판단(생각한 거 언제 3000행에 다 일일이 적나요)
- 내 검수 기준을 별도로 세움.
- 지표보고 분석해서 작은 수치 vs 큰 수치가 필요한 조항별로 케이스 나누었음 (숫자만 적으면 됨)
- 숫자 case: 식별이 확실/ 조항있고 없고 case : 식별 확실/가치판단 case: 그냥 AI가 맞는 조항 찾았으면 패스, 아무리봐도 애매하면 "확인요"
- D열 인덱스 통일화 : " 이상없음", " 조례변경","조항추가", "수치변경" ,"확인요"
- 연구원님들의(물론 정책 전문가시겠으나) 각 답변이 너무 추상적/미래 지향적 이셨음, 납부 기일에 맞춘 제출에 우선순위가 더 커보였다
- 실은 진행 내내 데이터 품질 검증에 대한 기준부재/QA관리자의 부재 에 의문이 들긴했다.
- 그렇게 급하게 밤새워서 월요일 새벽 2시에 밀린 담당 업무를 끝내고 (건당 비용이니 했던 범위까진 확실히 다시 적어서) 파일을 던짐
- 완료일 1/12 02:00AM : 밥 먹으며 일하고, 잠 줄여가며 제한 시간까지 데이터 전송완료 / 내 기준상, 검수는 다 끝난 상황
- Phase 2 에서 계속
Phase2
Phase 4
- 2차 검수자등록, 검수일 1/15 : 갑자기 원장님 전화오셔서 일 괜찮았냐 물어보더니 2차검증을 요청함
- 나만 성실하게 한... 그런건가?, 중간검수..하긴 했나 다들? 에 대한 의문이 이어짐.
- 통화요약: 이미 1차때 검증이 끝나서(과연?) 2차 검증자는 (인당 30개 지표로) 2명 정도로만 추렸다 였음
- 돈 주시겠다고 하시니.. 감사합니다 하고 일단 마무리.
- 1/16: 갑자기 묻지마식 1차 QA 검수 입금 완료.
- 원래는 두배를 생각했으나 (왜냐면 데이터량이 아무리 봐도 4000개는 넘어갔고, 채워야 할 열이 2배였기 때문이죠..?)
- 건당 200원 -> 100원으로 변경!
- 이래서 근로계약서를 써야합니다 여러분..
- 나는 ...교수님 출신 원장님이신데 떼먹진...않으셨으나 금액을 50% 삭감한건 너무했다 싶음
Issue Logs
- 잔혹한 금액 삭감
- 여기서 이미 대부분 이탈시작 (중간 검수도 안한듯했음) 했다고 본다...
- 나도 거의 봉사활동에 가까운 노가다를 계속해야하는지에 대한 의문 VS 재택근무치고 괜찮지않나 에 대한 생각으로 고민함
- 하기로 결심
- 유선상 내가 하겠다고 동의했음 (이래서 조건이 중요합니다)
- 연구소에서 면접제안 (복선)
- 게다가 2차에 2인이니 좀 더 제대로된 사람둘이서 하겠지 라는 희망..
Phase 5
- 2차 검수중 1/16 : 근무하는데 계속 원장님 연락옴
바빠죽겠는데
- 솔직히 1차 검수 금액 보곤... 삭감 일방 통보에 기분이 좀 상했다.
- 더 시킬일이 있는건가? ... 난 시킨 일만 하자의 마인드.
- 자율적으로 검수 기준을 더 세부적으로 잡고 검수 하고 있었음.
- 위 FLAG를 기준으로 D열에 통일
- 1/17: 내가 담당한 지표 외 타 평가지표에 대한 이해도가 낮아서 ai를 활용해 분석하던 도중 다음날 아침에 다시 전화가 걸려옴
Issue Logs
- 2차 최종 검수자 등록일 1/17: 개발팀장님으로 부터 원장님 전화 받아라고 카톡이 와서 받았더니, 2차 검수자가 도망갔다고 함.
- 여행 계획이라고 하셨지만 도망이겠죠?
나도 도망가고싶었어
- 통화 요약: 돈은 최대 두배로 줄수있다고 말 하시기에, 그리고 면접 얘기를 다시 꺼냄.
- 일단 알겠다 하겠다고 함.
- 근데 데드라인은 연장를 안해주시더라구요? (~1/18, 늦어도 19일 까지는 줘야하는..3일이라는 미친 일정)
- 2차 검수자? 그녀가 했다는 엑셀 데이터 전달 따위 없었다.
- 내가 가진 xlsx 파일이 전부.
- 총 59개 지표, 전체 지자체수 243개, 엑셀데이터 총 14000행(약)
- 개발자 팀장님은 되는대로 빨리달라는 요구사항뿐 (완벽을 바라지는 않으셨던 모양)
python 자동화 개발 진행 시작
"바이브 코딩 잘합니다"
-
Onboarding
- 1) D열 customized Idex 설정 완료 = 내가 만듦. 그냥.
- 2차검수자 더미데이터: 4-1~5-2 범위를 참조해 통일화
- 2) Flag D 열내 Index 지표는 어느정도 위에서 내 기준대로 세팅
규칙생성
-
fail
- D,E 열 중 하나라도 비어있거나 둘 다 비어잇음
- G,H,I (AI)검증 데이터가 30자 이상 확실하게 있는경우
- E 에 조례명+ 세부조항 복붙, D에 이상없음으로 넣을 것.
- E 길이가 20자 이내로 짧은 경우
- 별표 /첨부 확인
-
pass
- AI가 잘못 오탐한 것까지 키워드 필터링은 가능했으나(regex, Enum 사용시..) 패스.
- 정확하진 않은 검증이라 느꼈고 (참고 조항이 지자체별로 사용하는 행정용어가 다름. 그래서 키워드가 다르더라도 평가지표는 또 맞는경우 )
- 내가 혼자 그 Flag까지 이틀만에 분석하고 판단하기엔, 물리적 시간이 부족하다고 느꼈다.
= 즉, 일단 AI 데이터 결과값을 신빙.
- D에 이상없음 이 적히거나 길이가 충족하는경우 && E가 길이가 충족하는경우
- 검수자가 자율 판단한 것으로 판단
= 즉, 1차 검수자 판단값을 신빙.
Flags
-
1차 Onboarding : 채워야할 것 우선순위 정하기
EMPTY OK (D,E 비어있음)
NOT_ENOUGH OK (E 내용 부족 = WEAK_E)
AI조항복붙 OK (H→E 복사됨)
filled OK (정상 완료)
프로젝트 진행 로직
- 라벨 정규화(띄어쓰기, 오타등) script
- 규칙 필터링 script
- filtering flags 용 sheet 생성 script
- 최종 결과용 작업결과 sheet 생성 script
내가 해냄
그래서 결국(?) 1/17 05:00AM <- 최종적으로 해냄
error

데이터가 누락되진 않았다.
- 다만, 도시명이 밀리면서 다른 행으로 덮여버림 (꼬리행 패턴)
- 내가 copy sheet script를 짜다보니 스크립트가 로직이 작동하며 엑셀간 복붙하며 생긴 오류임.(빈행을 뒤에 붙이며난 오류)
대구광역시 동구 | 대구광역시
대구광역시 서구 | 대구광역시 중구
대구광역시 남구 | 대구광역시 동구
대구광역시 북구 | 대구광역시 서구