필기/실기 모두 그냥 평이했다. 물론 난 유관 전공자였고(통계 과목 A0 이상 받은 적 없는..) 실무에서 데이터와 AI 분야 관련 업무를 하고 있다.
취득 이유
데이터, AI 분야로 일하게 될 줄 몰랐는데 학교 다닐 때 해당 분야 과목들 죽 쑨 게 많아서..^^ 그냥 이거로 다시 기초를 좀 다져볼까 하다가 공부하게 됐다.
사실 요즘 ChatGPT나 Gemini한테 뭐든 물어보면 알아서 코드도 척척 짜주고 개념도 알려주지만, 오랜만에 직접 하나하나 생각해가며 전처리 로직 설계하고 코드 짜고.. 통계 모델 공부하면서 옛 추억에도 젖어보고(?) 생각보다 많은 도움이 된 것 같고 아주 만족한다.
난 정처기도 있지만 IT 취준생이 기사 자격증을 딴다하면 이제 정처기보단 빅분기가 실무에 훨씬 더 도움될 것이라 생각한다. 실기를 제외해도 필기에 많은 부분이 정처기 내용과 겹치기도 해서..
유명 수험서 하나 사서 1회독하고 단원별 문제 풀면서 모르는 부분, 틀린 부분 개념만 2회독하고 기출문제 풀면서 오답 노트를 했다.
마지막으로 시험 직전엔 수험서랑 같이 있던 요약 정리본 훑었다.
사실 문제고 뭐고 벌써 다 까먹어서 하나도 기억이 안 난다. 따라서 실기 관련된 부분만 중점적으로 후기를 써보겠다...ㅎㅎ;;
실기에서 걱정됐던 건 4년밖에 되지 않은 자격증이라 얼마든지 새로운 개념이 나오고 문제 형태가 변할 수 있다는 것..!
예시로 6회의 작업형1을 보면 그전까진 일반 데이터 전처리에 관한 문제만 나왔다가 처음으로 시계열 데이터 처리에 대한 문제가 나왔었고, 9회의 작업형1을 보면 그전 회차들의 작업형1에 비해 상당히 까다롭게 나왔었다.
또한 작업형 3의 경우 애초에 시행된 지가 얼마 안 됐지만, 7회에서 잔차 이탈도(Residual Deviance), 오즈비(Odds Ratio)에 대한 문제가 처음 나왔었다.
강의 추천
광고나 뭐 그런거 전혀 아니고 내돈내산인데 실기때 책 한 권 안사고 난 인강 하나 듣고 90점으로 합격했다.
유튜버 '퇴근후 딴짓'님의 빅데이터 분석기사 실기(작업형1,2,3)강의 진짜 강추한다👍
가격이 조금 나간다고 생각할 수 있는데 그만한 값어치를 한다고 생각한다.
pandas 많이 사용해 봤다면 사실 어렵지 않게 풀 수 있을 것이다.
하지만 이번 10회는 9회때만큼 어려웠던 것 같진 않지만, 최근 추세로 보면 pandas의 다양한 메서드들을 응용하는 능력이 더욱더 요구되고 있는 것 같다.
슬라이싱이나 정렬, 필터링등은 당연히 잘 사용할 수 있어야 하고, 개인적으로는 최근 추세에서 제일 중요한 건 groupby라고 할 수밖에 없을 것 같다.
어려운 개념은 아니니 그룹핑 관련 문제 유형을 많이 경험해 보고 시험 보길 추천한다.
여긴 코드의 템플릿이 있는 것과 마찬가지라고 해도 과언이 아니다.. 그냥 무조건 만점 맞는다는 생각을 해야 한다.
인코딩 후 그냥 XGBoost던 RandomForest건 자신이 편한 거 하나 아무거나 정해서 하이퍼파라미터 튜닝 없이 돌리기만 해도 만점 나온다.
(단, boost계열은 python 환경에 따라 오류가 있을 수 있으므로 그냥 어떤 문제건 RandomForest로만 돌려도 됨.)
주의할 점은 공부할 땐 Train 데이터셋을 train/validation으로 분류해서 validation 데이터로 내가 구축한 모델 성능을 평가도 많이 해보고 할 텐데 시험장에서 validation 데이터를 넣어서 나온 분석 결과를 제출하는 경우가 간혹 있다고 한다.
-> 이거 무조건 0점이다.
꼭 Test 데이터셋을 넣고 돌린 결과를 제출한 건지 다시 한번 체크하자.
변수가 가장 많이 발생할 수 있는 부분이고 가장 어려운 부분이라고 생각한다.
작업형1의 경우 어려워봤자 pandas의 메서드를 잘 활용하면 어떻게든 풀어낼 수 있는 경우가 많다. 노가다로 구하든 뭐든..
하지만 작업형3은 우선 개념부터 비전공자가 접하기엔 가장 어려운 부분이고, 심지어 이건 빅데이터분석기사가 이제 10회인데, 6회부터인가 새로 생긴 유형이라 레퍼런스가 더 적다.
최근 가장 많이 나오고 있고 중요하게 다뤄지고 있는 부분이라고 하면 그래도 단순/다중 선형 회귀, 로지스틱 회귀, 오즈비 정도..?
추가로 가설검정, 카이제곱검정, 분산분석 정도까지 공부해 놓으면 그래도 충분히 합격 가능할 것이라 예상한다.
관련 분야의 일을 하고 있다고는 하지만 데이터 엔지니어/사이언티스트도 아니고 통계 부분은 거의 비전공자 수준이었다.
pandas는 그래도 조금 알고 있었고, 실무에서도 가끔 다뤘었다. 하지만 이것도 요즘은 AI한테 물어보면 다 짜주니까.. 내가 혼자 제대로 활용할 줄 안다고 할 수는 없었다.
아래는 내가 생각한 직장인 기준 실기 합격에 필요한 기간이다.
pandas 활용이 익숙하다!!
빡세게 하면 한 열흘 공부하면 붙을 수 있다고 본다.(작업형3 위주로 공부)
python 코딩만 익숙하다!!
적어도 2~3주는 잡아야 한다. python을 잘 다룰 줄 안다면 pandas도 쉽게 익힐 순 있을 것이다. 하지만 이해하는 것과는 별개로 pandas에는 많은 메서드들이 있고 이것들을 활용하여 실제 전처리 작업을 하는 것에 익숙해질 시간이 조금은 필요할 것이다.
ex) 본인이 여기에 해당되는데 대충 메서드들 개념만 익히고 냅다 문제 풀려고 하니까 계속 for문 if문으로만 해결하려고 함ㅋㅋ 생각이 안남ㅋㅋ
비전공자고 익숙한 게 없다!!
못해도 1달 이상, 혹은 두 달 정도 잡아야 한다. pandas 자체가 어려운 툴은 아니나(빅분기 합격에 필요한 정도로만 생각했을 때), 실기 시험 자체가 모두 손수 코딩을 해야하는 것이므로 프로그래밍적/컴퓨팅적 사고 능력이 필요하기 때문이다. 문제를 많이 풀어서 이런 사고력을 길러야 한다. 뿐만 아니라 작업형3의 경우 개념 자체가 낯설 것이므로 이 부분 공부하는 데에도 꽤 시간을 할애해야 할 것으로 본다.