AICE란?
- AI Certificate for Everyone의 약자로, 쉽게 말하면 인공지능 자격시험이다.
- 초등학생 수준부터 전공자 수준까지 총 5단계로 구분하여 자격 시험을 실행중이다.
- 이번에 에이블러로서 보게될 시험은 Associate 등급으로, 준/전공자를 대상으로 하는 4번째 단계의 시험이다.
보다 자세한 설명 : AICE 시험 소개 페이지
자격대비 방법
출제범위
- 탐색적 데이터 분석(EDA) -> 데이터 전처리 -> 모델링 -> 성능평가 까지의 전 단계에 걸쳐 총 14문항이 출제 된다.
탐색적 데이터 분석
- 모델에 필요한 라이브러리 설치 및 불러오기(import)
- 주어진 alias로 import할 수 있어야한다.
- 주어진 파일 형식에 맞추어 Tabular Data(DataFrame)로 불러오기
- 데이터 형식, 분포 등 확인
- matplotlib, seaborn을 이용한 데이터 시각화
데이터 전처리
- 불필요한 데이터 제거
- 결측치 처리
- 범주형 데이터 수치화 및 원-핫 인코딩
- 데이터 스케일링(Normalization, Standardization 등)
- 학습 데이터, 테스트 데이터 분리
모델링
- sklearn을 이용한 머신러닝 모델링
- tensorflow keras 프레임워크를 이용한 딥러닝 모델링
평가
- sklearn.metrics를 이용한 모델 평가지표 산출
- 모델 학습 과정 및 결과에 대한 시각화 (history)
시험 특징
- 주어진 Task를 수행할 수 있냐 없냐를 보는 시험이기 때문에 모델 성능은 중요하지 않다. (Professional 단계에서 평가한다고 함)
- 오픈북이지만 인터넷 검색정도만 가능하다.
- 본인이 따로 정리해둔 것 참고 불가
- chatGPT 등 사용불가
- 도서 및 인쇄물 참고 불가
- 외부와의 소통 불가 (메신저 등)
- AICE에서 제공하는 Jupyter Notebook 또는 Jupyter lab 실행환경을 이용해야 한다.
- 일부 패키지가 설치되어있지 않거나, 괄호 자동 완성 기능 등이 없기때문에 AICE 홈페이지에서 미리 연습하는 것을 추천한다.
개인적으로 생각하는 중요한 점
- 하나의 데이터셋을 바탕으로 일련의 사이클을 모두 수행하는 것이기 때문에, 중간에 잘못되는 부분이 있으면 뒤의 문제까지 전부 어그러질 수 있다. 이 점을 주목해서 특히 데이터 처리 부분에서 신중하게 진행해야 할 것 같다.
- 시험시간은 90분으로, 신중하게 천천히 풀어도 충분히 시간 내로 해결할 수 있는 수준이다. 중간에 발생하는 큰 실수를 막는 것이 더 중요할 것 같다.
-
실제 시험을 본 것은 아니지만, 연습문제 단계에서는 어떤 처리를 해야하는지 Task가 세세하게 주어지기 때문에 하는 방법을 알고있거나, 최소한 실마리라도 알고 있으면 공식문서를 찾아 풀 수 있는 수준이다.
-
Tabular Data를 다루기 때문에 머신러닝 관련 과정을 한번 쭉 복습하면 큰 도움이 될 것 같다.
-
딥러닝에서 쓸데없이 파라미터가 많은 모델을 만들면 학습에 많은 시간을 잡아먹는다. 어짜피 성능을 채점하는 것이 아니므로, 최대한 작은 모델을 만드는 것이 좋을 것 같다.
소감
-
에이블스쿨 교육뿐만 아니라 시험문제 관련된 정보가 있기 때문에 좀 조심스럽게 작성하였다.
-
사실 그간의 딥러닝 이론과정과 미니프로젝트 과정이 정신없이 몰아쳐서, 앞서 배웠던 데이터 전처리나 머신러닝 관련 코드를 많이 잊어버린 상태였는데 이번 연습을 통해 리마인드 할 수 있는 기회가 되었다.
-
내일부터는 다시 미니프로젝트 지옥주가 시작되는데... 나가 떨어지는 일 없이 할 수 있었으면 좋겠다.