2024년 3회차 정보처리기사 필기, 실기 - 정처기-필기,실기 후기
컴퓨터활용능력 1급 - 컴활1급 후기
제10회 빅데이터분석기사-필기 - 빅분기-필기 후기
제58회(2025 3회차) SQL 개발자(SQLD) - SQLD 합격 후기
빅데이터분석기사 필기를 비전공자가 공부하고 느낀점은 공부하기가 많이 불편하다는 점이었다.
작년 8회차, 9회차 기출문제를 찾느라 시간도 많이 쓰고 결국 9회차는 끝내 구하지 못했다.
시간만 허비한 셈이다. 그래서 실기 공부는 같은 고생을 반복하지 않기 위해 강의를 선택했다.
구글링을 통해 찾은 강의는
👉 [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1, 2, 3)였다.
퇴근후딴짓 강의사이트
- 퇴근후딴짓 강의 - 사이트
나는 원래 돈 주고 강의를 결제하는 스타일은 아니다.
‘어지간하면 독학으로 해결한다’는 마인드가 더 강한 편이다.
하지만 완전히 처음 접하는 주제를 공부할 때는 이야기가 다르다.
이럴 땐 독학과 강의의 차이가 하늘과 땅이라고 생각한다.
그걸 처음 느낀 계기가 바로 컴퓨터활용능력 1급 실기였다.
당시 나는 처음엔 독학으로 공부했지만 결국 강의를 결제하게 됐다.
그 이유는 간단했다.
내가 교재로 풀던 문제와 강의에서 다루는 문제의 수준 자체가 달랐기 때문이다.
내가 샀던 책은 최신 기출 트렌드를 전혀 반영하지 못하고 있었고
나는 그걸 나중에야 깨달았다.
그렇다면 일정 수준의 파이썬 코드 베이스가 있는 나는
왜 굳이 빅데이터분석기사 실기 강의를 결제했을까?
그 이유는 통계학에 대한 기반 지식이 없으면 문제 풀기가 어렵기 때문이다.
예를 들어 카이제곱, 가설검정, 회귀분석, 로지스틱 회귀, 분산분석 등등
전부 어느 정도의 통계적 이해를 요구하는 파트들이다.
만약 이걸 독학으로 한다면, 하나하나 구글링하면서 시간 낭비를 해야 한다.
나는 그 시간을 줄이기 위해 강의를 결제했다.
내가 선택한 강의는 퇴근후딴짓의 빅데이터분석기사 실기 강의(작업형 1, 2, 3)였고,
수강 기간은 1년, 정가는 99,000원이지만
첫 결제 할인으로 약 75,000원에 구매할 수 있었다.
사실 처음엔 고민이 되긴 했다.
“한 달 공부할 건데 굳이 1년짜리를 사야 하나?” 하는 생각이 들었기 때문이다.
나 역시 처음엔 돈이 아깝다고 느꼈다.
하지만 강의를 들으면서 생각이 완전히 바뀌었다.
전혀 아깝지 않았다.
2~9회차 기출문제 해설,공식 예시 문제 강의
그리고 작업형 1, 2, 3을 파이썬 기초 수준부터 설명해주는 구성까지.
파이썬과 통계학을 1도 모르는 사람도 이해할 수 있도록 정말 천천히 체계적으로 진행된다.
강의 1개당 평균 시간이 15~20분으로 짧은 편이라 집중하기 좋다.
짧은 시간 안에 핵심만 담겨 있어 지루하지 않고, 꾸준히 듣기에도 부담 없다.
통계학 개념이 필요한 문제는 먼저 개념부터 설명한 후 풀이에 들어가 막힘 없이 따라갈 수 있다.
카이제곱, 회귀분석 등 생소한 내용도 기초부터 차근차근 설명해 준다.
역대 기출문제가 잘 정리되어 있어 복습이나 참고용으로도 보기 편하다.
자료가 깔끔하게 정돈되어 있어 따로 정리할 필요 없이 활용 가능하다.
각 섹션마다 퀴즈가 포함되어 있어 강의 내용을 다시 상기하고 점검할 수 있어 좋았다.
단순히 듣고 끝나는 게 아니라 배운 내용을 직접 확인할 수 있어서 학습 효과가 높다.
이해되지 않거나 궁금한 점이 생기면 질문을 남겼을 때 친절하고 빠르게 답변해준다.
피드백이 잘 이루어져 혼자 공부하는 느낌이 덜하고 막히는 부분 없이 넘어갈 수 있다.
시험 5주 전부터 강의 1~2개씩 천천히 듣고 1주정도 빡세게 했다.
시험 내용 전부 강의에 있는 내용이었다. 그래서 모든 문제 막힘 없이 풀고 나왔다.

1유형 소문제 1개를 틀렸다. 솔직히 나는 100점 나올줄 알았다.
1유형은 내가 어느정도 답을 외우고 나와 남들과 비교했을 때 똑같아서 다 맞을거라 생각했다.
0을 모르고 하나 더 적었나? 왜 틀린지는 잘 모르겠다.
1유형은 pandas 라이브러리 잘 사용하면 되는 문제이다.
나는 코테를 준비하는 입장이라 코딩 작성하는건 익숙하지만
파이썬은 정처기이후로 본적도 없어서 낯설었다.
그래서 파이썬에 익숙해지기위해 프로그래머스 레벨 1~2를 파아썬으로도 풀어봤다.
프로그래머스 레벨1
pandas와 파이썬 문법은 거의 유사하기때문에 파이썬에 익숙해지고 싶다면 나쁘지않다.pandas에서 중요한 개념/함수
1. gropuby()
2. 시계열
3. sort_values()
4. iloc[]
5. 집계함수 (sum(),mean() 등등)
t_total = train.pop('total')
cols = train.select_dtypes(include='O')
from sklearn.preprocessing import LabelEncoder
lb = LabelEncoder()
for col in cols:
train[col]= lb.fit_transform(train[col])
test[col]= lb.transform(test[col])
from sklearn.model_selection import train_test_split
X_tr,X_val,y_tr,y_val = train_test_split(train,t_total,test_size=0.2,random_state=0)
from sklearn.ensemble import RandomForestRegressor
rf = RandomForestRegressor()
rf.fit(X_tr,y_tr)
pred = rf.predict(X_val)
#분류라면
#from sklearn.ensemble import RandomForestClassifier
#rf = RandomForestClassifier(random_state=0)
#rf.fit(X_tr,y_tr)
#pred = rf.predict(X_val)
pred = rf.predict(test)
submit = pd.DataFrame({
'pred':pred
})
submit.to_csv('result.csv',index=False)
위 코드는 랜덤 포레스트 회귀(RandomForestRegressor)를 사용한 예제다.
만약 분류 문제라면 RandomForestClassifier로 바꿔 사용하면 된다.
인터넷 후기를 보면, 작업형 2는 쉽다는 이야기가 많다.
실제로 그렇게 말하는 데는 분명한 이유가 있다.
1유형이나 3유형과 달리, 2유형은 2회차부터 10회차까지 위의 코드 정도만 외워가도 40점은 기본으로 확보할 수 있다.사실 위 코드도 다소 길게 보일 수 있다.
그건 라벨 인코딩(Label Encoding)과 검증용 데이터 분할(train/test split) 과정을 포함했기 때문이다.
만약 원-핫 인코딩(One-Hot Encoding)을 사용하고
검증용 데이터를 따로 나누지 않고 바로 랜덤 포레스트를 돌린다면
코드는 아래처럼 더 간단해진다.
target = train.pop('total')
train = pd.get_dummies(train)
test = pd.get_dummies(test)
from sklearn.ensemble import RandomForestClassifier
rf = RandomForestClassifier(random_state=0)
rf.fit(train, target)
pred = rf.predict(test)
submit = pd.DataFrame({
'pred':pred
})
submit.to_csv('result.csv',index=False)
위 코드만으로 40점을 받을 수 있다니 정말 감지덕지 아닌가.
만약 시험 30분 전에 처음으로 2유형을 공부하게 되더라도
위 코드만 외워서 간단한 데이터셋이 출제된다면 40점은 나올 수 있다.요즘 빅분기도 점점 어려워지는 추세라 나중에는 먹힐지 모르겠다.
(결측값, 불균형 데이터셋 등은 추가적인 코드가 필요함)
- 단일 표본 검정 (양측, 단측(작을 경우), 단측(클 경우), 정규분포, 비모수 검정)
- 대응 표본 검정 (전과 후 or 후와 전)
- 독립 표본 검정 (두 집단)
- 카이제곱 (적합도, 독립성, 동질성)
- 회귀 분석
- 로지스틱 회귀 분석
- 분산 분석
공부해야할건 크게 7개정도이다. 요즘 자주 나오는건 회귀 분석과, 로지스틱 회귀 분석이다.
3유형은 어렵게 나오면 비전공자는 못푼다고 생각하면 된다. 1유형과 2유형에서 점수를 받아야 한다. 다행히 요즘은 기출에서만 3유형이 나오고 있기때문에 2유형처럼 기출 암기해 가면 30점 모두 확보 가능하다.
시간이 여유롭다면 1유형 -> 2유형 -> 3유형
시간이 없다면 2유형 -> 3유형 -> 1유형