제8회차 빅데이터분석기사('빅분기') 시험을 합격하고 그 기록을 남기고자 글을 쓴다.
0. 시험동기: 석사 논문을 STATA 를 이용해서 실증분석으로 쓰다보니, 통계나 분석 툴에 대해 공부하고 싶다는 생각이 들었고 찾아보니 빅데이터분석기사가 여기에 맞는 것 같아서 공부하게 됨.
1. 공부기간: 필기/실기 각각 시험 접수기간부터 시험일까지 매일 평균 1.5시간 정도. 물론 1분도 안 본 날도 있으며, 시험이 가까워올 수록 시간을 늘려감. 시험 전 주 주말에는 최소 반나절 이상 공부했음.
2. 교재: 2024 빅데이터분석기사 필기(성안당) + 2024 빅데이터분석기사 필기 기본서(이기적), 2024 빅데이터분석기사 실기 기본서(이기적)
3. 배경지식: 컴퓨터 및 통계 비전공자. 논문쓸 때 통계분석(회귀분석, f검정, t검정 등)을 다루긴 했으나, 정말 대학 학부 1학년 기초통계만도 못 한 수준으로 공부했었음
4. 최종점수: 합격 (필기: 65점 / 실기: 90점)
이하에서는 내가 공부하면서 느낀 점 및 앞으로 공부할 수험생들을 위한 팁 등을 두서없이 기재하였다. 찾아보면 돈 받고 쓴 후기도 많은 듯 하나, 난 교재비 2만원 및 시험접수비 6만원 외에는 지출하지 않았다.
I. 필기 준비
- 찾아보면 알겠지만, 이 시험은 필기만 통과하면 90% 합격한 것과 같다는 말이 있을 정도로 필기가 어렵다. 특히 파이썬을 다루는데 능숙한 컴공 전공자나 개발자라 하더라도 이론 및 통계기법 등이 출제되므로 꽤 시간을 들여 공부해야 한다.
- 필기는 성안당에서 나온 교재를 봤는데, 빅분기는 시행된 지 이제 8회차 정도밖에 되지 않아서 수학의 정석과 같이 1권만 보면 된다 라고 할만한 책이 아직 없고, 그나마 잘 팔리는 책들은 페이지 수가 너무 많았다. 성안당 교재는 비교적 얇고, 그림이 좀 많았으며, 중요한 부분에 밑줄, 별표처리 등이 되어 있기에 선택하였다.
- 필기 공부순서는 단원별 내용 읽기(밑줄 및 별표 있는 것만 봄) - 단원별 실력점검문제 - 최종 점검 모의고사 및 기출문제 순으로 하였다. 이 블로그의 다른 시험 후기와 마찬가지로 틀린 문제들만 체크해뒀다가 시험 직전에 다시 한번 보았다. 이 교재의 난이도는 실제 시험보다는 좀 쉬운 느낌.
- 이와 별개로 이기적 빅분기 필기 기본서 구매 시 파일로 제공하는 핵심 요약자료와 영진닷컴 cbt문제도 풀었다. 성안당 교재의 주요 내용을 핵심 요약자료에 단권화 하고 회사나 출퇴근시간에도 틈틈이 cbt문제를 풀면서 공부했다. 모든 시험이 다 그렇지만 그냥 교재를 쭉 읽어만 봐서는 무슨 얘기를 하는 건지 감이 잘 안온다. 따라서 시험 마지막으로 갈수록 한 눈에 볼 수 있는 요약자료를 만들고 이것을 반복해야 머리에 그나마 남는게 생긴다.
- 얘기한 것처럼 아직 시험이 시행된 지 얼마 안됐기에 기출이 충분히 쌓이지도 않았고 난이도나 유형 등이 들쑥날쑥한 느낌이 강하다. 따라서 정석적인 공부방법이라고 추천할 만한 것도 없다. 기출문제를 다 외워간다고 해서 다음번에도 그렇게 나올까? 참고로 빅데이터분석기사는 기출문제를 공개하지 않는다. 따라서 시중에 기출문제라고 떠도는 것들은 모두 시험 본 사람들이 복원한 문제다.
- 필기 시험은 용산의 선린인고에서 보았다. 필기 시험 준비물은 컴퓨터용싸인펜이랑 신분증만 챙기면 된다. 수험번호는 문자로 보내주고, 수험표가 '필수'는 아니다. 다른 기사시험도 그런지는 모르겠지만, 빅분기 시험은 특이하게 필기와 실기 모두 일정 시간 이후에는 답안 제출 후 중도 퇴실이 가능하다. 단, 나는 시험시간 2시간을 거의 다 써가면서 끝까지 붙잡고 풀었다.
- 필기시험이 종료되고 2주정도 지나면 합격여부를 알려준다. 합격하면 실기 접수는 따로 해야되고, 이와 별개로 빅데이터분석기사를 취득할 수 있는 적격 여부를 입증해야된다. (대학교 졸업장 등) 필기 합격하고나면 2년 내에 실기를 합격해야 최종 합격이 된다.
II. 실기 준비
- 필기 합격 발표부터 실기 시험까지 약 두 달여정도 기간이 있는데, 많이 남았다고 자만하지 말고 미리 공부하기를 꼭 추천한다. 본인이 필기 결과를 확신할 수 없다면 최소한 pandas 사용법 정도만이라도 시간날때 공부하면 언젠가 실기 시험 준비할 때 큰 힘이 될 것이다.
- 실기 준비를 위해 봤던 강의는 다음과 같다: 1) "코딩대한민국" 판다스 100제, 2) "AI너는아니" 빅분기 영상
판다스 100제는 빅분기 실기의 기본이 Pandas 라이브러리이므로 기초를 다지기 위해 봤고, AI너는아니 의 예제문제 풀이영상들은 실제 문제풀이 감을 잡기 위해 봤는데 둘 다 추천한다. 흔히들 아는 퇴근후딴짓, 데이터마님 등의 경우 강의 영상 등이 있는 것이 아니고, 데이터마님은 특히 난이도가 높아서 완전 초보자가 따라하기는 좀 무리가 있다.
- 이 외에도 대구 빅데이터활용센터 등 유튜브를 찾아보면 무료 빅분기 실기 강의들이 있고, K-mooc 등에는 파이썬 강의가 수두룩하다. 그래서 본인이 마우스품만 좀 팔고 시간만 더 투입한다면 유료 강의 없이 시험 준비하는 것도 불가능하지는 않다. 다만, 난 이런거 저런거 모두 귀찮다면 인강을 보도록 하자 (찾아보니 보통 20만원 수준)
- (지금 생각해보면 굳이 했어야 할까? 싶기도 하지만) 처음에는 약 6시간 정도 되는 "점프투파이썬" 유튜브 강의를 들으면서 파이썬의 완전 쌩기초를 공부했다. 이후 코딩대한민국 강의를 공부함과 동시에 이기적 실기 책을 구매해서 공부했다. 다만 이기적 책은 10% 정도밖에 보지 못했다. 열심히 봤으면 더 좋았을 듯..
- 실기는 3시간 동안 풀게 되는데, 유형이 3개로 1유형은 데이터 전처리 3문제(각 10점), 2유형은 빅데이터 분석 1문제(40점), 3유형은 통계 가설 검정 2문제(각 15점)로 구성되고 과락 없이 60점이 넘으면 합격된다. 예를 들어 3유형을 다 틀려도 합격할 수 있다. 빅데이터분석기사 실기 체험환경 안내 - 빅데이터분석기사 실기 체험 (goorm.io) 여기서 예제문제를 풀 수 있는데, 최소한 여기나오는 문제는 100% 완벽히 풀 수 있을 정도로 가져가야 한다. 특히 2유형은 아예 코드를 다 외워서 정답 탬플릿으로 활용하면 좋다.
- 1유형은 기본적인 Pandas 명령어를 이용한 데이터 전처리가 3개의 소문제로 나오고, 코드가 아닌 답을 기재하게 되어있으므로 맞으면 10점 틀리면 0점이며 부분점수는 없다. 예를 들어 '국가별 맥주 소비량 데이터를 주면서 1인당 맥주 소비량이 3번째로 많은 국가의 평균 소비량을 반올림하여 정수로 기재하시오' 란 식이다. 전처리 방식이야 정답이 있는 것은 아니므로 사람마다 아는 명령어를 활용하여 어떻게든 답을 구하면 되지만 당연히 아는 패키지, 명령어가 많으면 많을 수록 편하다.
- 2유형은 빅데이터 분석 수행으로써 큰 1문제가 나오고, CSV 파일을 제출하게 되어 있으며 부분점수를 주는 듯 하다. 빅데이터 분석 방법은 크게 지도학습과 비지도학습으로 나뉘고, 지도학습은 다시 분류와 회귀로 나뉜다. 그런데 정확히는 모르지만, 실기 시험은 특성상 지도학습만 나올 수 있다고 하며, 그동안 기출문제도 모두 지도학습만 나온 것으로 알고 있다. 유튜브 등을 보면 알겠지만 2유형은 어느 정도 풀이순서가 정형화 되어 있고 대부분은 '랜덤포레스트' 하나만 달달 외워가서 시험보는 것으로 알고 있다. 나 역시 RandomForestRegressor 또는 Classifier의 사용법만 암기해서 가져갔고 괜찮은 성적을 얻었다.
- 3유형은 통계가설 검정으로, 카이제곱검정, T검정, P값, R값 등 대학 통계학개론 수준의 지식을 알면 훨씬 풀기 수월하다. 그렇다고 통계학부터 공부하는 것은 너무 돌아가는 것이니, contingency table의 주요 값을 해석할 수 있는 수준 정도만 공부하면 좋다. 사실 3유형이 생긴지 얼마 되지 않고 통계 용어 자체의 어려움도 있어 준비하기가 가장 까다롭기에 아예 3유형을 통째로 포기하는 사람도 있는 것 같은데, 작지만 가져갈 수 있는 만큼이라도 가져가는 것을 추천한다.
- 그 외에 팁이라고 한다면, IDE나 구글 Colab과 달리 시험 환경에서는 자동완성도 없고 검색도 사용할 수 없다. 그러니 공부할 때부터 관련 기능은 다 꺼놓고 공부하면 도움이 된다. 그리고 물론 많이 외워야 하는데 그냥 달달 외우는것보다 저절로 손에 익도록 가능하면 매일매일 꾸준히 문제를 반복해서 풀기를 바란다.
또한 Help와 Dir 명령어 사용법은 반드시 알아가도록 한다. 패키지, 모듈의 사용법이 기억 안날때 상당히 유용하게 쓸 수 있다. 실제로 나도 3유형은 시험장에서 거의 Help로 사용법 및 예시를 참고하면서 풀었다. 다만 파이썬의 설명은 모두 "영어"로만 나오기 때문에 영어 실력이 어느정도 되면 더더욱 쉽게 풀 수 있다.
- 그동안 내가 겪은 바에 따르면 1)모든 시험은 갈수록 어려워지고, 2) 모든 자격증은 따 놓으면 언젠가는 도움이 되기 때문에, 어차피 유효기간도 없는 기사 자격증이니 조금이나마 쉬울 때 적은 노력으로 취득하기를 추천한다. 자격증이 실제 실력을 보증하는 것은 아니지만, 비전공자가 빅분기 자격을 취득한다면 오히려 현업 또는 전공자보다 충분히 어필할 수 있다고 생각한다. 어차피 비전공자의 경쟁자는 전공자가 아닌 다른 비전공자, 비현업일테니까.