본문 바로가기

컴퓨터공학과

데이터 분석 준전문가 자격증 ADSP 32회 시험 후기

반응형

데이터 분석 준전문가 자격증 ADSP 32회 시험 후기

 

최근 약 2~3주 동안 블로그에 글을 쓰지 못했다.
갑자기 몰려온 업무 때문인 탓도 있지만, ADSP 제32회 시험을 준비하기 위해, 시간을 쪼개어 공부를 하던 것이 주된 원인이었다.

 

사실 ADSP를 처음 준비할 때에는 인터넷의 여러 블로거들이 3일 컷, 1주일 컷 등의 이야기를 써놓았기에,
나 역시 희망에 차서, 공부를 대강대강 천천히 시작하게 되었다.

특히 이른바 '민트책'을 구매한 이후 펼쳐 본 ADSP의 1과목은 말 그대로 '날로 먹을 수 있는' 시험이라는 느낌이 매우 강하였기에, 초반 공부에 더욱 소홀하기도 하였다.

 

아래의 글이 내가 시험 원서 접수하기 전에 썼던 글인데, 이 시험에 대해 얼마나 가볍게(?) 생각하고 있는지가 잘 드러난다. 진짜 이때만 해도 내가 거의 1주일 동안 스트레스 속에서 살게 될 줄은 몰랐다.

 

데이터 분석 준전문가 자격증 ADSP 관련 정보 모음

어느 날 뉴스를 보는데, 초등학교 필수과목에 '코딩'이 추가된다는 소식이 들려왔다. 신기하다거나 놀랍다는 기분보다 '무섭다'는 느낌이 더 먼저 들었다. 그렇다면, 이제 불과 15년 정도 지난 이

kimtell.tistory.com

 

시험이 다가오고 2과목, 나아가 3과목으로 넘어가게 되자, 생각보다 쉽지 않을 수 있음을 느꼈다.

기본적으로 '의미 없는 암기'가 필요한 문제들이 많았으며, 3과목에서는 책에 서술된 이론이 문제와 지나치게 동떨어져 있거나, 기술되어 있는 이론만으로는 문제를 풀 수 없는 경우도 꽤나 자주 등장했기에, 언제나 꽉 찬 이론으로 정치하게 쓰여있는 법 관련 서적만 읽던 나로선 너무나도 난해하였다. 

 

특히나 시험이 있는 주 중에 저녁 약속과 출장이 많았기에, 시험 직전 공부 시간 확보가 너무나도 고통스러웠다. 늦게까지 기분 좋게 놀다가, 집에 들어와서는 새벽까지 공부를 해야 한다니, 여간 스트레스가 아니었다.

 

어쨌든, 변명은 이 정도로 하고, 그래도 2주 동안 퇴근 후 짬을 내서 2시간 정도씩은 꾸준히 공부를 하고, 이윽고 엊그제인 지난 2월 26일 토요일, 나는 제32회 ADSP 시험을 응시하게 되었다. 흰머리가 쭉쭉 늘어나는 기분이었다. 3과목에서 처음 인테그랄과 미분에 관한 것을 본 순간 느꼈던 좌절감은 잊히지 않는다. 나도 고등학교 땐 수학을 참 잘했는데... 하필이면 우리 교육과정에선 문과에게 미적분을 가르쳐주지 않았던 것이 이렇게 비수가 되어 꽂힐 줄이야!

 

어쨌든 ADSP 응시자들이 많이 모이는 카페에서 입수한 '가답안'은 아래와 같다. 

출처 : https://cafe.naver.com/sqlpd/30488

작성자 : asics 님. (*정말 감사드립니다!)

이하 * 표시가 된 부분은 내 소회 및 느낀 점에 관한 것이다.

 

제32회 데이터분석 준전문가 자격검정 (ADsP 32회) 시험 복원

대한민국 모임의 시작, 네이버 카페

cafe.naver.com

1. [1과목] 데이터의 이해

* [1번] X
- DML에 해당하는 명령어는? SELECT, UPDATE, DELETE, INSERT

  . CREATE: DDL에 해당하는 명령어

* 1과목의 1번 부터 틀렸다. CREATE가 DDL임은 기억했으나, UPDATE 역시 DDL이라고 생각했다. DDL은 무언가 DB의 큰 틀 자체를 생성하고 바꾸는 느낌이라는 정도로만 기억하여, 이런 불상사가 벌어지고 말았다.


* [2번] O
- data cardinality? N : 1


* [3번] O
- 기업 전체를 경영자원의 효율적 이용이라는 관점에서 통합적으로 관리하고 경영의 효율화를 기하기 위한 시스템은? 

  ERP (Enterprise Resource Planning)


* [4번] X
- 딥러닝과 관련 있는 분석 기법는? ANN, CNN, RNN, Autoendocer 등은 딥러닝에 해당하고,

  SVM은 머신러닝에 해당함

​* 4번 문제는 진짜 아무것도 모르고 찍었다. 암기가 필요한 영역이라고 판단하지 못했다. Autoencoder가 무언가 이질적이어 보이는 느낌적인 느낌으로 찍었다가 칼같이 틀리고 말았다. 이런.


* [5번] X
- 지도학습과 비지도학습으로 구분시 성격이 다른 것은?

  . 분류분석, 감성분석, 회귀분석 → 지도학습

  . 군집분석 → 비지도학습

​* 지도학습과 비지도학습 역시 단순 암기 문제였는데, 암기를 소홀히 했던 난 이역시도 틀리고 말았다. 다만 아쉬운 점은 지도, 비지도 학습은 1과목보다는 3과목 쪽에 가까운 문제라고 생각했는데, 1과목에서 나왔다는 점인 듯 싶다.

* [6번] O
- 빅데이터 활용에 필요한 기본적인 3요소는? 데이터, 기술, 인력


* [7번] O
- 인문학 열풍? 컨버전스 → 디비전스, 생산 → 서비스, 생산 → 시장창조

  . 빅데이터 분석 기법 이해와 분석 방법론 확대는 해당되지 않음


* [8번] O
- 데이터 사이언티스트의 필요 역량은? 설득력 있는 스토리텔링, 통찰력 있는 분석, 커뮤니케이션

  . 알고리즘에 의해 부당하게 피해를 입은 사람을 구제한 인력은 알고리즈미스트


* [9번] O
- 사람의 개입 없이 사물간 통신하는 기술은? IoT (사물인터넷, Internet of Things)


* [10번] O
- 기업이 외부 공급업체 또는 제휴업제와 통합된 정도비시스템으로 연계하여 시간과 비용을 최적화시키기 위한 것으로,   

  자재 구매, 생산, 제고, 유통, 판매, 고객 데이터로 구성되는 시스템은? SCM (Supply Chain Management)


* 위와 같은 결과로, 1과목은 총 10문제 중 3문제를 틀려서 과락을 면할 수 있었다. 특히 주관식 문제가 특정 부분의 암기를 요하는 부분이라기보다는 상식에 가까운 문제들이었던 것이 주효했다. 정말 다행이다.




2. [2과목] 데이터 분석 기획

* [1번] O
- 거시적 관점에 해당하지 않은 것은? 채널


* [2번] O
- 빅데이터의 특징 4V를 고려한 분석 ROI에서 비즈니스 효과(Return)에 해당되는 것은? Value


* [3번] O
- 데이터 표준 용어 설정, 명명 규칙 수립, 메타 데이터 구축, 데이터 사전 구축 등의 업무로 구성된 데이터 거버넌스 

  체계는? 데이터 표준화


* [4번] ??
- 전사 차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영조직 및 책임 등의 표준화된 관리체계를 수립하고 

  운영을 위한 프레임워크 및 저장소를 구축하는 것은? 데이터 거버넌스

​* 전사 차원이면 데이터 거버넌스라는 것은 매우 빈출 문제였는데, 내가 데이터 거버넌스를 제대로 골랐는지 확신이 들지 않는다. 만약 보기 중 데이터웨어하우스가 있었다면, 아마도 데이터웨어하우스를 찍었을 것 같기도한데, 내가 무엇을 골랐는지 기억이 나질 않는다. 2과목은 아무래도 암기할 부분이 많아서 공부를 소홀히 했었는데, 말그대로 큰 코를 다친 느낌이다.

* [5번] O
- 분석 기획 단계의 프로젝트 범위 설정에서 나오는 산출물은? SOW (프로젝트 범위 정의서)


* [6번] O
- 빅데이터 분석 방법론 5단계는?

  . 분석기획 → 데이터 준비 → 데이터분석 → 시스템 구현 → 평가 및 전개


* [7번] ??
- 분석과제 발굴 방법론에서 접근법에 부적합한 것은? 특정 주제별로 분석 기회 선택

​* 유독 2과목에서는 문제와 답이 정확히 기억나지 않는 것이 많다. 7번 역시 마찬가지인데, 보기의 다른 선지가 전혀 기억나지 않는다. 


* [8번] O
- 분석 준비도에 해당하는 것은? 분석업무파악, 인력 및 조직, 분석기법, 분석데이터, 분석문화, IT 인프라

  . 분석 성과는 해당하지 않음


* [9번] O
- 합리적 의사결정을 방해하는 요소로써 표현방식 및 발표자에 따라 동일한 사실에도 판단을 달리하는

  현상을 무엇이라 하는가? 프레이밍 효과 (Framing Effect)


* [10번] X
- 분석 성숙도 수준 분류는? 도입단계, (활용단계), 확산단계, 최적화단계

​* 과거 기출문제 중에는 '활용'단계가 아니라 '확산'단계 부분을 빈칸으로 내었던 문제가 있었다. 다른 객관식 기출문제들도 확산과 최적화 부분의 문제는 많았던 것으로 기억하는데, 활용이란 단어가 도저히 떠오르지 않았다. 난 아마도 '정착'이라는 단어를 썼던 것 같은데........ 쉽게 맞출 수 있던 문제였던 듯 싶어 아쉬움이 남는다.


* 위와 같은 내용으로 난 2과목에서 10문제 중 맞았는지 틀렸는지 모르겠는 것이 2개, 확실히 틀린 것이 1개이다. 가장 보수적으로 계산한다 하여도, 7/10이므로, 이역시 과락의 위험에서는 다행히 벗어날 수 있던 듯 싶다.




3. [3과목] 데이터 분석

* [1번] O
- 비모수검정의 예는? 윌콕슨의 순위합검정, 만-위트니의U 검정, 런 검정 등

  . 카이제곱은 모수적 검정에 해당함


* [2번] O
- ‘A → B’의 신뢰도는 얼마인가? 50%


* [3번] O
- 시계열 데이터에 대한 설명 중 틀린 것은? 잡음은 무작위적인 변동이지만 일반적으로 알려져 있지 않다.


* [4번] O
- 민감도를 구하면? 0.4

  ※ 민감도 (Sensitivity)는? TP / (TP + FN) ※ 재현율 (Recall)과 같음


* [5번] O
- 특이도(Specificity)는? TN / N = TN / (TN + FP)

  ※ 정확도 (Precition)는? TP / (TP + FP)


* [6번] O
- 연관규칙 ‘A → B’의 향상도는 얼마인가? 83%


* [7번] O
- 귀무가설을 기각하게 되는 확률의 크기는? 유의수준


* [8번] O
- 중앙 50%의 데이터들이 흩어진 정도를 의미하는 것은? 사분위범위 (interquartile range)


* [9번] O
- 거리를 이용하여 데이터 간 유사도를 측정할 수 있는 측도에 대한 설명이 부적절한 것은?

  . 마할라노비스 거리는 변수의 표준편차를 고려한 거리 측도이나 변수 간에 상관성이 있는 경우는

   표준화 거리 사용을 검토해야 한다. → 표본 공분산을 사용한다.


* [10번] O
- 파생변수의 특징은?

  . 특정 조건을 말족하거나 특정 함수에 의해 값을 만들어 의미를 부여한 변수

  . 주관적일 수 있으므로 논리적 타당성을 갖추어 개발

  . 세분화, 고객행동 예측, 캠페인 반응 예측에 활용

  . 여러 모형에서 공통적으로 사용될 수 있다. → 요약변수의 특징


* [11번] O
- 상자수염그림에서 박스내 선이 의미하는 값은? Median (중앙값)


* [12번] O
- 모형 기반의 군집 방법으로서 데이터가 k개의 모수적 모형의 가중합으로 표현되는 모집단 모형으로부터 나왔다는 

  가정하에 분석을 하는 방법은? 혼합분포군집


* [13번] O
- 소매점에서 물건을 배열하거나 카탈로그 및 교차판매 등에 적용하기 적합한 데이터마이닝 기법은?

  연관분석 (연관규칙분석, Association Analysis)


* [14번] O
- R에서 데이터 타입이 같지 않은 객체들을 하나의 객체로 묶어놓을 수 있는 자료구조는? 리스트(List)


* [15번] X
- 교차확인(cross validation) 방법 중 부적합한 것은? k=2인 경우, LOOCV라고 한다.

​* LOOCV라는 단어 자체를 시험 중에 처음 보았다. 위 정답이 4번 선지로 기억하는데, 다른 선지와 끝까지 고민하다가 다른 선지를 선택한 기억이 난다. 아쉬움이 남는다.


* [16번] O
- 이질적인 모집단을 세분화하는 기능은? 군집분석


* [17번] O
- 표본조사에 대한 설명으로 부적할 것은?

  . 비표본오차는 조사대상이 증가한다고 해서 오차가 커지지 않는다. → 오차가 커진다.


* [18번] O
- 시간의 흐름에 따라 관찰되는 값은? 시계열 자료


* [19번] ??
- 주성분 분석에 대한 설명으로 부적절한 것은?

  . 원변수의 선형결합 중 가장 분산이 작은 것을 제1주성분(PC1)으로 설정한다. → 가장 분산이 큰 것

* 다른 선지와 고민했었는데, 이 역시도 마지막에 무엇을 찍었는지 기억나지 않는다. 개념에 대한 기본적인 암기가 부족했던 탓이 크다.


* [20번] O
- 상자수염그림에서 예외값은? Q1 – 1.5 * IQR < data < Q3 + 1.5 * IQR → (-8, 24)


* [21번] X
- K-평균군집 수행 절차는?

  . k개의 객체 임의 선택 → 각 자료를 가장 가까운 군집 중심에 할당 → 군집 중심 업데이트 → 반복

* 정답을 써주신 것을 보면 이렇게 명쾌하고 기본적인 이론이 없어 보이는데, 시험을 보던 당시에는 왜그리도 객체 임의 선택이 군집 할당 이후에 이루어져야만 할 것으로 생각 되었는지 모르겠다. 이번 시험 틀린 문제 중 가장 아쉬움이 남는다.

* [22번] ??
- 시계열 분석의 정상성의 특징은?

  . 평균이 일정, 분산이 일정, 공분산도 시차에만 의존하고 실제 특정 시점 t, s에는 의존하는 않음

​* 이 문제는 정말 전혀 기억이 나질 않는다. 3과목은 역시... 쉽지가 않다.


* [23번] ??
- 정상성 시계열 자료의 특징이 아닌 것은? 독립성

​* 이 문제 역시 전혀 기억이 나질 않는다. 이때쯤 주관식 문제들이 보이면서, 멘탈이 점점 흔들렸던 것 같다.


* [24번] X
- 상시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법은? 분해 시계열

​* 사실 이 문제만큼 문제 속에 답이 있는 문제가 있었을까?! '상시계열'이라는 단어 속에서 '시계열'을 발견하지 못한 이유로 고민 끝에 "분리분석방법"이라는 답안을 적어 낸 이틀 전의 내가 너무 바보같이 느껴진다.

* [25번] O
- 시계열 모델 중 자기 자신의 과거 값을 사용하여 설명하는 모형은? 자기회귀모형 (AR모형, Autoregressive Model)


* [26번] ??
- 모형평가 지표 중 True로 예측한 관측치 중 실제값이 True인 정도를 나타내는 지표는? 정확도 (Precision)

* 답안을 보고나니, 누가봐도 '정확도'를 써내야 하는 문제인데, 내가 민감도를 적어냈는지 정확도를 적어냈는지 기억이 잘 나지 않는다. 이틀 전의 내가 조금 더 똑똑했기를 바란다.


* [27번] O
- 의사결정 나무의 단점? 과대적합 (과적합, Overfitting)


* [28번] O
- 인간의 뇌를 기반으로 한 추론 모델은? 인공신경망 (ANN, Artificial Neural Network)


* [29번] X
- 해당모델의 성과가 얼마나 향상되었는지를 각 등급별로 파악하는 그래프는? 이익도표 (Lift chart)

* '그래프'라는 단어를 보고 히스토그램밖에 떠올리지 못한 나는..... ㅜ.ㅜ...

* [30번] O
- 하나의 주제 또는 하나의 부서 중심의 데이터 웨어하우스는? 데이터 마트 (Data Mart)


30문제 중 확실하게 틀린 것은 4문제, 답을 기억하지 못하는 문제가 똑같이 4문제이다. 보수적으로 계산한다면, 총 8문제를 틀렸을 가능성이 있는데, 그렇다면 22/30에 해당한다.
반응형

 

결국 위 복기 자료의 정답이 맞다면, 그리고 내가 기억하고 있는 내 답안이 맞다면, 내 총스코어를 가장 보수적으로, 즉 긴가민가한 모든 것을 틀렸다고 가정했을 때 아래와 같다.

 

1과목 : 7/10
2과목 : 7/10 (운이 좋다면 +2까지 가능)
3과목 : 22/30 (운이 좋다면 +4까지 가능)​

 

ADSP 시험의 합격 기준은 "총점 60점 이상 취득(과목별 40% 미만 취득이 없을 것)"이다.

 

또한 이 시험의 각 문제는 모든 균등한 점수 배분이 이루어져 있어, 문제당 2점의 배점이므로 정답의 수가 30개 이상이면 합격이라는 의미이다. 이 포스팅을 하면서 처음으로 가채점을 해본 것인데, 결과가 좋아서 정말 다행이라는 생각이 든다. 만약 떨어졌다면, 포스팅 중에 꺼버렸을지도 모르겠다ㅋㅋㅋ 기쁘다.

 

어쨌든 요약하자면, 아무리 보수적으로 계산해도 나는 36개의 정답으로 합격이라는 뜻!!

 

 

진짜 금요일만 해도 스트레스 때문에 많이 고통스러웠는데, 가채점 결과로나마 합격의 기쁨을 누리게 되니 기쁘기 그지없다. 특히 막판에 스트레스를 주었던 가장 큰 요인이었던 3과목의 계산문제들이 모두 풀 수 있는 상태로 나와주었기에 더더욱 기쁘다. 

 

시험을 준비하며, 회사를 오고 가는 지하철에서 노래 대신 틀어 놓았던 유튜브인

EduAtoZ 선생님께도 감사드리며,

 

EduAtoZ - Programming

데이터 분석 준 전문가, 빅데이터 분석 기사 실기, Cospro 1급, 2급 등 자격증 관련 내용을 포함하고 있습니다.

www.youtube.com

 

자신의 공부 현황을 공유하는 글을 포스팅해주어, 내가 남들과 함께 공부하는 기분이 들게 해 준 네이버의 많은 네티즌에게도 감사한다. 

 

어쨌든 나뿐만 아니라 이 글을 읽어주신 모든 분들이 합격의 기쁨을 누릴 수 있길 바라며, 오랜만의 포스팅을 마친다. 이젠 다시, 꽤 오래 밀려있는 교대역 맛집 투어 시리즈를 포스팅해야겠다. 

728x90
반응형