11번) 분석과제의 특징 중 Accuracy와 Precision 설명으로 틀린 것은?
답 : 분석의 안정성 - Accuracy, 활용 - Precision 이 중요
해설
분석 프로젝트
분석 프로젝트의 특성 | 분석과제의 5가지 주요속성을 고려한 관리 |
- 분석가의 목표 : 정확도를 높이는 것 & 사용자의 원활한 활용 - 데이터 영역, 비즈니스 영역의 중간에서 조율 - 도출된 결과 재해석을 통한 지속적인 모델 정교화 - 모델 개선을 위한 관리 방안 수립이 필요함 |
- 데이터 양 : 방대하다면 하둡, 클라우드 등을 활용 - 데이터 속도 : 실시간 전달 고려 - 데이터, 분석 복잡도 : 정확도와 복잡도는 트레이드오프 관계 - 정확도(Accuracy) & 정밀도(Precision) |
12번) 분석 기획에 대한 설명으로 적절하지 않은 것은?
답 : 상향식 분석은 분석 기획 전 탐색적 데이터 분석 수행
해설
상향식 분석 (Bottom-Up Approach)
● 다양한 원천 데이터를 대상으로 분석을 수행하여 가치 있는 문제를 도출하는(Problem Creation) 일련의 과정
● 기존 하향식 접근법의 한계를 극복하기 위한 분석 방법론
● 비지도 학습과 지도 학습
하향식 접근 방법 VS 상향식 접근 방법
하향식 접근 방법 | 상향식 접근 방법 |
문제가 주어지고 이에 대한 해법을 찾기 위하여 각 과정이 체계적으로 단계화 되어 수행하는 방식 | 문제의 정의 자체가 어려운 경우 데이터를 기반으로 문제의 재정의 및 해결방안을 탐색하고 이를 지속적으로 개선하는 방 |
■ 상향식 접근법 | 분석 대상을 모름 → 데이터로부터 분석과제 발굴
상향식 접근법이란 | 지도 학습 | 비지도 학습 | 프로토타이핑 접근법 |
- 분석 대상 모름 - 원천 데이터로부터 통찰과 지식을 얻는 방법 - 분석부터 하고, 그 결과로부터 가치있는 문제를 도출함 |
- Supervised Learning - 정답/라벨이 있는 데이터 - 범주형 - 분류 - 연속형 - 회귀 - 의사결정트리, 인공신경망 등 |
- Unsupervised Learning - 정답/라벨이 없는 데이터 - 비슷한 특징을 가진 데이터끼리 군집화 - 군집분석, 주성분분석 등 |
- 시행착오 해결법 - 분석 먼저 → 결과 확인 - 조금씩 개선해나감 - 문제 정의가 불명확하고, 새로운 문제인 경우 |
● 프로토타이핑 접근법의 프로세스:
가설 생성 → 디자인에 대한 실험 → 실제 환경에서의 테스트 → 테스트 결과에서 인사이트 도출 & 가설 확인
● 프로토타이핑 접근법이 필요한 경우
- 문제에 대한 인식수준 낮음 / 문제가 불명확한 경우
- 필요 데이터의 존재여부가 불확실함
- 데이터 사용 목적이 변화함 (고정되지 않음)
13번) 분석 마스터 플랜을 수립할 때 적용 범위 및 방식에 대한 고려요소가 아닌 것은?
답 : 투입 비용 수준
해설
■ 분석 마스터플랜
○ 분석 마스터플랜 : 하나의 분석 프로젝트를 위한 전체 설계도
○ 분석방법론, 과제발굴 수행과정을 모두 아우르는 광의의 개념
■ 분석 마스터플랜 수립 프레임워크
○ 우선순위 설정 - 분석과제 적용범위 및 방식 설정 - 분석 구현 로드맵 수립
우선순위 고려 요소 | 적용범위, 적용방식 고려 요소 |
- 전략적 중요도 - 비즈니스 성과 / ROI - 실행 용이성 |
- 업무 내재화 적용 수준 - 분석 데이터 적용 수준 - 기술 적용 수준 |
=> 적용 우선순위 설정 | => 분석 구현 로드맵 수립 |
14번) 분석 정의서에 대한 설명으로 가장 적절한 것은?
답 : 소스 데이터, 분석 방법, 난이도 등의 분석 과정을 기록한 문서
해설
■ 분석 과제 정의서
● 분석명, 분석 정의, 소스 데이터, 데이터 입수 난이도, 데이터 입수 사유, 분석 방법, 분석 적용 난이도, 분석 적용 난이 사유, 분석 주시, 분석결과 검증 Owner
15번) 분석 수준 진단의 대상으로 가장 적절하지 않은 것은?
답 : 분석 성과에 대한 조사
해설
■ 데이터 분석 수준 진단
- 분석 준비도[Readiness] : 분석 업무, 분석 데이터, 분석 인력●조직, 분석 기법, 분석 인프라, 분석 문화
- 분석 성숙도[Maturity] : 도입 > 활용 > 확산 > 최적화 / 비즈니스, 조직 및 역량, IT
분석 거버넌스 체계 수립 시, 분석준비도와 분석성숙도를 통해 기업의 분석수준을 파악하는 것이 가장 먼저 선행되어야 한다.
■ 분석 성숙도 & 분석 준비도 → 분석 유형 및 방향성 결정
■ 분석 준비도 | 데이터 분석 도입 수준을 파악하기 위한 진단방법
분석 준비도 (Readiness)
분석업무파악 | 분석 인력 및 조직 | 분석기법 |
● 발생한 사실 분석 업무 ● 예측 분석 업무 ● 시뮬레이션 분석 업무 ● 최적화 분석 업무 ● 분석 업무 정기적 개선 |
● 분석전문가 직무존재 ● 분석전문가 교육훈련프로그램 ● 관리자 기본분석능력 ● 전사총괄조직 ● 경영진분석업무이해 |
● 업무별 적합한 분석기법 사용 ● 분석 업무 도입 방법론 ● 분석기법 라이브러리 ● 분석기법 효과성 평가 ● 분석기법 정기적 개선 |
분석데이터 | 분석문화 | IT 인프라 |
● 분석업무를 위한 데이터 충분성/신뢰성/적시성 ● 비구조적 데이터 관리 ● 외부데이터 활용 체계 ● 기준데이터 관리(MDM) |
● 사실에 근거한 의사결정 ● 관리자의 데이터중시 ● 회의 등에서 데이터 활용 ● 경영진 직관보다 데이터 활용 ● 데이터 공유 및 협업 문화 |
● 운영시스템 데이터 통합 ● EAI, ETL 등 데이터유통체계 ● 분석 전용 서버 및 스토리지 ● 빅데이터/통계/비쥬얼 분석환경 |
● 기업의 데이터 분석 도입의 수준을 파악하기 위한 진단 방법
● 분석 업무 파악, 인력 및 조직, 분석 기법, 분석 데이터, 분석문화, IT 인프라
● 분석 준비도 평가 : 분석 업무 파악, 분석 인력 및 조직, 분석 기법, 분석 데이터, 분석 문화, IT 인프라
■ 분석 성숙도 | 3부문 대상으로 평가 - 비즈니스, 조직 및 역량, IT 부문
분석 성숙도 모델 (Maturity)
단계 | 도입 | 활용 | 확산 | 최적화 |
설명 | 분석 시작, 환경과 시스템 구축 |
분석결과를 업무에 적용 | 전사차원에서 분석관리, 공유 | 분석을 진화시켜 혁신 및 성과향상에 기여 |
비즈니스 부문 |
● 실적분석 및 통계 ● 정기보고 수행 ● 운영 데이터 기반 |
● 미래결과예측 ● 시뮬레이션 ● 운영데이터 기반 |
● 전사성과 실시간분석 ● 프로세스혁신 3.0 ● 분석규칙관리 ● 이벤트관리 |
● 외부환경분석 활용 ● 최적화업무 적용 ● 실시간 분석 ● 비즈니스모델진화 |
조직●역량 부문 |
● 일부부서에서 수행 ● 담당자역량에 의존 |
● 전문담당부서수행 ● 분석기법 도입 ● 관리자가 분석수행 |
● 전사 모든 부서 수행 ● 분석 COE 운영 ● 데이터 사이언티스트 확보 |
● 데이터 사이언스 그룹 ● 경영진 분석 활용 ● 전략 연계 |
IT 부문 | ● 데이터 웨어하우스 ● 데이터 마트 ● ETL/EAI ● OLAP |
● 실시간대시보드 ● 통계분석 환경 |
● 빅데이터 관리 환경 ● 시뮬레이션 최적 ● 비쥬얼 분석 ● 분석 전용 서버 |
● 분석 협업환경 ● 분석 SandBox ● 프로세스 내재화 ● 빅데이터 분석 |
● 최종 목표 : 기업이 수행하는 현재의 분석 수준을 명확히 이해하고, 수준진단 결과를 토대로 미래의 목표 수준을 정의 하는 것이다.
● 수준 분류 : 도입 → 활용 → 확산 → 최적화
● 진단 분류 : 비즈니스 부문, 조직●역량 부문, IT 부문
1단계 : 도입 - 분석 시작 - 환경, 시스템 구축 |
2단계 : 활용 분석 결과를 업무에 적용 |
3단계 : 확산 전사 차원에서 분석 관리, 공유 |
4단계 : 최적화 분석을 진화시켜 혁신, 성과향상에 기 |
■ 분석 수준 진단 결과 | 분석 준비도 & 분석 성숙도 진단 결과를 4분면 구분

확산형 - 높은 준비도 - 높은 성숙도 - 지속적 확산이 가능하다. |
도입형 - 높은 준비도 - 낮은 성숙도 - 데이터 분석 도입이 가능하다. |
정착형 - 낮은 준비도 - 높은 성숙도 - 분석의 정착이 필요하다. |
준비형 - 낮은 준비도 - 낮은 성숙도 - 사전 준비가 필요하다. |
16번) 분석 성숙도 모델 구성에서 고려하는 분석 성숙도 진단 부문으로 적절하지 않은 것은?
답 : 기업 문화 부문
해설
15번과 같습니다.
17번) Wage R 코드 분석 결과 중 틀린 것은?
답 : age 와 wage는 양의 상관관계를 가진다.
해설
■ 다변량 분석
● 상관 분석
상관분석은 두 변수 간의 "관계"를 알아보기 위한 것. 상관계수를 이용한다.
등간척도(구간척도; 양적/절대영점X) - 피어슨 상관계수 / 서열척도(순서척도; 질적) - 스피어만 상관계수

■ 양의 상관관계 : 비례 경향 음의 상관관계 : 반비례 경향 직선으로 나타내고 있는 것이 가장 강한 상관관계를 나타내며, 관계가 희미할 수록 상관계수는 0에 가깝다.
18번) 웹 데이터의 수집을 위해 웹페이지의 구조를 분석하여 데이터를 자동으로 수집하는 방법은?
답 : 웹 크롤링(Web Crawling)
해설
■ 데이터 수집기술
● Crawling, 크롤링
◎ 뉴스, SNS, 웹페이지 등의 인터넷 정보를 수집한다.
◎ 데이터 종류(웹 페이지)
19번) 오른쪽 꼬리가 긴(right-skewed)분포를 나타내는 자료의 평균과 중앙값의 관계는?
답 : 평균이 중간값보다 큰 경향을 보인다.
해설
■ 자료의 분포 모양에 따른 중위수와 평균의 차이
산술 평균과 중위수를 분포의 모양에 따라 비교해보면, 대칭인 분포에서는 산술평균과 중위수가 일치한다.
왼쪽으로 꼬리가 긴(left-skewed) 분포에서는 평균이 더 작은 값을 갖고 오른쪽으로 꼬리가 긴(right-skewed) 분포에서는 평균이 더 큰 값을 가지게 된다.
왼쪽으로 꼬리가 긴 분포에서는 다른 값들에 비해 매우 작은 특이점들이 존재하여 그 값들로 인해 평균이 작아지게 되고, 오른쪽으로 꼬리가 긴 분포에서는 매우 큰 특이점들이 존재하여 그 값들로 인해 평균이 커지게 된다.



대칭인 분포 | 왼쪽으로 꼬리가 긴 분포 | 오른쪽으로 꼬리가 긴 분포 | |
평균, 중위수 차이 | 평균 = 중위수 | 평균 < 중위수 | 평균 > 중위수 |
특이점 | 거의 존재하지 않음 | 크기가 작음 | 크기가 큼 |
예시 | 정규분포 | 연봉의 분포 | 인간 수명의 분포 |
20번) 앙상블 모형의 특징으로 가장 적절하지 않은 것은?
답 : 각 모형의 상호 연관성이 높을수록 정확도가 향상된다.
해설
■ 앙상블 모형

■ 앙상블 모형의 정의와 특징
- 여러 개의 분류모형에 의한 결과를 종합하여 분류의 정확도를 높이는 방법
- 분리 분석의 과적합을 줄이기 위해 개발
- 적절한 표본추출법으로 여러 개의 훈련용 데이터를 만들고, 훈련용 데이터마다 하나의 분류기를 만들어 앙상블하는 방
'ADsP 자격증 공부' 카테고리의 다른 글
ADsP 36회 기출문제 20문제 (0) | 2024.07.08 |
---|---|
ADsP 36회 기출문제 객관식 10문제 (1) | 2024.07.05 |