본문 바로가기
ADsP 자격증 공부

ADsP 36회 기출문제 객관식 10문

by 데이터 분석가가 되자 2024. 7. 6.
반응형

11번) 분석과제의 특징 중 Accuracy와 Precision 설명으로 틀린 것은?

 

답 : 분석의 안정성 - Accuracy, 활용 - Precision 이 중요

 

더보기

해설

 

분석 프로젝트

 

분석 프로젝트의 특성 분석과제의 5가지 주요속성을 고려한 관리
- 분석가의 목표 : 정확도를 높이는 것 & 사용자의 원활한 활용
- 데이터 영역, 비즈니스 영역의 중간에서 조율
- 도출된 결과 재해석을 통한 지속적인 모델 정교화
- 모델 개선을 위한 관리 방안 수립이 필요함
- 데이터 양 : 방대하다면 하둡, 클라우드 등을 활용
- 데이터 속도 : 실시간 전달 고려
- 데이터, 분석 복잡도 : 정확도와 복잡도는 트레이드오프 관계
- 정확도(Accuracy) & 정밀도(Precision)

 

12번) 분석 기획에 대한 설명으로 적절하지 않은 것은?

 

답 : 상향식 분석은 분석 기획 전 탐색적 데이터 분석 수행

 

더보기

해설

 

상향식 분석 (Bottom-Up Approach)

 

● 다양한 원천 데이터를 대상으로 분석을 수행하여 가치 있는 문제를 도출하는(Problem Creation) 일련의 과정

● 기존 하향식 접근법의 한계를 극복하기 위한 분석 방법론

● 비지도 학습과 지도 학습

 

하향식 접근 방법 VS 상향식 접근 방법

 

하향식 접근 방법 상향식 접근 방법
문제가 주어지고 이에 대한 해법을 찾기 위하여 각 과정이 체계적으로 단계화 되어 수행하는 방식 문제의 정의 자체가 어려운 경우 데이터를 기반으로 문제의 재정의 및 해결방안을 탐색하고 이를 지속적으로 개선하는 방

 ■ 상향식 접근법 | 분석 대상을 모름 → 데이터로부터 분석과제 발굴

 

상향식 접근법이란 지도 학습 비지도 학습 프로토타이핑 접근법
- 분석 대상 모름
- 원천 데이터로부터
통찰과 지식을 얻는 방법
- 분석부터 하고, 그 결과로부터 가치있는 문제를 도출함
- Supervised Learning
- 정답/라벨이 있는 데이터
- 범주형 - 분류
- 연속형 - 회귀
- 의사결정트리, 인공신경망 등
- Unsupervised Learning
- 정답/라벨이 없는 데이터
- 비슷한 특징을 가진
데이터끼리 군집화
- 군집분석, 주성분분석 등
- 시행착오 해결법
- 분석 먼저 → 결과 확인
- 조금씩 개선해나감
- 문제 정의가 불명확하고,
새로운 문제인 경우

● 프로토타이핑 접근법의 프로세스:

   가설 생성 → 디자인에 대한 실험 → 실제 환경에서의 테스트 → 테스트 결과에서 인사이트 도출 & 가설 확인

 

● 프로토타이핑 접근법이 필요한 경우

   - 문제에 대한 인식수준 낮음 / 문제가 불명확한 경우

   - 필요 데이터의 존재여부가 불확실함

   - 데이터 사용 목적이 변화함 (고정되지 않음) 

 

 

13번) 분석 마스터 플랜을 수립할 때 적용 범위 및 방식에 대한 고려요소가 아닌 것은?

 

답 : 투입 비용 수준

 

더보기

해설

 

■ 분석 마스터플랜

   ○ 분석 마스터플랜 : 하나의 분석 프로젝트를 위한 전체 설계도

   ○ 분석방법론, 과제발굴 수행과정을 모두 아우르는 광의의 개념

 

■ 분석 마스터플랜 수립 프레임워크

   ○ 우선순위 설정 - 분석과제 적용범위 및 방식 설정 - 분석 구현 로드맵 수립

 

우선순위 고려 요소 적용범위, 적용방식 고려 요소
- 전략적 중요도
- 비즈니스 성과 / ROI
- 실행 용이성
- 업무 내재화 적용 수준
- 분석 데이터 적용 수준
- 기술 적용 수준
=> 적용 우선순위 설정 => 분석 구현 로드맵 수립

 

 

14번) 분석 정의서에 대한 설명으로 가장 적절한 것은?

 

답 : 소스 데이터, 분석 방법, 난이도 등의 분석 과정을 기록한 문서

 

더보기

해설

 

■ 분석 과제 정의서

 

● 분석명, 분석 정의, 소스 데이터, 데이터 입수 난이도, 데이터 입수 사유, 분석 방법, 분석 적용 난이도, 분석 적용 난이 사유, 분석 주시, 분석결과 검증 Owner

 

15번) 분석 수준 진단의 대상으로 가장 적절하지 않은 것은?

 

답 : 분석 성과에 대한 조사

 

더보기

해설

 

■ 데이터 분석 수준 진단

 

  •  분석 준비도[Readiness] : 분석 업무, 분석 데이터, 분석 인력●조직, 분석 기법, 분석 인프라, 분석 문화
  •  분석 성숙도[Maturity] : 도입 > 활용 > 확산 > 최적화 / 비즈니스, 조직 및 역량, IT
분석 거버넌스 체계 수립 시, 분석준비도와 분석성숙도를 통해 기업의 분석수준을 파악하는 것이 가장 먼저 선행되어야 한다.

 

■ 분석 성숙도 & 분석 준비도 → 분석 유형방향성 결정

 

■ 분석 준비도 | 데이터 분석 도입 수준을 파악하기 위한 진단방법

 

분석 준비도 (Readiness)

 

분석업무파악 분석 인력 및 조직 분석기법
● 발생한 사실 분석 업무
● 예측 분석 업무
● 시뮬레이션 분석 업무
● 최적화 분석 업무
● 분석 업무 정기적 개선
● 분석전문가 직무존재
● 분석전문가 교육훈련프로그램
● 관리자 기본분석능력
● 전사총괄조직
● 경영진분석업무이해
● 업무별 적합한 분석기법 사용
● 분석 업무 도입 방법론
● 분석기법 라이브러리
● 분석기법 효과성 평가
● 분석기법 정기적 개선
분석데이터 분석문화 IT 인프라
● 분석업무를 위한 데이터 충분성/신뢰성/적시성
● 비구조적 데이터 관리
● 외부데이터 활용 체계
● 기준데이터 관리(MDM)
● 사실에 근거한 의사결정
● 관리자의 데이터중시
● 회의 등에서 데이터 활용
● 경영진 직관보다 데이터 활용
● 데이터 공유 및 협업 문화
● 운영시스템 데이터 통합
● EAI, ETL 등 데이터유통체계
● 분석 전용 서버 및 스토리지
● 빅데이터/통계/비쥬얼 분석환경

● 기업의 데이터 분석 도입의 수준을 파악하기 위한 진단 방법

● 분석 업무 파악, 인력 및 조직, 분석 기법, 분석 데이터, 분석문화, IT 인프라

● 분석 준비도 평가 분석 업무 파악, 분석 인력 및 조직, 분석 기법, 분석 데이터, 분석 문화, IT 인프라

 

■ 분석 성숙도 | 3부문 대상으로 평가 - 비즈니스, 조직 및 역량, IT 부문

 

분석 성숙도 모델 (Maturity)

 

단계 도입 활용 확산 최적화
설명 분석 시작,
환경과 시스템 구축
분석결과를 업무에 적용 전사차원에서 분석관리, 공유 분석을 진화시켜 혁신 및 성과향상에 기여
비즈니스
부문
● 실적분석 및 통계
● 정기보고 수행
● 운영 데이터 기반
● 미래결과예측
● 시뮬레이션
● 운영데이터 기반
● 전사성과 실시간분석
● 프로세스혁신 3.0
● 분석규칙관리
● 이벤트관리
● 외부환경분석 활용
● 최적화업무 적용
● 실시간 분석
● 비즈니스모델진화
조직●역량
부문
● 일부부서에서 수행
● 담당자역량에 의존
● 전문담당부서수행
● 분석기법 도입
● 관리자가 분석수행
● 전사 모든 부서 수행
● 분석 COE 운영
● 데이터 사이언티스트 확보
● 데이터 사이언스 그룹
● 경영진 분석 활용
● 전략 연계
IT 부문 ● 데이터 웨어하우스
● 데이터 마트
● ETL/EAI
● OLAP
● 실시간대시보드
● 통계분석 환경
● 빅데이터 관리 환경
● 시뮬레이션 최적
● 비쥬얼 분석
● 분석 전용 서버
● 분석 협업환경
● 분석 SandBox
● 프로세스 내재화
● 빅데이터 분석

 

● 최종 목표 : 기업이 수행하는 현재의 분석 수준을 명확히 이해하고,  수준진단 결과를 토대로 미래의 목표 수준을 정의 하는 것이다.

 

● 수준 분류 : 도입 → 활용 → 확산 → 최적화

 

● 진단 분류 : 비즈니스 부문, 조직●역량 부문, IT 부문

 

1단계 : 도입

- 분석 시작
- 환경, 시스템 구축
2단계 : 활용

분석 결과를 업무에 적용
3단계 : 확산

전사 차원에서 분석 관리, 공유
4단계 : 최적화

분석을 진화시켜 혁신, 성과향상에 기

 

■ 분석 수준 진단 결과 | 분석 준비도 & 분석 성숙도 진단 결과를 4분면 구분

 

 

확산형

- 높은 준비도
- 높은 성숙도
- 지속적 확산이 가능하다.
도입형

- 높은 준비도
- 낮은 성숙도
- 데이터 분석 도입이 가능하다.
정착형

- 낮은 준비도
- 높은 성숙도
- 분석의 정착이 필요하다.
준비형

- 낮은 준비도
- 낮은 성숙도
- 사전 준비가 필요하다.

 

 

 

16번) 분석 성숙도 모델 구성에서 고려하는 분석 성숙도 진단 부문으로 적절하지 않은 것은?

 

답 : 기업 문화 부문

 

더보기

해설

 

15번과 같습니다.

 

17번) Wage R 코드 분석 결과 중 틀린 것은?

 

답 : age 와 wage는 양의 상관관계를 가진다.

 

더보기

해설

 

■ 다변량 분석

 

● 상관 분석

   상관분석은 두 변수 간의 "관계"를 알아보기 위한 것. 상관계수를 이용한다.

   등간척도(구간척도; 양적/절대영점X) - 피어슨 상관계수 / 서열척도(순서척도; 질적) - 스피어만 상관계수

 

■ 양의 상관관계 : 비례 경향 음의 상관관계 : 반비례 경향 직선으로 나타내고 있는 것이 가장 강한 상관관계를 나타내며, 관계가 희미할 수록 상관계수는 0에 가깝다.

 

18번) 웹 데이터의 수집을 위해 웹페이지의 구조를 분석하여 데이터를 자동으로 수집하는 방법은?

 

답 : 웹 크롤링(Web Crawling)

 

더보기

해설

 

■ 데이터 수집기술

 

● Crawling, 크롤링

   ◎ 뉴스, SNS, 웹페이지 등의 인터넷 정보를 수집한다.

   ◎ 데이터 종류(웹 페이지)

 

19번) 오른쪽 꼬리가 긴(right-skewed)분포를 나타내는 자료의 평균과 중앙값의 관계는?

 

답 : 평균이 중간값보다 큰 경향을 보인다.

 

더보기

해설

 

■ 자료의 분포 모양에 따른 중위수와 평균의 차이

   산술 평균과 중위수를 분포의 모양에 따라 비교해보면, 대칭인 분포에서는 산술평균과 중위수가 일치한다.

   왼쪽으로 꼬리가 긴(left-skewed) 분포에서는 평균이 더 작은 값을 갖고 오른쪽으로 꼬리가 긴(right-skewed) 분포에서는 평균이 더 큰 값을 가지게 된다.

   왼쪽으로 꼬리가 긴 분포에서는 다른 값들에 비해 매우 작은 특이점들이 존재하여 그 값들로 인해 평균이 작아지게 되고, 오른쪽으로 꼬리가 긴 분포에서는 매우 큰 특이점들이 존재하여 그 값들로 인해 평균이 커지게 된다.

   

 

 

 

 

  대칭인 분포 왼쪽으로 꼬리가 긴 분포 오른쪽으로 꼬리가 긴 분포
평균, 중위수 차이 평균 = 중위수 평균 < 중위수 평균 > 중위수
특이점 거의 존재하지 않음 크기가 작음 크기가 큼
예시 정규분포 연봉의 분포 인간 수명의 분포

 

 

20번) 앙상블 모형의 특징으로 가장 적절하지 않은 것은?

 

답 : 각 모형의 상호 연관성이 높을수록 정확도가 향상된다.

 

더보기

해설

 

■ 앙상블 모형

 

■ 앙상블 모형의 정의와 특징

- 여러 개의 분류모형에 의한 결과를 종합하여 분류의 정확도를 높이는 방법

- 분리 분석의 과적합을 줄이기 위해 개발

- 적절한 표본추출법으로 여러 개의 훈련용 데이터를 만들고, 훈련용 데이터마다 하나의 분류기를 만들어 앙상블하는 방

 

 

'ADsP 자격증 공부' 카테고리의 다른 글

ADsP 36회 기출문제 20문제  (0) 2024.07.08
ADsP 36회 기출문제 객관식 10문제  (1) 2024.07.05