본문 바로가기
ADsP 자격증 공부

ADsP 36회 기출문제 객관식 10문제

by 데이터 분석가가 되자 2024. 7. 5.
반응형

1번) 데이터웨어하우스에 대한 설명으로 가장 적절하지 않은 것은?

 

답 : 데이터웨어하우스는 전사적 차원보다는 특정 조직의 특정 업무 분야에 초점이 맞춰져 있다.

 

더보기

해설

데이터웨어하우스(Data Warehouse)란 정보 검색을 목적으로 구축된 전사적 단위의 데이터 베이스이다.

사업부 단위의 데이터 마트(Data Mart)와 비교되는 개념이다.

 

DW의 특성

 

  1. 데이터를 주제별로 구성하여 사용자가 이해하기 쉬운 형태가 된다. (데이터 주제 지향성)
  2. 데이터가 DW에 입력될 때는 일관적인 형태로 변환된다. (데이터 통합)
  3. 데이터는 일정 기간 동안 정확성을 나타낸다. (데이터의 시계열성)
  4. 일단 데이터가 기록되면 원본 raw 데이터는 함부로 변경할 수 없다. (데이터의 비휘발성)

 

2번) 개인정보 비식별화 기법을 설명한 것으로 부적절한 것은?

 

답 : 데이터 마스킹은 개인정보 식별이 가능한 특정 데이터값을 삭제

 

더보기

해설

개인정보 비식별 기술

 

비식별 기술이란 데이터 셋에서 개인을 식별할 수 있는 요소를 전부 또는 일부 삭제하거나 다른 값으로 대처하는 등의 방법으로 개인을 알아볼 수 없도록 하는 기술

 

① 데이터 마스킹

 

데이터의 길이, 유형, 형식과 같은 속성을 유지한 채, 새롭고 읽기 쉬운 데이터를 익명으로 생성하는 기술

   ex) 홍길동, 20세, 서울거주, 한국대

   → 홍**, 20세, 서울거주, **대

 

② 가명처리

 

개인 식별에 중요한 데이터를 식별할 수 있는 다른 값으로 변경하는 기술

다른 값으로 대체 시 일정한 규칙이 노출되지 않도록 주의해야 한다.

   → 난수화[Random number] : 규칙적이지 않게 나열되어 예측이 불가능한 숫자

   ex) 홍길동, 20세, 서울거주, 한국대 재학

   → 허균저, 20세, 서울거주, 서울대 재학

 

③ 총계처리

 

데이터 총계 합을 보냄으로써 개인 데이터의 값이 보이지 않도록 하는 기술

단, 특정 속성을 지닌 개인으로 구성된 단체의 속성 정보를 공개하는 것은 개인정보 공개와 동일한 결과를 초래하므로 주의해야 한다.

   ex) 하하 168cm, 박명수 173cm, 서장훈 205cm, 유재석 178cm

   → 유명한 방송인들 의 키 합 : 724cm 평균키 : 181cm

 

④ 데이터 값 삭제

 

데이터 공유, 개방목적에 따라 데이터셋에 구성된 값 중에 필요없는 값 또는 개인식별에 중요한 값을 삭제

날짜와 관련된 개인정보[자격취득일자, 출생일 등]는 연단위로 처리

 

   ex) 유재석, 51세, 서울거주, 서울예술대 출신

   → 51세, 서울거주

 

⑤ 데이터 범주

 

데이터 값을 범주의 값으로 변환하여 값을 숨긴다.

 

범주 : 동일한 성질을 가진 부류나 범위

 

   ex) 유재석, 51세

   → 유씨, 50~59세

 

3번) 데이터베이스에 대한 설명으로 가장 적절하지 않은 것은?

 

답 : 데이터베이스 내의 모든 데이터는 2차원 테이블로 표현

 

더보기

해설

 

(1) DB System - DB와 DBMS로 구성

● DB : 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있게 정리한 정보의 집합체

● DBMS : 이용자가 쉽게 데이터베이스를 구축, 유지할 수 있게하는 관리 소프트웨어

 

(2) 데이터베이스의 일반적 특징 / 통합, 저장, 공용, 변화

● 통합된 데이터 : 동일한 내용의 데이터가 중복 불가능

● 저장된 데이터 : 컴퓨터 매체가 접근할 수 있는 저장 매체에 저장되어 있다.

● 공용 데이터 : 여러 사용자가 공유할 수 있다.

● 변화하는 데이터 : 삽입, 수정, 삭제를 통해 항상 최신의 정확한 데이터를 유지해야 한다.

 

(3) 데이터베이스의 다양한 측면에서의 특징

<1> 정보의 축적 및 전달 측면

 

● 기계 가독성 : 정보처리기기가 읽고 쓸 수 있다.

● 검색 가능성 : 필요한 정보를 검색할 수 있다.

● 원격 조작성 : 온라인으로 이용 가능하다.

 

<2> 정보이용 측면

 

● 이용자의 정보 요구에 따라 다양한 정보를 신속하게 획득하고, 원하는 정보를 경제적으로 찾아낼 수 있다.

 

<3> 정보관리 측면

 

● 방대한 양의 정보를 체계적으로 축적하고, 새로운 내용 추가나 갱신이 용이하다.

 

<4> 정보기술발전 측면

 

● 데이터베이스는 정보처리, 검색, 관리 소프트웨어 등 네트워크 발전 기술을 견인할 수 있다.

 

<5> 경제, 산업적 측면

 

● 다양한 정보를 필요에 따라 신속하게 제공, 이용할 수 있는 인프라로서 특성을 가지고 있어 경제, 산업, 사회 활동의 효율성을 제고하고 국민의 편의를 증진하는 수단으로서 의미를 가진다.

 

■ DBMS의 종류

 

(1) 관계형 DBMS

- 컴럼과 로유를 이루는 하나 이상의 테이블로 정리

- 키가 존재

 

(2) 객체지향 DBMS

- 정보를 객체 형태로 표현하는 데이터베이스 모델

 

(3) 네트워크 DBMS

- 레코드 = 노드, 관계 = 간선, 으로 표현되는 그래프 기반 데이터베이스 모델

 

(4) 계층형 DBMS

- 트리 구조를 기반으로 하는 계층 데이터베이스 모델

 

 

4번) 사생활 침해 문제를 해결하기 위한 방법으로 가장 적절한 것은?

 

답 : 개인정보 사용자 책임제도 도입

 

더보기

해설

 

■ 빅데이터 시대의 위기 요인과 통제 방안

 

(1) 사생활 침해

- 개인정보가 포함된 데이터를 목적 외에 활용할 경우 사생활 침해를 넘어 사회, 경제적 위협으로 변형될 수 있다.

- 빅데이터에 의한 사생활 침해 문제를 해결하기에는 부족한 측면이 많아 좀 더 포괄적인 해결책으로 동의제를 책임제로 바꾸는 방안을 제안한다. → 동의에서 책임으로

- 사생활 침해 사례 : 여행 사실을 트윗한 사람의 집을 강도가 노리는 고전적인 사례 발생 → 익명화 기술 발전이 필요하다.

 

(2) 책임 원칙 훼손

- 빅데이터 기본 분석과 예측 기술이 발전하면서 정확도가 증가한 만큼, 분석 대상이 되는 사람들은 예측 알고리즘의 희생양이 될 가능성도 올라간다. 책임 원칙 훼손 위기 요인에 대한 통제 방안으로는 기존의 책임 원칙을 좀 더 보강하고 강화한다. → 결과 기반 책임 원칙 고수

- 책임 훼손의 사례 : 범죄 예측 프로그램을 통해 범죄 전 체포

 

(3) 데이터 오용

- 빅데이터는 일어난 일에 대한 데이터에 의존하기 때문에 이를 바탕으로 미래를 예측하는 것은 적지 않은 정확도를 가질 수 있지만 항상 맞을 수는 없다. 또한 잘못된 지표를 사용하는 것도 빅데이터의 폐해가 될 수 있다. 대응책으로 알고리즘에 대한 접근권을 제공하여 알고리즘의 부당함을 반증할 수 있는 방법을 명시해 공개할 것을 주문한다. → 알고리즘 접근 허용

- 알고미즈미스트는 데이터오용의 피해를 막아주는 역할을 한다. 

 

5번) 개인의 내재된 경험을 객관적인 데이터로 변환하여 문서나 매체에 저장●가공●분석하는 과정은?

 

답 : 표출화

 

더보기

해설

 

■ SECI 모델 (Socialization - Externalization - Combination - Internalization Model) ★

 

- 암묵지 + 형식지의 4단계 지식전환 모드

 

1) 공동화 : 경험의 공유를 통해 새로운 암묵지 창조

   - 암묵지 지식 노하우를 다른 사람에게 알려주기

 

2) 표출화 : 암묵지에서 구체적인 개념을 도출하여, 암묵지를 형식지로 표출

   - 암묵적 지식 노하우를 책이나 교본 등 형식지로 만들기

 

3) 연결화 : 표출된 형식지의 완성도를 높여 지식체계로 전환

   - 책이나 교본(형식지)에 자신이 알고 있는 새로운 지식(형식지)를 추가하기

 

4) 내면화 : 표준화와 연결화로 공유된 정신 모델이나 기술적 노하우가 개인의 암묵지로 내면화

   - 만들어진 책이나 교본(형식지)를 보고 다른 직원들이 암묵적 지식(노하우)을 습득

 

5) 위의 4가지 과정 (공동화, 표출화, 연결화, 내면화) 이 순환하면서 창조된다.

 

6번) 빅데이터가 가치 창출 측면에서 기업, 정부, 개인에게 미친 영향은?

 

답 : 개인은 맞춤형 서비스를 받거나 적시에 필요한 정보를 얻음으로써 기회비용을 절약

 

더보기

해설

 

■ 빅데이터의 영향

 

빅데이터가 미치는 영향    
분야 영향 내용
기업 혁신, 경쟁력 제고, 생산성 향상 ■ 혁신 : 소비자의 행동 분석, 시장 예측 등을 통해 비즈니스 모델을 혁신하고 신산업 발굴

■ 경쟁력 제고 : 원가절감, 제품 차별화, 투명성 제고 등에 활용하여 강한 경쟁력 확보

■ 생산성 향상 : 기업의 운용 효율성 향상으로 산업 및 국가 전체의 생산성 향상
정부 환경 탐색, 상황 분석, 미래 대응 ■ 환경 탐색 : 기상, 인구이동, 통계 등을 수집해 사회 변화를 추정하고 재해 정보를 추출한다.

■ 상황 분석 : 수집된 데이터를 분석하여 의제 도출한다.

■ 미래 대응 : 도출된 의제에 대한 법제도, 미래 성장 전략, 국가 안보 등의 대응 방안 획득한다.
개인 목적에 따른 활용 ■ 개인은 빅데이터를 서비스하는 기업의 출현으로 비용이 지속적으로 하락하여 정치인이나 대중 가수 등이 인지도 향상에 빅데이터를 활용한다.
생활 전반의 스마트화    

 

7번) 데이터 사이언스에 대한 설명으로 가장 부적절한 것은?

 

답 : 정형 데이터를 대상으로 총체적 접근법을 활용

 

더보기

해설

 

■ 데이터 사이언스(Data Science)

데이터 공학, 수학, 통계학, 컴퓨터 공학, 시각화, 해커의 사고방식, 해당 분야의 전문지식을 종합한 학문

 

■ 데이터로부터 의미 있는 정보를 추출해내는 학문으로 데이터 마이닝과 개념적으로 유사하다.

■ 기존 통계학과 달리 '총체적 접근법'을 사용한다.

■ 정형, 비정형을 막론하고 다양한 유형의 데이터를 대상으로 분석뿐만 아니라 이를 효과적으로 구현하고 전달하는 과정까지를 포함한 포괄적 개념 (데이터 사이언스에서 시각화와 효과적 커뮤니케이션은 매우 중요한 요소이다.)

■ 데이터 사이언스는 과학과 인문의 교차로

 

■ 데이터 사이언스 구성요소

 

① IT

   시그널 프로세싱, 데이터 엔지니어링, 데이터 웨어하우스, 프로그래밍(파이썬 프로그래밍), 고성능 컴퓨터(분산 컴퓨팅)

② Analytics

   수학, 확률모델, 머신러닝, 분석학, 패턴인식과 학습, 불확실한 모델링

③ Business Analytics [비즈니스 분석]

   커뮤니케이션, 프레젠테이션, 스토리텔링, 시각화

 

■ 데이터 사이언스의 한계

분석과정에서 가정 등 인간의 해석이 개입되는 단계를 반드시 거친다.

분석 결과가 의미하는 바는 사람에 따라 전혀 다른 해석을 내릴 수 있다.

아무리 정량적인 분석이라도 모든 분석은 가정에 근거한다.

   → 분석의 정확성에 초점을 맞춰 분석하는 것이 아님

 

8번) 데이터에 대한 설명으로 가장 적절하지 않은 것은?

 

답 : 데이터는 축적된 지식과 아이디어가 결합된 창의적 산물

 

더보기

해설

 

■ 데이터의 정의

- 데이터는 추론과 추정의 근거를 이루는 사실이다.

- 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 가지는 것으로 설명되고 있다.

 

■ 데이터의 특성

- 존재적 특성 : 객관적 사실

- 당위적 특성 : 추론●예측 ●전망 추정을 위한 근거

 

■ 데이터의 유형

- 정성적(Qualitative) 데이터 : 그 형태와 형식이 정해져 있지 않아서 저장, 검색, 분석하는데 많은 비용과 기술적 투자가 수반된다.

   예) 언어, 문자 등

 

- 정량적(Quantitative) 데이터 : 데이터의 양이 크게 증가하더라도 저장, 검색, 분석하여 활용하기 용이하다.

   예) 수치

 

 

■ 지식경영의 핵심 이슈

- 데이터는 지식경영의 핵심 이슈인 암묵지와 형식지의 상호작용에 있어 중요한 역할을 한다.

 

구분 의미
암묵지 학습과 경험을 통해
개인에게 체화되어 있지만
겉으로 드러나지 않는 지식
김치 담그기
자전거 타기
형식지 문서나 매뉴얼처럼
형상화된 지식
교과서
비디오
DB

 

- 암묵지는 사회적으로 중요하지만 다른 사람에게 공유되기 어렵다. 개인에게 축적된 내면화된 지식이 조직의 지식으로 공통화 된다.

 

- 형식지는 전달과 공유가 용이하다. 언어, 기호, 숫자로 표준화된 지식이 개인의 지식으로 연결화

 

9번) 분석 대상은 명확하지만 분석 방식이 명확하지 않은 경우 수행하는 분석 주제의 유형은?

 

답 : 솔루션(Solution)

 

더보기

해설

 

■ 분석 주제 유형 ★

- 4가지 유형을 융합적으로 반복

 

(1) 최적화(Optimization) : 분석 대상 및 분석 방법을 이해하고 현 문제를 최적화 형태로 수행

(2) 솔루션(Solution) : 분석 과제는 수행되고, 분석 방법을 알지 못하는 경우 솔루션을 찾는 방식으로 분석 과제 수행

(3) 통찰(Insight) : 분석 대상이 불분명하고, 분석 방법을 알고 있는 경우 인사이트로 도출 ★

(4) 발견(Discovery) : 분석 대상, 방법을 모른다면 발견을 통하여 분석 대상 자체를 새롭게 도출

 

분석의 대상(What) →
분석의 방법(How) ↓
Known Un-Known
Known 최적화(Optimization) 통찰(Insight)
Un-Known 솔루션(Solution) 발견(Discovery)

 

10번) 분석 마스터플랜의 세부 이행계획 수립 시 고려해야 할 데이터 분석체계는?

 

답 : 프로젝트의 세부 일정계획도 데이터 분석체계를 고려하여 작성한다.

 

더보기

해설

 

■ 분석 마스터 플랜 수립 프레임 워크

 

- 데이터 기반 구축을 위해 분석 과제를 대상으로 전략적 중요도, 비즈니스 성과 및 ROI, 분석 과제 실행의 용이성 등 다양한 기준을 고려해 적용 우선순위를 설정한다.

 

- 업무 내재화 적용 수준, 분석 데이터 적용 수준, 기술 적용 수준 등 분석 적용 범위 및 방식에 대해 종합적으로 고려하여 데이터 분석 구현을 위한 로드맵을 수립한다.

 

-★ISP(Information Strategy Planning) : 기업의 경영목표 달성에 필요한 전략적 주요 정보를 포착하고, 주요 정보를 지원하기 위해 전사적 관점의 정보 구조를 도출하며, 이를 수행하기 위한 전략 및 실행 계획을 수립하는 전사적인 종합추진 계획이다. 정보 기술 또는 정보시스템을 전략적으로 활용하기 위해 조직 내●외부 환경을 분석하여 기회나 문제점을 도출하고 사용자의 요구사항을 분석하여 시스템 구축 우선순위를 결정하는 등 중장기 마스터 플랜을 수립한다.

 

- 분석 마스터 플랜 : 일반적인 ISP 방법론을 활용하되 데이터 분석 기획의 특성을 고려하여 수행하고 기업에서 필요한 데이터 분석 과제를 빠짐없이 도출한 후 과제의 우선순위를 결정하고 단기 및 중●장기로 나누어 계획을 수립한다.

 

■ 우선순위 평가 방법 및 절차

 

- 정의된 데이터 과제에 대한 실행 순서를 정하는 방식이다.

 

- 업무 영역별로 도출된 분석 과제를 우선순위 평가기준에 따라 평가하고, 과제 선행의 선●후행 관계를 고려하여 적용 순위를 확정한다.

 

- 최근에 새롭게 생성되는 비정형 데이터와 기존의 정형 데이터가 결합되어 분석됨으로써 새로운 가치(Value)가 창출된다는 점에서 빅데이터를 4V로 정의하기도 한다.

 

 

■ ROI 관점에서 빅데이터의 핵심 특징

 

(1) 투자 비용(Investment) 요소

 

- Volume, Variety, Velocity

 

(2) 비즈니스 효과(Return) 요소 ★

 

- 가치(Value) : 분석 결과를 활용하거나 실질적인 실행을 통해 얻게 되는 비즈니스 효과 측면의 요소라고 볼 수 있다. 이는 기업의 데이터 분석을 통해 추구하거나 달성하고자 하는 목표 가치라고 정의할 수 있다.

 

■ 데이터 분석 과제를 추진할 때 고려해야 하는 우선순위 평가 기준 ★

 

  URGENT NOT URGENT
IMPORTANT Quadrant Ⅰ
urgent and import
DO
Quadrant Ⅱ
not urgent
but important
PLAN
NOT IMPORTANT Quadrant Ⅲ
urgent but
not important
DELEGATE
Quadrant Ⅳ
not urgent and
not important
ELIMINATE

 

(1) 시급성 ★

 

- 전략적 중요도와 목표 가치에 부합하는지에 따른 시급성이 가장 중요한 기준이다. 시급성의 판단 기준은 전략적 중요도가 핵심이며, 이는 현재의 관점에서 전략적 가치를 둘 것인지 미래의 중장기적 관점에서 전략적인 가치를 둘 것인지를 고려하고, 분석 과제의 목표가치(KPI)를 함께 고려하여 시급성 여부를 판단할 수 있다.

 

(2) 난이도

 

- 데이터를 생성, 저장, 가공, 분석하는 비용과 현재 기업의 분석 수준을 고려한 난이도 역시 중요한 기준이다.

난이도는 현 시점에서 과제를 추진하는 것이 적용 비용 측면과 범위 측면에서 바로 적용하기 쉬운 것인지 또는 어려운 것인지에 대한 판단 기준으로서, 데이터 분석의 적합성 여부를 본다.

 

- 우선순위 선정 기준을 토대로 난이도 또는 시급성을 고려하여 분석 과제를 4가지 유형으로 구분한 뒤, 분석 과제의 적용 우선순위를 결정한다.

 

- 사분면 영역에서 가장 우선적인 분석 과제 적용이 필요한 영역은 3사분면이다.

 

- 분석과제의 적용 우선순위 기준을 "시급성"에 둔다면 3→4→2 영역 순이며, 우선순위 기준을 "난이도"에 둔다면 3 →1 →2 영역 순으로 의사결정을 할 수 있다.

 

■ 이행계획 수립

 

(1) 로드맵 수립

 

- 분석 과제에 대한 포트폴리오 사분면(Quadrant) 분석을 통해 과제의 1차적 우선순위를 결정한다.

 

- 분석 과제별 적용범위 및 방식을 고려하여 최종적인 실행 우선순위를 결정한 후 단계적 구현 로드맵을 수립한다.

 

- 단계별로 추진하고자 하는 목표를 정의한다.

 

- 추친 과제별 선●후행 관계를 고려하여 단계별 추진 내용을 정렬한다.

 

(2) 세부 이행계획 수립

 

- 반복적인 분석 체계는 모든 단계를 반복하기보다 데이터 수집 및 확보와 분석 데이터를 준비하는 단계를 순차적으로 진행하고 모델링 단계는 반복적으로 수행하는 혼합형을 많이 적용하며, 이러한 특성을 고려하여 세부적인 일정 계획도 수립해야 한다.

'ADsP 자격증 공부' 카테고리의 다른 글

ADsP 36회 기출문제 20문제  (0) 2024.07.08
ADsP 36회 기출문제 객관식 10문  (0) 2024.07.06