본문 바로가기
ADsP 자격증 공부/4과목

데이터 마이닝

by 데이터 분석가가 되자 2024. 7. 1.
반응형
 

데이터 마이닝의 개요

 

■ 데이터 마이닝은 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법입니다.

 

■ 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만 데이터 마이닝은 다양한 수리 알고리즘을 이용해데이터베이스의 데이터로부터 의미있는 정보를 찾아내는 방법을 통칭합니다.

 

■ 종류

정보를 찾는 방법론에 따른 종류 분석대상, 활용목적, 표현방법에 따른 분류
● 인공지능 (Artificial Intelligence)
● 의사결정나무 (Decision Tree)
● K-평균 군집 (K-means Clustering)
● 연관분석 (Association Rule)
● 회귀분석 (Regression)
● 로짓분석 (Logit Analysis)
● 최근접이웃법(k-Nearest Neighbor)
● 시각화분석 (Visualization Analysis)
● 분류 (Classification)
● 군집화 (Clustering)
● 예측 (Forecasting)

 

■ 사용분야

● 병원에서 환자 데이터를 이용해서 해당 환자에게 발생 가능성이 높은 병을 예측합니다.● 기존 환자가 응급실에 왔을 때 어떤 조치를 먼저 해야 하는지를 결정합니다.● 고객 데이터를 이용해 해당 고객의 우량/불량을 예측해 대출적격 여부를 판단합니다.● 세관 검사에서 입국자의 이력과 데이터를 이용해 관세물품 반입 여부를 예측합니다.

 

■ 데이터 마이닝의 최근환경● 데이터 마이닝 도구가 다양하고 체계화되어 환경에 적합한 제품을 선택하여 활용이 가능합니다.● 알고리즘에 대한 깊은 이해가 없어도 분석에 큰 어려움이 없습니다.● 분석 결과의 품질은 분석가의 경험과 역량에 따라 차이가 나기 때문에 분석 과제의 복잡성이나 중요도가 높으면 풍부한 경험을 가진 전문가에게 의뢰할 필요가 있습니다.● 국내에서 데이터 마이닝이 적용된 시기는 1990년대 중반입니다.● 2000년대에 비즈니스 관점에서 데이터 마이닝이 CRM의 중요한 요소로 부각되었습니다.● 대중화를 위해 많은 시도가 있었으나, 통계학 전문가와 대기업 위주로 진행되었습니다.

반응형