반응형
데이터 마이닝의 개요
■ 데이터 마이닝은 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법입니다.
■ 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만 데이터 마이닝은 다양한 수리 알고리즘을 이용해데이터베이스의 데이터로부터 의미있는 정보를 찾아내는 방법을 통칭합니다.
■ 종류
정보를 찾는 방법론에 따른 종류 | 분석대상, 활용목적, 표현방법에 따른 분류 |
● 인공지능 (Artificial Intelligence) ● 의사결정나무 (Decision Tree) ● K-평균 군집 (K-means Clustering) ● 연관분석 (Association Rule) ● 회귀분석 (Regression) ● 로짓분석 (Logit Analysis) ● 최근접이웃법(k-Nearest Neighbor) |
● 시각화분석 (Visualization Analysis) ● 분류 (Classification) ● 군집화 (Clustering) ● 예측 (Forecasting) |
■ 사용분야
● 병원에서 환자 데이터를 이용해서 해당 환자에게 발생 가능성이 높은 병을 예측합니다.● 기존 환자가 응급실에 왔을 때 어떤 조치를 먼저 해야 하는지를 결정합니다.● 고객 데이터를 이용해 해당 고객의 우량/불량을 예측해 대출적격 여부를 판단합니다.● 세관 검사에서 입국자의 이력과 데이터를 이용해 관세물품 반입 여부를 예측합니다.
■ 데이터 마이닝의 최근환경● 데이터 마이닝 도구가 다양하고 체계화되어 환경에 적합한 제품을 선택하여 활용이 가능합니다.● 알고리즘에 대한 깊은 이해가 없어도 분석에 큰 어려움이 없습니다.● 분석 결과의 품질은 분석가의 경험과 역량에 따라 차이가 나기 때문에 분석 과제의 복잡성이나 중요도가 높으면 풍부한 경험을 가진 전문가에게 의뢰할 필요가 있습니다.● 국내에서 데이터 마이닝이 적용된 시기는 1990년대 중반입니다.● 2000년대에 비즈니스 관점에서 데이터 마이닝이 CRM의 중요한 요소로 부각되었습니다.● 대중화를 위해 많은 시도가 있었으나, 통계학 전문가와 대기업 위주로 진행되었습니다.
반응형
'ADsP 자격증 공부 > 4과목' 카테고리의 다른 글
데이터 마이닝의 분석 방법 & 분석 목적에 따른 작업 유형과 기법 (0) | 2024.07.01 |
---|---|
R 기초와 데이터 마트 (0) | 2024.06.19 |