데이터마이닝의 개념과 종류, 작업유형 활용

본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.

해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

데이터마이닝

Ⅰ. 데이터마이닝의 기본개념

1. 데이터마이닝의 기본개념
2. 데이터웨어하우스
3. OLAP

Ⅱ. 데이터의 종류

1. 거래데이터
2. 고객 프로파일링 데이터
3. 설문데이터
4. 관찰데이터
5. 텍스트 데이터

Ⅲ. 데이터마이닝 작업유형 및 활용

1. 분류규칙
2. 예측작업
3. 연관규칙
4. 군집화

본문내용

각 방문 기간별로 구분하여 정리해야 유용한 정보를 얻을 수 있다.
관찰데이터가 가지고 있는 가장 큰 제한점은 방문자의 로그인 네임(Login Name)을 알 수 없기 때문에 방문자의 신원을 확인하기가 쉽지 않다는 것이다. 물론 등록을 한 고객은 유일한 고객번호를 계속 쓰도록 설계되어 있어 방문자의 신원을 확인할 수 있고 개별고객의 관찰데이터를 얻을 수 있으며 따라서 그 고객에 대한 분석을 할 수 있다. 그러나 고객의 신원을 구별하는 등록번호가 없을 때는 쿠키나 다른 장치를 사용하여야 하는데 그 나름대로 문제가 있어 개별고객연구를 위한 데이터의 유용성이 제한된다.
5) 텍스트 데이터
텍스트 데이터란 특정 구조를 갖추지 못한 텍스트 형태의 데이터나 형체를 지칭한다. 여기에는 디지털화된 또는 디지털화가 가능한 모든 텍스트 문서들, 즉 책, 신문, 잡지, 정기간행물, 이메일, 데이터베이스, 편지, 메모, 웹페이지, 전문출판물 등이 포함된다. 이러한 텍스트 데이터는 기업 내에서, 고객과 기업 사이에서 또는 기업과 기업 사이에서 의사소통의 결과로 생겨나는 경우가 많다. 그러므로 하루에도 엄청난 양의 텍스트데이터가 생성되고 저장된다. 텍스트 데이터는 단순한 숫자나 부호가 제공할 수 있는 것보다 더 많은 양의 정보를 줄 수 있는 장점을 갖고 있으며 많은 기업들이 텍스트 데이터의 유용성을 인식, 많은 관심을 기울이고 있고 그 중요성이 날로 높아가고 있다.
III. 데이터마이닝 작업유형 및 활용
데이터마이닝은 데이터에 내재하는 데이터간의 관계, 패턴, 규칙을 발견하는 것에 그 목적이 있으며 작업유형은 데이터마이닝을 통해 최종적으로 얻고자 하는 정보가 어떤 종류인가에 따라 구분될 수 있다. 데이터마이닝을 통해 도출되는 정보의 종류는 다양하지만 다음의 4가지 작업유형으로 분류되어 설명될 수 있다.
1) 분류규칙(Classification)
분류는 데이터마이닝에서 가장 많이 사용되는 작업으로 부류 값이 포함된 과거의 데이터로부터부류별 특성을 찾아내어 분류모형을 만들고, 이를 토대로 새로운 레코드의 부류 값을 예측하는 것을 말한다. 예를 들어, 한 통신기기 판매업자가 자사 상품의 프로모션을 위해 대상고객을 선정하기 위해 임의로 고객 표본을 추출하여 우편물을 발송하였다고 가정하면 여기서 분류규칙을 발견하는 작업이란 고객 표본 중에서 '예라고 대답한 고객들과 '아니오'라고 대답한 고객들을 분리해 내고 각 그룹들의 고객특성을 찾아내는 것이다. 분석결과 '예'라고 응답한 고객들은 나이나 거주지에 상관없이 직업이 자영업이거나 43세 이하의 고용직 또는 직업은 없으나 강남에 거주한다는 특성을 가지고 있다는 것을 찾았다면 이러한 규칙을 바탕으로 고객 전체의 모집단에서 프로모션 대상을 선정한다면 낮은 비용으로 구매 가능성이 높은 고객만을 상대로 목표마케팅을 전개할 수 있게 된다.
이 작업유형의 다른 예로는 다음과 같은 것이 있다.
▶ 대출신청을 우수, 보통, 불량으로 나누는 신용평가 작업
▶ 우수고객 선정 및 특성 분석
▶ 고객 분류, 그룹별 특성발견
- 분류규칙의 적용사례 -
2) 여측작업(Prediction)
예측작업은 데이터 내 변수들 간의 영향관계 또는 인과관계를 분석하여 어떤 현상을 설명하고 예측하는 것을 의미한다. 예를 들어 데이터베이스 마케팅 담당자가 이탈이 예상되는 고객을 미리 알아내어 고객이탈을 방지할 수 있는 충성도 프로그램을 전개한다면 기업의 수익향상에 크게 기여할 수 있게 된다. 이때 필요한 작업유형이 예측작업이다. 과거 데이터로부터 고객이탈에 미치는 영향변수 또는 매개변수들이 무엇인지를 찾아내고 이들 변수들이 어느 정도로 영향을 미치고 있는지를 알아내어 예측 모형을 만들고 이를 이용해 고객이탈방지 마케팅 프로그램을 전개할 수 있게 된다. 예를 들어 그림과 같이 고객별 제품 거래품목을 분석해보면 그림에서 A를 구해한 고객들은 뒤에 E를 구매하고 있음을 알아내어 A의 교차판매품목으로 E를 고려할 수 있게 된다.
이 작업유형의 다른 예로는 다음과 같은 것이 있다.
▶ DM에 응답할 가능성이 높은 고객
▶ 교차판매(cross selling) 대상자 예측
▶ 제품의 수요예측
- 예측작업의 적용사례 -
3) 연관규칙
연관규칙을 발견하는 작업은 데이터 안에 존재하는 항목간의 동시발생관계 또는 종속관계를 찾아내는 작업이며, 마케팅에서는 손님의 장바구니에 들어있는 품목들 간의 관계를 알아본다는 의미에서장바구니 분석이라고도 한다. 즉 어떤 상품들이 함께 잘 팔리는지를 분석해내어 상품 간 연관관계의모형을 찾아낸다면 어떤 특정 상품을 구입한 고객에게 어떤 상품을 활 수 있는지를 예측해 낼 수 있게 된다. 예를 들어 한 할인점의 고객 거래 품목을 분석한 결과 기저귀를 구해하는 고객은 분유와 맥주를 많이 구매한다는 사실을 알아냈다고 가정을 하면 이러한 품목의 진열을 좀 더 가깝게 위치화 시킴으로서 전체 매출에 좀 더 기여할 수도 있을 것이라는 예측을 할 수 있을 것이다. 이 작업유형의 다른 예로는 다음을 들 수 있다.
▶ 신용카드 도용패턴 추적
▶ 통신서비스 간 연관관계 발견
▶ 매장진열 전략 수립/상품 카탈로그 디자인
4) 군집화(Clustering)
군집화는 다양한 고객들을 포함하는 고객 풀(pool)에서 다수의 소그룹(subgroups)이나 집단(clusters)을 분류해내는 작업이다. 이 작업이 분류작업과 다른 점은 분석하고자 하는 데이터에 부류 값이 없다는 점이다. 이 때문에 다른 데이터마이닝 작업을 위한 선행 작업으로서의 역할을 수행하는 경우가 많다. 예를 들어 어떤 백화점에서 고객을 효율적으로 관리하기 위하여 고객들을 몇 개의 부류로 구분하려고 한다. 이때 기존의 방식인 RFM에 기반한 분류는 이벤트나 프로모션 대상을 선정하는데 있어 너무나 추상적이고 개인별 특성을 전혀 고려하지 못하고 있어 활용성이 낮다. 이때의 기계학습을 이용해 군집화 작업을 이용하면 인구 통계학적 데이터, 라이프스타일 데이터, 지불유형 등 더 다양한 변수를 매개로 하는 새롭고 효과적인 분류모형을 만들 수 있게 된다.
이 작업유형의 다른 예로는 다음을 들 수 있다.
▶ 고객의 구매패턴과 선호도 발견
▶ 서비스별 홍보대상

키워드

데이터마이닝의 개념, 데이터마이닝 종류, 데이터마이닝 작업유형 활용, 데이터마이닝, 데이터, 마이닝

목차

본문내용

키워드

추천자료