데이터 마이닝 - 교육 레포트

본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.

해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

본문내용

마이닝 과정의 전 체 시간 중 80%를 차지한다.
*패턴 발견(데이터 마이닝)
흥미있고(interesting), 자주(frequently) 발생하는 패턴이 발견 대상이 된다. 이러한 패 턴은 통계학과 기계학습에서의 기술들을 응용한다. 그 예로, 규칙 학습, 결정형 트리 유도, 클러스터링등이 있다.
*발견된 패턴의 후처리(postprocessing)
사용자는 어떤 패턴이 발견되었는지 이해해야 하며, 이를 위해 더 나은 패턴의 선택 및 정렬 (ordering), 시각화 등의 과정이 필요하다. 이러한 과정에 의해 패턴을 이해하고, 이것을 가지고 위의 마이닝 과정(KDD Process)을 반복해서 더 나은 패턴을 추출하는 과정이다.
*결과의 활용(응용 프로그램)
이러한 마이닝 과정은 여러 응용 프로그램에 적용될 수 있다. 건강을 관리 해 주는 헬스 케어, 재무 관련 프로그램, 과학적 데이터를 필요로 하는 프로그램 등에 적용될 수 있 다.
② 패턴인식(Pattern Recognition)
패턴인식 기술은 다양한 형태의 데이터에 포함되어 있는 패턴정보를 자동으로 추출하여 응용하는 기술로서 크게는 컴퓨터 응용 소프트웨어 기술, 작게는 인공지능 기술로 분류 된다. 컴퓨터가 발명되면서 연구되기 시작한 이 분야의 기술은 인간의 시청각을 통한 인지능력을 컴퓨터 상에 모방하는 것을 목표로 한다. 인간에 있어서 패턴 인식 능력이 란 넓은 의미에서는 다양한 감각 기관을 통하여 전달되는 정보를 처리, 분석, 종합하여 외부 현상을 파악하고 이해하는 기능을 일컫는다. 또 좁게는 기억하고 있는 패턴과 동일 또는 유사한 형태의 존재유무를 알아내는 능력을 말한다. 문자의 형태를 인지하여 문장 의 의미를 파악한다거나 시시각각으로 변하는 경제지표를 분석하여 미래를 예측하는 것 들이 대표적인 패턴인식의 능력이다.
③ 기계학습 알고리즘(Machine Learning Algorithm)
자연 언어 처리 시스템에 인간의 사고능력에 해당하는 추론 기능을 추가하여, 이용하기 편리하면서도 수준 높은 처리가 가능한 지적 시스템을 만들기 위해 연구하여 만든 알고 리즘이 기계-학습 알고리즘이다.
④ 전문가시스템(Expert System)
질병의 진단이나 지질 자료 등을 분류하는데 사용되는 특정된 분야에 국한된 전문가의 지식을 매우 간단한 ‘IF-THEN’규칙을 사용하여 표현될 수 있는데 이 역시 기계-학습 알고리즘을 근간으로 한다.
⑤ 통계학(Statistics)
회귀분석, 판별분석, 군집분석 등 주로 세가지 기법들이 쓰여진다. 회귀분석은 본질적으 로 독립변수(또는 설명변수, 원인변수)라 불리는 하나 또는 둘 이상의 변량들에 기초하 여 종속변수(또는 결과변수)에 미치는 영향력의 크기를 알아보려고 하는 분석 기법이 다. 판별분석은 명목자료로 된 종속변수의 집단을 구분하는데 사용되는 통계 분석 방법 이다. 종속변수를 추정하는데 있어서 독립변수를 전부 사용할 수도 있지만 상대적 중요 도가 높은 몇 개의 변수를 판별변수로 따로 이용하기도 한다. 군집분석이란 군집 대상 들이 지니고 있는 여러 가지 유사성을 이용하여 동질적인 집단끼리 묶어 주는 방법이 다. 이렇게 함으로써 어떤 변수에 대해서 응답한 다수의 대상들을 몇 개의 동질화 된 집단으로 집단화하고 동일집단 내에 속해 있는 응답자들의 공통된 특성들을 조사하는데 이용된다. 군집분석에 사용되는 변수들은 숫자형 변수여야 한다.
⑥ 데이터 웨어하우징(Data Warehousing)
데이터 웨어하우스는 운영 데이터로부터 추출된 데이터를 중앙으로 집중하여 저장한 것이다. 저장된 정보는 주제 중심적이고, 비휘발성이며 이력정보를 보유하므로 데이터 웨어하우스는 매우 방대한 데이터 집합을 보유하게 된다. 즉 데이터 웨어하우스는 데 이터마이닝의 과정을 지원하는 최선의 구조이다.
⑦ OLAP(Online Analytical Processing)
다차원 분석 시 사용되는 도구 이다. 다차원 분석이란 구역, 나이, 수입의 순서에 따른 영업 데이터를 요구(구역, 나이, 수입으로 구성된 3차원 분석)하고 바로 다음에 동일한 데이터를 저축과 나이 순으로 알아보고 싶어 하는데 이것은 대규모 데이터 집합을 온라 인으로 사용하여야 한다. 데이터를 보통 메모리에 특수한 다차원 형식으로 저장하는데 데이터를 갱신할 수는 없지만 어떠한 종류의 질문이라도 제시할 수 있다. 따라서 OLAP는 데이터마이닝에서 중요한 단계가 될 수 있다.
금융
통신
제조
유통
고객 세분화
이탈 고객 관리
표적 마케팅
장바구니 분석
고객 유지 / 유치
표적 마케팅
공정 관리
타겟 마케팅
연계 / 상승 판매
연계 상품 판매
품질 / 제품관리
수요 / 판매예측
위험 관리
고객 불만 관리
신상품 개발
구매 패턴 파악
도용사고방지
고객 유지 / 유치
재구매
공급 체인 관리
신용 리스트 관리
망 관리
가망고객 탐색
연계 판매
이탈 고객 관리
신상품 관리
고객 가치 파악
상승판매
효과적 채널관리
가망 고객 탐색
판매 채널 관리
우량 고객 관리
재구매
잠재 시장 개발
신상품 관리
고객 가치 파악
가망 고객 탐색
잠재 시장 개발
수익성 분석
재구매
가망 고객 탐색
고객 가치 파악
재구매
고객 가치 파악
지금까지 정보시스템은 기업체의 운영절차를 주로 지원하기 위해 구축, 운영되어 왔으 나 데이터 웨어하우징과 데이터마이닝은 조직의 정보를 완전히 새로운 방식으로 접근 하여 전략의 원천으로 바라보게 하고 있다.
7. 데이터 마이닝의 성공요건
- 통합적이고 정제된 데이터 저장소 구축
- 전략적 우선순위별 적절한 마이닝 모델 개발
- 전략 및 기업 요건에 맞는 제품의 선택
- 경영진의 확고한 지원 및 마이닝에 대한 기업 분위기 조성
- 지속적인 분석 및 연구
- 마이닝을 위한 전담 팀의 결성
8.결론
- 데이터 마이닝은 대용량 데이터베이스에 존재하는 여러가지 유용한 지식을 캐내는 기법으 로서 최근 들어 데이터베이스 분야에서 관심을 받고 있는 분야이다. 마이닝에서 얻을 수 있는 지식에는 연관규칙, 분류규칙, 요약규칙, 클러스터링 등 여러가지가 있으며 추출된
이러한 지식들은 의사결정, 예측, 일기 예보, 평가 등에 광범위하게 사용된다.

키워드

데이터 마이닝, 데이터, 마이닝

목차

본문내용

키워드

추천자료