데이터 마이닝
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
해당 자료는 10페이지 까지만 미리보기를 제공합니다.
10페이지 이후부터 다운로드 후 확인할 수 있습니다.

목차

1. 데이터마이닝의 정의
2. 데이터마이닝 필요 배경
3. 데이터마이닝 관련 분야 및 유사용어
4. 데이터마이닝 활용분야
5. 데이터마이닝 기법
5.1 분류 분석 (Classification analysis)
5.2 군집 분석 (Clustering analysis)
5.3 예측 (Prediction)
5.5 연속패턴분석 (Sequential pattern analysis)
5.6 기타 데이터마이닝 작업
5.7 Data mining methods
6. 기존 접근방법과 데이터마이닝
7. 기타 고려사항
[참고 문헌]

본문내용

ve Regression Tree) 등이 있다.
□ 기타 데이터마이닝 methods
- DIPOL92
- PPR (Projection Pursuit Regression)
- MARS (Multivariate Additive Regression Splines)
- PRIM (Patient Rule Induction Method)
- K-nearest neighbour
- Radial basis function
- Naive Bayes
- Polytrees
- Kohonen Self Orgarnizing Map (SOM)
- LVQ (Learning Vector Quantization)
- Kernel density methods
- SVM (Support Vector Method)
- Smoothing and curve estimation
- Additive modeling
- Combining Learners - Bagging, AdaBoost, Arcing, ...
□ 독립/종속변수 형태에 따라 적용 가능한 데이터마이닝 기법
종속
독립 변수
변수
정량척도
정성척도
없음
정량척도
회귀분석
신경망
판별분석
로지스틱회귀분석
신경망
군집분석
신경망
정성척도
분산분석
의사결정나무
범주형분산분석
동시발생매트릭스
정량+정성
더미회귀분석
공분산분석
더미범주형분산분석
더미군집분석
6. 기존 접근방법과 데이터마이닝
□ 기존 조회 방법
- 기존의 데이터베이스 조회 방법으로는 OLAP(On-Line Analytical Processing)과 같은 다차원분석(multi-dimensional analysis) 도구나 일반질의(query) 등이 있음.
- 결론부터 말하면 데이터마이닝을 기존의 조회도구를 대체하는 것이 아니라 보완하는 기능을 제공하는 것이다.
예) 유통업체의 고객구매데이터 활용
◇ 일반질의(query) : 결과는 테이블 형태로 제공
. 1998년 12월에 A제품을 구매한 고객의 명단을 조회하시오
. 1999년 상반기에 R지역의 A제품 판매현황을 보여주시오
◇ OLAP 도구 : 데이터를 다차원으로 분석할 수 있으며, 결과를 테이블뿐만 아니라 차트의 형태로도 제공한다.
. R지역에서 어떤 상품들이 팔렸는지를 월별, 고객 연령대별로 보여주시오
□ 데이터마이닝과 기존 조회 방법과의 차이점
- 기존 조회방법 (가설 확인 중심)
◇ 사용자가 자신의 경험에 비추어 가설을 세우고, 여기에 맞추어 질의를 만들어 실행하며, 결과를 검토하여 가설이 맞는지 틀리는지를 확인하는 방식
◇ 적절한 가설을 세울 수 없는 상황에서는 적용하기 곤란하며, 가설이 확인되거나 부정되는 것 외에는 새로운 정보가 생성되지 않는다 (밍크코트와 가죽치마의 관계는 전혀 예상하지 못했던 정보이므로 가설조차 세우기 힘든 경우이다)
- 데이터마이닝 (가설 발견 중심)
◇ 사용자가 미리 가설을 세우지 않아도 컴퓨터 시스템이 가능한 가설을 스스로 생성하고 이를 검증하는 방식
◇ 사용자의 가이드를 거의 받지 않고 정보를 찾는다.
□ 데이터마이닝은 기존 조회방법을 보완하는 방법임
- 데이터마이닝은 기존의 방식으로는 찾을 수 없는 추가적인 정보를 제공한다.
- 그러나 기존의 조회방식이 지원되지 않는 환경에서 데이터마이닝을 사용하려고 하는 것은 일반적으로 데이터에 내재되어 있는 정보의 90%를 차지하는 기본정보는 무시한 채 10% 이내의 숨겨진 정보만을 찾겠다는 발상으로, 이는 걷지도 못하는 아기에게 줄넘기를 가르치는 것에 비유할 수 있다.
7. 기타 고려사항 (장남식 외, pp42-45)
□ 목표 및 활용방안의 구체화
- “데이터로부터 무엇을 얻을 것인가?”, “얻어진 정보를 어떻게 활용할 것인가?”에 대해 구체화하는 것이 중요
□ 데이터의 충실도
- “Garbage in garbage out". 데이터의 양적, 질적 충실도가 성공의 관건.
□ 법률문제
- 개인 데이터의 불법 사용은 개인 프라이버시 침해로 법적 문제 발생
□ 전문인력 확보
- 적절한 데이터의 선택이나 추출되는 정보의 올바른 해석을 위해 반드시 역량있는 업무 전문가나 데이터 분석가의 도움을 받아야한다.
[참고 문헌]
U.M.Fayyad, G. Piatetsky-Shapiro, and P. Smyth, "From data mining to knowledge discovery", Advance in knowledge discovery and data mining, edited by U.M. Fayyad et al., AAAI Press, 1996
강현철 외, SAS Enterprise Miner 4.0을 이용한 데이터마이닝 -방법론 및 활용, 자유 아카데미, 2001
이성환 편저, 패턴인식의 원리 I권, 홍릉과학출판사, 1997
알렉스 버슨 외 지음/홍성완 외 옮김, CRM을 위한 데이터마이닝, 대청, 2000
김충련, SAS라는 통계상자, 데이터플러스, 2000
이학식, 김영, SPSS 10.0 매뉴얼, 법문사, 2002
조재희, 박성진, “OLAP 테크놀로지”, Sigma Insight, 2001
L.Breiman, J.H.Friedman, R.A.Olshen, and C.J.Stone, "Classification and Regression Trees", Wadsworth International Group Belmont, California, A Division of Wadsworth, Inc., ISBN 0-534-98053-8, 1984
D.Michie, D.J., Spiegelhalter, C.C., Taylor, Machine learning, neural and statistical classification, 출판사?
J.R.Quinlan, "C4.5 Programs for Machine Learning", Morgan Kaufmann Publishers, San Mated, California, 1993
M. Goebel and Le Gruenwald, "A survey of data mining and knowledge discovery software tools", SIGKDD Explorations vol.1, no.1, pp20-33, 1999
  • 가격3,000
  • 페이지수30페이지
  • 등록일2004.07.22
  • 저작시기2004.07
  • 파일형식한글(hwp)
  • 자료번호#261634
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니