목차
1. Datamining
2. Data Mining 절차(수행과정)
3. Data Mining 발견 규칙
4. Data Mining 기법
5. 특성
2. Data Mining 절차(수행과정)
3. Data Mining 발견 규칙
4. Data Mining 기법
5. 특성
본문내용
ning 발견 규칙
가. Data Mining Architecture
나. 연관규칙(Association rules)
- 레코드 셋에 대하여 아이템에 존재하는 친화도나 패턴을 찾아내는 규칙
다. 분류규칙(Classification rules)
- 데이터베이스 내의 객체의 셋에 대하여 그 안에 내재하는 공통 특성을 뽑아내어 이 객체들을 서로 다른 클래스로 그룹핑 해내는 작업을 말한다.
- 트레이닝 셋을 분석하여 각 클래스를 묘사할 모델을 생성해내어 이를 이용하여 목표 데이터를 처리 한다.
- 예 : 타겟 메일링등
라. 일반화/요약 규칙(Generalization @ summarization rules)
- 데이터의 일반적인 특성을 분석하는 것으로 데이터의 요약화/추상화 과정을 통하여 특성 규칙을 찾아 내는 것
마. 클러스터링/세그멘테디(Clustering/Segmentation)
- 물리적 혹은 추상적 객체를 비슷한 객체군으로 그룹핑하는 과정이다.
- 유사한 득성을 같는 데이터로 군집화 하는 것
- 필수 객체들이 셋으로 모여지고 이로부터 일련의 규칙이 유도 된다.
바. 유사성 탐색(Similarity search)
- 공간데이터베이스 등에서 사용되며 비슷한 패턴을 갖는 데이터를 찾아내는 것이다.
- 재난 또는 성향을 판단하는데 필수적인 작업디아.
- 비슷한 파내 패턴의 제품 또는 성장 패턴을 갖는 회사등을 알아 낸다.
사. 순서패턴(Sequential pattrenrs)
- 일정 시간 동안 레코드를 분석하여 순서 패턴을 찾아낸다.
- 시간에 따른 발생 패턴을 발견해 내는 작업이다.
4. Data Mining 기법
가. 신경망(Neural network
- 트레이닝 셋을 통하여 learn 한 비선형 예측 모델로서 생물학적 신경 네트워크와 같은 구조를 갖는다.
나. 결정트리(Decision tree)
- 트리모양의 구조로 결정의 셋을 나타낸다.
- 데이터 셋의 분류를 위한 규칙을 생성 한다.
다. 클러스터 분석(Cluster analysis)
- 관련된 객체의 서브셋을 발견하고 이 서브셋의 각각을 기술하는 묘사를 발견해 나가는 기법이다.
5. 특성
- 대용량의 관측된 자료를 다룬다.
- 이론 보다는 실무 위주의 컴퓨터 중심적 방법이다.
- 경험적 방법에 근거 하고 있다
- 일반화된 결과를 도촐하는데 초점을 두고 있다.
- 기업의 다양한 경영상황하에서 경쟁력확보를 위한 의사결정을 지원하기 위해서 활용될 수 있다.
가. Data Mining Architecture
나. 연관규칙(Association rules)
- 레코드 셋에 대하여 아이템에 존재하는 친화도나 패턴을 찾아내는 규칙
다. 분류규칙(Classification rules)
- 데이터베이스 내의 객체의 셋에 대하여 그 안에 내재하는 공통 특성을 뽑아내어 이 객체들을 서로 다른 클래스로 그룹핑 해내는 작업을 말한다.
- 트레이닝 셋을 분석하여 각 클래스를 묘사할 모델을 생성해내어 이를 이용하여 목표 데이터를 처리 한다.
- 예 : 타겟 메일링등
라. 일반화/요약 규칙(Generalization @ summarization rules)
- 데이터의 일반적인 특성을 분석하는 것으로 데이터의 요약화/추상화 과정을 통하여 특성 규칙을 찾아 내는 것
마. 클러스터링/세그멘테디(Clustering/Segmentation)
- 물리적 혹은 추상적 객체를 비슷한 객체군으로 그룹핑하는 과정이다.
- 유사한 득성을 같는 데이터로 군집화 하는 것
- 필수 객체들이 셋으로 모여지고 이로부터 일련의 규칙이 유도 된다.
바. 유사성 탐색(Similarity search)
- 공간데이터베이스 등에서 사용되며 비슷한 패턴을 갖는 데이터를 찾아내는 것이다.
- 재난 또는 성향을 판단하는데 필수적인 작업디아.
- 비슷한 파내 패턴의 제품 또는 성장 패턴을 갖는 회사등을 알아 낸다.
사. 순서패턴(Sequential pattrenrs)
- 일정 시간 동안 레코드를 분석하여 순서 패턴을 찾아낸다.
- 시간에 따른 발생 패턴을 발견해 내는 작업이다.
4. Data Mining 기법
가. 신경망(Neural network
- 트레이닝 셋을 통하여 learn 한 비선형 예측 모델로서 생물학적 신경 네트워크와 같은 구조를 갖는다.
나. 결정트리(Decision tree)
- 트리모양의 구조로 결정의 셋을 나타낸다.
- 데이터 셋의 분류를 위한 규칙을 생성 한다.
다. 클러스터 분석(Cluster analysis)
- 관련된 객체의 서브셋을 발견하고 이 서브셋의 각각을 기술하는 묘사를 발견해 나가는 기법이다.
5. 특성
- 대용량의 관측된 자료를 다룬다.
- 이론 보다는 실무 위주의 컴퓨터 중심적 방법이다.
- 경험적 방법에 근거 하고 있다
- 일반화된 결과를 도촐하는데 초점을 두고 있다.
- 기업의 다양한 경영상황하에서 경쟁력확보를 위한 의사결정을 지원하기 위해서 활용될 수 있다.
키워드
추천자료
- Data Warehouse 데이터 웨어하우스
- 데이터 베이스 시스템의 분산환경 관리 방법
- 추상 데이타 타입과 객체 지향 방법
- 데이터베이스 DB Design Project ( 삼국지 개념의 국가, 인재, 성의 정보를 관리하는 데이터...
- [CD-ROM데이터베이스]CD-ROM데이터베이스(시디롬데이터베이스)의 발전과정, 특성, 유형과 CD-...
- [데이터베이스산업][DB산업]데이터베이스(DB)의 정의와 특성, 데이터베이스(DB) 시스템, 데이...
- 데이터베이스 기본개념
- 데이터베이스 계층구조, 모델 , 시스템구성요소, 스키마
- 데이터베이스 시스템의 종류(계층형/네트워크형/관계형/객체형)에 대해서 시스템별 특징을 자...
- 데이터마이닝 실생활에 적용할 아이디어
- [표현][표현과 회화요소][표현과 투명성표현][표현과 데이터표현][표현과 XML]표현과 투명성...
- BC카드사의 데이터마이닝 사례연구
- 빅데이터 활용사례