데이터 마이닝
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

데이터 마이닝 에 대한 보고서 자료입니다.

목차

1. 서론…………………………………………………………………………1p
 ⑴ 데이터 마이닝의 목적 및 필요성
 ⑵ 사용한 데이터 집합
 ⑶ 적용 기법

2. 데이터 집합
 ⑴ 데이터 집합의 필드 구성
 ⑵ 데이터 분포

3. 데이터 분석 과정 (의사결정나무 추론)……………………………2p

4. 데이터 분석 과정 (군집분석)…………………………………………4p
 ⑴ K-평균 군집
 ⑵ Kohonen Network

5. 데이터 분석 결과………………………………………………………8p

6. 결론

7. 소감과 느낀 점

본문내용

매 성향 분석
② 군집분석
- 인터넷 쇼핑몰 고객 군집 분석
2. 데이터 집합
⑴ 데이터 집합의 필드 구성
- 고객명, 성별, 나이, 쇼핑금액, 가입일자, 가입통신회사, 거주지역, 구입횟수
⑵ 데이터 분포
- 성별과 거주지역별 분포
3. 데이터 분석 과정 (의사결정나무 추론)
① Excel 파일의 데이터를 TXT 파일로 변환
② TXT 파일을 클레멘타인 분석 자료로 불러오기
③ 자료 읽기, 입출력 설정, Training, Test 설정
④ 성별 분포와 증폭 생성
⑤ C5.0과 C&RT로 각각 모델 생성
(C&RT는 강의시간에 배우지 않은 것 같은데, 같은 의사결정나무 추론에서 어떻게 다른 결과가 나오는 가를 보기 위해 실행해 보았음.)
⑥ C50과 C&RT의 규칙 생성
⑦ 최종 의사결정나무 흐름도
⑧ 이익 도표 (C50, C&RT)
4. 데이터 분석 과정 (군집분석)
① Excel 파일의 데이터를 TXT 파일로 변환
② TXT 파일을 클레멘타인 분석 자료로 불러오기
③ 자료 읽기
7
④ 입출력 설정
⑴ K-평균 군집
① K-평균 군집의 생성
② K-평균화 군집 생성 결과
③ K-평균화 군집 생성 결과 - 1. 나이
④ K-평균화 군집 생성 결과 - 2. 나이별 구입횟수
⑤ K-평균화 군집 생성 결과 - 3. 거주지역vs쇼핑금액vs나이
⑵ Kohonen Network
① Kohonen Network의 생성
② Kohonen Network 군집에서의 거주지역vs가입통신회사 교차표
③ Kohonen Network 군집에서의 가입통신회사 분포
④ Kohonen Network 군집에서의 거주지역vs성별 교차표
⑤ 가입통신회사별 쇼핑금액 분포 비교
5. 데이터 분석 결과
수업시간에 다뤘던 자료들에 비해, 자료의 절대적인 양이나 질이 떨어지는 것을 감안해야 할 것으로 보인다. 분석한 결과는, 실제로 유용하게 사용하기에는 조금 부족해 보였다. 물론 데이터 마이닝을 했을 때가 하지 않았을 때보다는 유용한 정보를 제공하였다. 각 기법들을 확실히 파악하지 못했지만, 데이터 마이닝의 여러 기법들을 적절히 사용했을 때 더 좋은 결과를 얻을 수 있다는 뜻으로 생각된다.
의사결정나무 추론의 경우 분석을 하지 않았을 때보다는 유용한 정보가 되었으나, 실질적으로 효용이 크다고 볼 수는 없다. 따라서 다른 기법을 사용하여 더 좋은 결과를 얻어내거나, 보다 정확하고 양이 많은 자료를 이용할 필요성이 있다.
- 가입자 및 주 구매층은 30대 이며 강남, 강북, 경기 지방에 거주하며 011 또는 016 서비스를 사용하고 있는 여성층이었다. 또한 이 고객층에서 고액 구매자가 많았다.
- 주 타겟을 서울, 경기 지방으로 하고 있는 쇼핑몰임에도 불구하고 충청도 전라도 지방의 고객이 예상보다 많았고, 구입 금액 또한 높은 편이었다.
- 019의 경우 전체 가입자 수는 많지 않으나 평균 이상의 고액 구매를 했다는 결과를 얻을 수 있었다. 최근 LG텔레콤이 뱅크온 마케팅의 힘을 얻어 유치한 고객 중 다수가 일반 평균 이상의 소득 수준과 통신사용금액을 나타낸다는 소식과 일맥 상통하는 부분이다.
- 최고액 구매자는 011이 높으나 최저액으로 많은 수가 분포해 있다.
6. 결론
● 마케팅으로의 활용 방안.
- 가입자에게 보낼 모바일 할인쿠폰의 차별화가 필요하다. 통신회사별 지역별 성별로 나누어 고액상품관련 또는 저가상품관련 할인쿠폰을 나눌 필요가 있다. 주 구매 고객층이 30대로 나타났으나 40대 이상의 고객들 또한 아우를 수 있는 마케팅 방향이 필요할 것이다. 최근 불황속 10대 소비계층만이 구매파워를 발휘하고 있는데 이 회사의 데이터 상에서의 10대 및 20대들의 구매는 적은 편이다. 따라서 향후의 발전을 위해서 10대 및 20대에게 포커스를 조정해줄 필요가 있다.
7. 소감과 느낀 점
데이터는 그 자체로는 그다지 쓸모가 많지는 않다. 이번에 배운 클레멘타인을 통해서 데이터 마이닝의 방법과 활용법, 유용성 등을 다소 알게 되었다. 실제로 과제를 해보면서 데이터들이 분석되어 나오는 과정도 흥미로웠고, 신기하기도 했다.
아직 데이터 마이닝에 대한 충분한 이해를 했다고 보기는 어렵지만, 데이터 마이닝을 통하면 엄청나게 많은 수의 자료더미 속에서도 쓸모있는 정보들만을 쉽게 찾아내고, 그 연관성들을 분석할 수 있다는 것을 배우게 되었다. 데이터 마이닝은 각 분야에서 다양한 형태로 쓰인다고 하는데, 실제로 이러한 방법을 적절히 사용한다면 의사결정과정에서 시간과 비용을 크게 줄이고, 효과는 극대화 할 수 있을 것이다.
  • 가격1,400
  • 페이지수9페이지
  • 등록일2013.01.07
  • 저작시기2014.3
  • 파일형식한글(hwp)
  • 자료번호#828176
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니