범주형자료분석 - 함평나비축제
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
해당 자료는 10페이지 까지만 미리보기를 제공합니다.
10페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

범주형자료분석 - 함평나비축제에 대한 보고서 자료입니다.

목차

Ⅰ 서 론

1. 분석주제
2. 분석동기
3. 자료수집 및 설명
4. 변수설정 및 설명





Ⅱ 본 론

1. 기초분석
1) 막대도표 분석
2) 빈도표 분석
3) 기초통계량 및 분산분석 (연속형 설명변수)
4) 독립성 검정

2. 상관분석

3. 요인분석

4. 신뢰도분석

5. 범주형 자료분석

6. SAS Enterprise Miner Method
1) SAS Enterprise Miner Streaming
2) Logistic Regression Model
3) Tree Model





Ⅲ 결 론

본문내용

다.
6. SAS Enterprise Miner Method
SAS E-Miner 로 로지스틱 회귀분석과 의사결정나무에 적용시켜보았다. 함평나비축제의 Data를 Data Partition으로 Train 표본을 70%, Testing 표본을 30%로 하여 선택되는 변수와 오분류율을 살펴보았다.
1) SAS Enterprise Miner Streaming
위의 분석에 사용된 변수는 다음과 같다. SPSS 분석에서는 한글변수명을 인식할 수 있어 변수명을 한글로 입력하였지만 SAS에서 사용된 변수는 영어로 입력하여야 하기에 다음과 같이 나타내었다.
변 수 명
설 명
변 수 명
설 명
Y
내년 방문
X1
축제경험
X6
행사시설
X2
축제정보
X7
행사내용
X3
유료관람
X8
축제흥미
X4
이 벤 트
X9
환 경
X5
행사특성
X10
도 우 미
2) Logistic Regression Model
위의 그림은 사용된 각 변수들의 T-Socre를 나타내는 것으로써 중요한 변수는 붉은색 계열의 색으로 나타나는 것을 알 수 있다. 따라서 위의 그림을 살펴보았을 때 행사특성이 가장 중요한 변수임을 알 수 있다.
위의 로지스틱 회귀식의 원래 값과 추정된 값을 이용하여 어느 정도 잘 예측하는지 살펴보도록 하였다. 그 결과 내년에 실제로 방문하지 않는다는 값을 온다고 예측하는 제 1종 오류의 확률이 높게 나타나는 것을 알 수 있었다. 그리고 실제로 온다는 값을 아지 않는다고 예측하는 제2종 오류의 확률값은 낮게 나타나는 것을 알 수 있었다.
3) Tree Model
의사결정나무는 의사결정규칙을 나무구조로 도표화하여 분류와 예측을 수행하는 분석방법이다. 이 방법은 분류 또는 예측의 과정이 나무구조에 의한 추론규칙에 의해서 표현되기 때문에 다른 방법들에 비해서 분석자가 그 과정을 쉽게 이해하고 설명할 수 있다는 장점을 가지고 있다.
원도표를 살펴보게 되면 내년 방문의사에 대하여 크게 2가지 변수로 설명될 수 있는 것을 알 수 있다. 다음으로 트리구조 도표를 살펴보도록 하겠다.
위의 구조를 살펴보게 되면 뿌리마디는 내년방문이고 내년방문에 가장 영향을 많이 주는 중요한 변수로 X5(행사특성)가 선택되었고 다음으로 중요한 변수인 X8(축제흥미)이 선택되는 것을 알 수 있었다. 이러한 결과는 앞의 분석에서 선택된 행사특성이 공통적으로 나타나는 것을 알 수 있었다.
다음으로 Logistic Regression Model 과 Tree Model을 이용하여 오분류율을 살펴보도록 하자.
Percentage - Train : 70 % Test : 30%
Root ASE
Misclassification Rate
Test:Misclassification Rate
Tree
0.404
0.127
0.220
Regression
0.395
0.142
0.203
위의 결과를 보았을 때 Tree Model은 Training Data에서는 오분류율이 Logistic Regression Model보다 작게 나타나지만 Testing Data에서는 Tree Model이 Training Data의 오분류율보다 더 큰 확률값을 가지는 것을 알 수 있다. 따라서 Logistic Regression Model이 더 좋은 Model 이라고 할 수 있다.
Ⅲ 결 론
log { pi } over { 1- pi } =-2.335*X_{ 1 } -1.093*X_{ 2 } -1.166*X_{ 3 } +2.101*Z
X는 이벤트의 성격을 나타내는 변수로써 X1은 지역(함평) 이벤트, X2는 전남권 이벤트, X3는 국가적 이벤트, 기준변수는 세계적 이벤트이다. 그리고 Z는 행사특성을 나타내는 변수이다.
최종 선택된 모형은 반응변수가 내년방문이고 설명변수가 이벤트, 행사특성인 로지스틱 모형이다. 이벤트(1)은 함평나비축제가 지역이벤트라고 생각하는 것을 나타낸다. 함평나비축제가 지역이벤트라고 생각하는 사람은 함평나비축제가 세계적 이벤트라고 생각하는 사람보다 내년에 다시 방문할 오즈가 0.097배 정도 낮은 관련성이 있다는 것을 알 수 있다. 역으로 생각하면 함평나비축제가 세계적 이벤트라고 생각하는 사람은 함평나비축제가 지역이벤트라고 생각하는 사람보다 내년에 다시 방문할 오즈가 1/0.097 = 10.309배 정도 높은 관련성이 있다는 것을 알 수 있다. 함평나비축제가 세계적 이벤트로서 발전해 나갈 때, 많은 방문객들이 내년에도 방문할 것이다. 따라서 함평나비축제의 마케팅을 세계적 이벤트에 초점을 맞추어 실시하여야 할 것이다.
또한 행사특성이 1증가 할 때, 내년에 다시 방문할 오즈가 8.172배 정도 높은 관련성이 있다. 행사특성은 행사내용의 특이성, 행사의 다양성, 행사의 추천성, 행사의 연계성, 관람쾌적, 기념품의 다양성, 안전관리 만족, 행사참여의 자유를 반영하고 있다. 즉 내년에 다시 방문하는 방문객을 증가시키기기 위해서는 함평나비축제가 방문객으로 하여금 일반 자연관련 축제와는 달리 행사내용면에서 다양한 체험을 할 수 있도록 하고 평소에는 경험하지 못한 특이한 내용을 담고 있어야 한다. 그리고 이러한 행사를 다른 사람에게 기꺼이 추천할 수 있는 자부심을 느끼도록 해주도록 한다. 그리고 나비축제로만 끝나지 않고 다른 행사와 같이 연계하여 보다 폭넓은 경험을 할 수 있도록 하고 행사를 관람차원에서 그칠 것이 아니라 직접 나비의 생태를 경험할 수 있도록 즉, 참여할 수 있는 행사 프로그램을 개발해야 할 것이다. 또한 행사를 하는데 있어서 관람 환경이 쾌적하도록 유지하고 어린이를 비롯하여 나이가 많은 사람들도 많이 방문하게 되고 단체로 방문을 하기 때문에 안전관리 측면에서 주의를 기울여야 할 것이다.
함평 나비축제를 방문하는 사람들이 행사에 대하여 만족을 하고 추천하고 싶은 마음을 가질 수 있도록 방문객에게 좋은 인상을 줄 수 있는 다양한 프로그램을 개발해야 할 것이다. 그리고 다음 해에 재방문하였을 때 행사 프로그램이 전년도와 똑같다면 행사특성에 대하여 불만을 느끼는 방문객이 늘어날 것이므로 이제 주의하여 매년 행사프로그램을 적절히 조절하고 새로운 프로그램을 개발하여야 할 것이다. 이러한 노력을 기울일 때 내년에 방문할 오즈의 확률이 높아질 것이다.

키워드

  • 가격3,000
  • 페이지수60페이지
  • 등록일2004.11.17
  • 저작시기2004.11
  • 파일형식한글(hwp)
  • 자료번호#273729
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니