다변량
본 자료는 2페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
해당 자료는 2페이지 까지만 미리보기를 제공합니다.
2페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

다변량에 대한 보고서 자료입니다.

목차

그 동안 통계에 관한 교과서를 여러 권 모으게 되었다. 내가 졸업한 학교 및 병원에서 누구나 보는 주황색 책으로 시작하여, 필요할 때마다 다변량 분석에 관한 국내 서적, Statistical methods in medical research, neuroepidemiology, 그리고 categorical analysis in SAS 등을 하나씩 하나씩 구하게 되었다. 인터넷에 떠도는 여러 사이트도 favorates 에 저장해 두었고.

그런데 점차 이 주먹구구식 통계 공부도 '한계'에 부딪혔다는 생각을 자주 하게 된다. 원래 통계는 연속 변수를 다루는 수학적 기술이었고, 범주형 변수가 많은 의학의 특성 때문에 부분적으로 수학적 방법을 수정하고 개량하여 탄생한 것이 의학통계이다. 그렇지만 통계에 대해 깊이 있는 이해를 할 기회를 갖지 못하며 성장하다 보니, 의학 통계에서 시작하여 조금씩 조금씩 통계 지식의 외연을 넓혀가는 이 공부 방식은, 조금만 그 지식의 외연 밖으로 발을 내디딜 때마다 '매우 기초적이지만 제대로 이해하지 못한' 개념들을 여기저기에서 발견하게 된다.

오늘은, interaction이다.
Interaction. Logistic regression에 특화된 내 머리에서는, 누가 그 뜻을 물어보면 특정 independent variable이 dependent variable 뿐만 아니라 다른 independent variable에도 영향을 미치는 상황, 이라고 답을 할 수 있겠지만. 그 다음으로 제기되는 질문, '그러면 어떻게 interaction을 처리해야 하는지, 그 결과는 어떻게 해석할 수 있는지, 어떤 상황에서 interaction을 고려해야 하는지' 등등에 대해서는 할 말이 없다. 그래서 공부를 조금 했는데, 여전히 감이 잘 잡히지 않는다.

일단 기본적인 개념부터.
Interaction의 의미는 다음과 같다. 특정 risk factor가 outcome에 미치는 영향이 다른 risk factor의 strata에서는 다르게 작용하는 경우.
보다 쉽게 표현하자면, DM이 intracranial stenosis을 증가시킨다고 할 때, 그 영향이 male에서는 유의하지만 female에서는 유의하지 않은 경우 (journal of neurology에 실린 논문의 내용이다^^;;), 이 때 DM와 gender 사이에 interaction이 있다고 표현한다.

본문내용

하나?
interaction이 개입된 모델에서 interaction에 포함된 변수의 해석은, 역시 문제인 것 같다.
두 개의 주요 설명 변수 사이의 interaction이 너무 뚜렷하여 interaction을 고려하여 분석한 연구(Elias, Hypertenson 2009)에서도 결국 이렇게 3D plot으로 제시하고 있다. 이는 Global이 dependent 이고, Age와 PWV가 연구하고자 하였던 주요 두 가지 independent variable이었다.
그리고 '언어'로는, The combination of older age and higher PWV, shown in the foreground, is associated with the lowest level of cognitive performance, whereas lower age and PWV are associated with better performance.라고 표현하고 있다. 두리뭉수리하게. ^^
그래서, interaction을 언제 고려할 것인가?
수학적으로는 interaction이 있으면 이를 고려해야 함이 맞겠지만, 현실적으로는 해석의 어려움 때문에 쉽게 interaction을 모델에 도입하기 어려워진다. 따라서, 다음과 같은 경우에는 interaction을 도입하지 말라는 권고도 있다.
If
a study was not specifically designed to assess interactions,
there is no a priori reason to expect an interaction,
interactions are being assessed "for insurance" because modern statistical software makes it easy, and
no interaction is found,
it is best to refit the model without the interaction so other effects might be better assessed.
웬만하면, interaction을 넣지 않는 게 좋겠다. ^^;;; 특히 위에 제시된 예에서 3번 같은 경우라면^^
참고한 문헌들
http://www.jerrydallal.com/LHSP/reginter.htm
Elias, Hypertension 2009:53;668
Knol, Int J Epidemiol 2007;36:1111

키워드

다변량,   모델,   구축
  • 가격2,000
  • 페이지수6페이지
  • 등록일2012.03.13
  • 저작시기2010.04
  • 파일형식한글(hwp)
  • 자료번호#802581
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니