데이터마이닝 자료 분석 프로젝트
본 자료는 7페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
해당 자료는 7페이지 까지만 미리보기를 제공합니다.
7페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

데이터마이닝 자료 분석 프로젝트에 대한 보고서 자료입니다.

본문내용

1. Dataset 에 대한 설명 (1)
Age (나이) : continuous (연속형 변수)
Workclass(직업) : private (자영업),
Self-emp-not-inc (법인이 없는 개인사업가),
Self-emp-inc ( 법인이 있는 개인사업가)….
fnlwgt(미지의 변수) : continuous(연속형 변수)
Education(교육) : Bachelors (학사),
Some-college (전문대)…

Marital – status(결혼유무) : Married-civ-spouse(기혼),
Divorced (이혼), Never-married (미혼)
Ooccupation : Tech-support(기술자)Craft-repair (기능공), Other-service (제3서비스업)
Relationship : Wife (아내), Own-child (자녀)
Husband (남편)
Race(인종) : Asian-Pac-Islander (아시아계), White (백인)
Class ( Target변수 ) : 1 (소득 50000$ 이상), 0 (50000$ 이하)
2. 프로젝트 노드 흐름도
3. 변수들의 변환 과정
4. Sampling, Partition, Replacement
총자료의 개수가 32563이므로,그 의 10%인 3256개의 샘플을 뽑는다.
Data의 수가 많으므로(32562개) 데이터 파티션의 비율을 4:3:3 으로 하여 나눈다.
imputation method를 tree imputation with surrogates 로 선택한다.
5. Adult 데이터의 분석
  • 가격3,500
  • 페이지수22페이지
  • 등록일2006.07.31
  • 저작시기2006.5
  • 파일형식파워포인트(ppt)
  • 자료번호#360437
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니