2024년 1학기 방송통신대 출석수업대체과제물 데이터시각화)좋은 데이터 시각화의 사례를 1개 찾고 어떤 점에서 훌륭한지 300자 이내로 서술하시오 marketing headache 데이터셋 등
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

2024년 1학기 방송통신대 출석수업대체과제물 데이터시각화)좋은 데이터 시각화의 사례를 1개 찾고 어떤 점에서 훌륭한지 300자 이내로 서술하시오 marketing headache 데이터셋 등에 대한 보고서 자료입니다.

목차

1. 좋은 데이터 시각화의 사례를 1개 찾고 어떤 점에서 훌륭한지 300자 이내로 서술하시오. (이미지를 캡처하여 한글이나 워드 파일에 첨부할 것. 이미지를 별도의 파일로 제출하지 말 것) (6점)
①좋은 데이터 시각화 사례
②어떤 점에서 훌륭한지 300자 이내로 서술
2. 한스 로즈링의 TED 강의(아래의 URL 이용)를 보고 데이터 시각화의 역할 등 느낀 점을 1페이지 이내로 정리하시오.(6점)
https://www.ted.com/talks/hans_rosling_let_my_dataset_change_your_mindset (오른쪽 아래 메뉴에서 한글 자막 설정 가능)
3. R의 datarium 패키지에 내장된 marketing 데이터셋은 광고 미디어에 사용한 비용과 판매액의 데이터이다. 변수 facebook은 facebook 광고비로 사용한 금액이고, 변수 sales는 판매액이다.
(1) facebook 광고비(facebook)를 가로축, 판매액(sales)를 세로축으로 하는 산점도를 그리시오. (3점)
①코드 ②산점도
(2) facebook을 독립변수(설명변수)로, sales를 종속변수(반응변수, 결과변수)로 하는 회귀직선을 산점도 위에 그리시오. 산점도의 제목으로 본인의 학번을 출력하시오. (6점)
①코드 ② 산점도(회귀직선) ③설명
4. R의 datarium 패키지에 내장된 headache 데이터셋은 두통 치료제에 대한 임상시험에 참가한 두통 환자 72명의 데이터이다. 변수 treatment는 세가지 치료제 X, Y, Z 중 어느 치료제를 받았는지 나타내며, 변수 pain_score는 치료제를 투약한 후 두통의 강도를 점수로 나타낸 것이다. 이 데이터에서 치료제에 따라 두통의 강도의 분포가 어떻게 다른지 드러내는 데이터 시각화를 수행하시오. 그래프의 제목으로 본인의 학번을 출력하시오. (유일한 정답이 있는 것이 아니며, 시각화의 목적이 달성되고 그래프의 제목으로 학번을 출력하면 만점) (9점)
1) boxplot
①코드 ②결과 캡쳐
2) violin plot과 boxplot
①코드 ②결과 캡쳐

5. 참고문헌

본문내용

mary(reg) # 회귀계수 등 출력
②산점도
(2) facebook을 독립변수(설명변수)로, sales를 종속변수(반응변수, 결과변수)로 하는 회귀직선을 산점도 위에 그리시오. 산점도의 제목으로 본인의 학번을 출력하시오. (6점)
①코드
abline(lm(marketing$sales~marketing$facebook), col=\"red\", lwd=2) # 회귀선 추가
② 산점도(회귀직선)
③설명
\"datarium\" 패키지가 설치되어 있지 않다면 install.packages(\"datarium\")로 설치한 후 library함수로 메모리에 로드한다. plot함수의 매개변수로 x와 y의 데이터 값을 주면 그림과 같이 산점도가 그려진다. pch는 point의 모양을 의미하는데 적당한 정수값을 입력하면 된다. 산점도에 회귀선을 추가하기 위해 abline함수에 lm함수를 이용한 회귀분석 결과를 매개변수값으로 넘겨주면 된다. lwd는 선의 굵기를 의미한다. plot함수의 매개변수 main의 값으로 자신의 학번을 설정하면 된다.
회귀분석에는 lm 함수를 사용한다(lm은 linear model의 약자). 회귀분석 결과는 summary함수로 확인할 수 있다. 회귀식은 위 결과의 Coefficients에서 Estimate의 값을 사용한다. 즉, 회귀계수인 y절편 11.17397, 기울기 0.20250로 라는 회귀식을 구할 수 있다. 두 변수의 상관계수는 cor함수로 구하면 0.5762로 나오므로 상관관계가 크다고 볼 수는 없다. 회귀선의 적합도를 나타내는 결정계수(R-squared)의 값은 0.332로 1에 가까워야 적합도가 높다고 하는데, 0에 더 가까우므로 잘 적합된 회귀식은 아니라고 판단한다.
4. R의 datarium 패키지에 내장된 headache 데이터셋은 두통 치료제에 대한 임상시험에 참가한 두통 환자 72명의 데이터이다. 변수 treatment는 세가지 치료제 X, Y, Z 중 어느 치료제를 받았는지 나타내며, 변수 pain_score는 치료제를 투약한 후 두통의 강도를 점수로 나타낸 것이다. 이 데이터에서 치료제에 따라 두통의 강도의 분포가 어떻게 다른지 드러내는 데이터 시각화를 수행하시오. 그래프의 제목으로 본인의 학번을 출력하시오. (유일한 정답이 있는 것이 아니며, 시각화의 목적이 달성되고 그래프의 제목으로 학번을 출력하면 만점) (9점)
1) boxplot
①코드
# headache 데이터셋 로드
data(headache, package = \"datarium\")
# 학번
student_id <- \"여기에 본인의 학번을 입력하세요\"
# 치료제(treatment)별 두통의 강도(pain_score) 데이터 추출
pain_scores <- split(headache$pain_score, headache$treatment)
# 박스 플롯(box plot) 시각화
boxplot(pain_scores,
main = paste(student_id),
xlab = \"Treatment\",
ylab = \"Pain Score\",
col = c(\"skyblue\", \"lightgreen\", \"pink\"),
names = c(\"Treatment X\", \"Treatment Y\", \"Treatment Z\"))
②결과 캡쳐
2) violin plot과 boxplot
①코드
# 필요한 패키지 로드
library(ggplot2)
# 데이터셋 로드
data(headache, package = \"datarium\")
# 학번
student_id <- \"여기에 본인의 학번을 입력하세요\"
# 바이올린 플롯 시각화
ggplot(headache, aes(x = treatment, y = pain_score, fill = treatment)) +
geom_violin(trim = FALSE, alpha = 0.7) +
geom_boxplot(width = 0.1, alpha = 0.5, color = \"black\", fill = \"white\") +
ggtitle(paste(student_id)) +
xlab(\"Treatment\") +
ylab(\"Pain Score\") +
scale_fill_manual(values = c(\"skyblue\", \"lightgreen\", \"pink\")) +
theme_minimal()
②결과 캡쳐
5. 참고문헌
박서영, 이긍희(2023), 데이터시각화, 방송통신대학교출판문화원.
이기준(2021). 실전에서 바로 쓰는 시계열 데이터 처리와 분석 in R. 제이펍.
  • 가격6,000
  • 페이지수9페이지
  • 등록일2024.04.09
  • 저작시기2024.04
  • 파일형식한글(hwp)
  • 자료번호#1247022
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니