목차
1. 좋은 데이터 시각화의 사례를 1개 찾고 어떤 점에서 훌륭한지 300자 이내로 서술하시오. (이미지를 캡처하여 한글이나 워드 파일에 첨부할 것. 이미지를 별도의 파일로 제출하지 말 것) (6점)
①좋은 데이터 시각화의 사례(https://earth.nullschool.net/의 a global map of wind, weather, and ocean conditions) ②어떤 점에서 훌륭한지 300자 이내로 서술
2. 한스 로즈링의 TED 강의(아래의 URL 이용)를 보고 데이터 시각화의 역할 등 느낀 점을 1페이지 이내로 정리하시오.(6점)
https://www.ted.com/talks/hans_rosling_let_my_dataset_change_your_mindset (오른쪽 아래 메뉴에서 한글 자막 설정 가능)
3. R의 ggplot2 패키지에 내장된 msleep 데이터셋은 83가지 포유동물의 특성과 수면시간에 대한 데이터이다.
(1) 몸무게(bodywt)를 가로축, 뇌 무게(brainwt)를 세로축으로 하는 산점도를 그리시오. (3점)
①코드 ②결과
(2) 몸무게(bodywt)에 로그를 취한 값(=log(bodywt))을 가로축, 뇌 무게(brainwt)에 로그를 취한 값(=log(brainwt))을 세로축으로 하는 산점도를 그리시오. log(bodywt)를 독립변수, log(brainwt)를 종속변수로 하는 회귀직선을 산점도 위에 그리시오. 산점도의 제목으로 본인의 학번을 출력하시오. (6점)
①코드 ②결과 ③ 코드 설명
4. R의 ggplot2 패키지에 내장된 mpg 데이터셋은 234개 차종의 특성과 연비에 대한 데이터이다. 이 중 변수 drv는 구동방식을 나타내는 변수로, f는 전륜구동, r은 후륜구동, 4는 사륜구동을 의미한다. 변수 hwy는 고속도로에서의 연비를 나타낸다. 이 데이터에서 구동방식에 따라 고속도로에서의 연비의 분포가 어떻게 다른지 드러내는 데이터 시각화를 수행하시오. 그래프의 제목으로 본인의 학번을 출력하시오. (유일한 정답이 있는 것이 아니며, 시각화의 목적이 달성되고 그래프의 제목으로 학번을 출력하면 만점) (9점)
①코드 ②코드 설명 ③결과
5. 참고문헌
①좋은 데이터 시각화의 사례(https://earth.nullschool.net/의 a global map of wind, weather, and ocean conditions) ②어떤 점에서 훌륭한지 300자 이내로 서술
2. 한스 로즈링의 TED 강의(아래의 URL 이용)를 보고 데이터 시각화의 역할 등 느낀 점을 1페이지 이내로 정리하시오.(6점)
https://www.ted.com/talks/hans_rosling_let_my_dataset_change_your_mindset (오른쪽 아래 메뉴에서 한글 자막 설정 가능)
3. R의 ggplot2 패키지에 내장된 msleep 데이터셋은 83가지 포유동물의 특성과 수면시간에 대한 데이터이다.
(1) 몸무게(bodywt)를 가로축, 뇌 무게(brainwt)를 세로축으로 하는 산점도를 그리시오. (3점)
①코드 ②결과
(2) 몸무게(bodywt)에 로그를 취한 값(=log(bodywt))을 가로축, 뇌 무게(brainwt)에 로그를 취한 값(=log(brainwt))을 세로축으로 하는 산점도를 그리시오. log(bodywt)를 독립변수, log(brainwt)를 종속변수로 하는 회귀직선을 산점도 위에 그리시오. 산점도의 제목으로 본인의 학번을 출력하시오. (6점)
①코드 ②결과 ③ 코드 설명
4. R의 ggplot2 패키지에 내장된 mpg 데이터셋은 234개 차종의 특성과 연비에 대한 데이터이다. 이 중 변수 drv는 구동방식을 나타내는 변수로, f는 전륜구동, r은 후륜구동, 4는 사륜구동을 의미한다. 변수 hwy는 고속도로에서의 연비를 나타낸다. 이 데이터에서 구동방식에 따라 고속도로에서의 연비의 분포가 어떻게 다른지 드러내는 데이터 시각화를 수행하시오. 그래프의 제목으로 본인의 학번을 출력하시오. (유일한 정답이 있는 것이 아니며, 시각화의 목적이 달성되고 그래프의 제목으로 학번을 출력하면 만점) (9점)
①코드 ②코드 설명 ③결과
5. 참고문헌
본문내용
library(dplyr)
# mpg 데이터셋 로드
data(mpg)
# 구동방식 별 연비를 비교하는 상자그림 생성
mpg %>%
ggplot(aes(x = drv, y = hwy, fill = drv)) +
geom_boxplot() +
labs(title = \"본인의 학번\", x = \"구동방식\", y = \"연비\") +
scale_fill_discrete(name = \"구동방식\",
labels = c(\"사륜구동\", \"전륜구동\", \"후륜구동\")) +
theme(plot.title = element_text(hjust = 0.5, size = 22, color = \"red\"),
axis.title = element_text(size = 14),
axis.text = element_text(size = 12, color = \"orange\"),
legend.title = element_text(size = 12),
legend.text = element_text(size = 10))
② 코드 설명
%>% 기호는 dplyr 패키지의 파이프 연산자로, 여러 작업을 함께 연결하는 데 사용된다. 이 경우 ggplot2 함수를 연결하고 수정된 데이터와 플롯 개체를 한 함수에서 다음 함수로 전달하는 데 사용된다. 이렇게 하면 코드를 더 읽기 쉽게 만들고 단계별로 플롯을 작성할 수 있다.
ggplot(aes(x = drv, y = hwy, fill = drv))는 ggplot2 그래프 초기화하는 코드로 fill = drv로 설정하면 드라이브 유형에 따라 상자 그림에 다른 색상을 제공한다.
geom_boxplot()로 그래프에 상자그림 지오케트리 추가한다.
abs(title = \"본인의 학번\", x = \"구동방식\", y = \"연비\")는 그래프 제목, 축레이블을 설정한다.
scale_fill_discrete(name = \"구동방식\", labels = c(\"사륜구동\", \"전륜구동\", \"후륜구동\"))은 상자그림의 스케일을 채운다. 범례제목을 설정하고 drv 변수의 각 수준에 대한 사용자 지정 레이블을 제공한다. 기본 레이블(\"4\", \"f\", \"r\")을 \"사륜구동\", \"전륜구동\", \"후륜구동\"으로 변경한다.
theme(plot.title = element_text(hjust = 0.5, size = 22, color = \"red\")에서 hjust를 0.5하여 제목이 중앙에서 수평 정렬되도록 한다.
axis.title = element_text(size = 14)는 축 제목의 폰트 크기 설정한다.
axis.text = element_text(size = 12, color = \"orange\")는 축의 눈금 레이블의 글꼴 크기와 색깔을 지정한다.
legend.title = element_text(size = 12)는 범례 제목의 글꼴 크기를 12로 설정한다.
legend.text = element_text(size = 10))는 범례 레이블의 글꼴 크기를 10으로 설정한다.
③ 결과
5. 참고문헌
박서영, 이긍희(2023), 데이터시각화, 출판문화원.
# mpg 데이터셋 로드
data(mpg)
# 구동방식 별 연비를 비교하는 상자그림 생성
mpg %>%
ggplot(aes(x = drv, y = hwy, fill = drv)) +
geom_boxplot() +
labs(title = \"본인의 학번\", x = \"구동방식\", y = \"연비\") +
scale_fill_discrete(name = \"구동방식\",
labels = c(\"사륜구동\", \"전륜구동\", \"후륜구동\")) +
theme(plot.title = element_text(hjust = 0.5, size = 22, color = \"red\"),
axis.title = element_text(size = 14),
axis.text = element_text(size = 12, color = \"orange\"),
legend.title = element_text(size = 12),
legend.text = element_text(size = 10))
② 코드 설명
%>% 기호는 dplyr 패키지의 파이프 연산자로, 여러 작업을 함께 연결하는 데 사용된다. 이 경우 ggplot2 함수를 연결하고 수정된 데이터와 플롯 개체를 한 함수에서 다음 함수로 전달하는 데 사용된다. 이렇게 하면 코드를 더 읽기 쉽게 만들고 단계별로 플롯을 작성할 수 있다.
ggplot(aes(x = drv, y = hwy, fill = drv))는 ggplot2 그래프 초기화하는 코드로 fill = drv로 설정하면 드라이브 유형에 따라 상자 그림에 다른 색상을 제공한다.
geom_boxplot()로 그래프에 상자그림 지오케트리 추가한다.
abs(title = \"본인의 학번\", x = \"구동방식\", y = \"연비\")는 그래프 제목, 축레이블을 설정한다.
scale_fill_discrete(name = \"구동방식\", labels = c(\"사륜구동\", \"전륜구동\", \"후륜구동\"))은 상자그림의 스케일을 채운다. 범례제목을 설정하고 drv 변수의 각 수준에 대한 사용자 지정 레이블을 제공한다. 기본 레이블(\"4\", \"f\", \"r\")을 \"사륜구동\", \"전륜구동\", \"후륜구동\"으로 변경한다.
theme(plot.title = element_text(hjust = 0.5, size = 22, color = \"red\")에서 hjust를 0.5하여 제목이 중앙에서 수평 정렬되도록 한다.
axis.title = element_text(size = 14)는 축 제목의 폰트 크기 설정한다.
axis.text = element_text(size = 12, color = \"orange\")는 축의 눈금 레이블의 글꼴 크기와 색깔을 지정한다.
legend.title = element_text(size = 12)는 범례 제목의 글꼴 크기를 12로 설정한다.
legend.text = element_text(size = 10))는 범례 레이블의 글꼴 크기를 10으로 설정한다.
③ 결과
5. 참고문헌
박서영, 이긍희(2023), 데이터시각화, 출판문화원.
키워드
추천자료
(2022년 방송통신대 데이터시각화 출석수업대체과제물) COVID-19 관련 데이터 시각화의 국내...
(2022년 방송통신대 데이터시각화 기말과제물)런던 콜레라지도를 조사하고 데이터 시각화의 ...
데이터시각화 ) 1 COVID-19 관련 데이터 시각화의 국내외 사례 3개를 찾고 비교하여 정리하시오
사회복지법제와실천 2023년) 1.사회복지법을 학습해야 하는 이유와 사회복지법과 실천의 연계...
학교사회복지론 2023년 중간과제물) 1.학교사회복지의 필요성 목적 개념 학교사회복지론 2.자...
2023년 1학기 방송통신대 신뢰성공학 중간과제물)2번, 3번, 4번 문제(어느 아이템 50개에 대...
2023년 성인간호학 중간과제물 1) 경장영양의 정의와 정맥영양과의 차이 및 경장영양액의 보...
방송통신대 사회복지와인권 2023년 중간과제) 1. 세계인권선언문 중 사회 경제 문화적 권리를...
소개글