데이터시각화 ) 1 COVID-19 관련 데이터 시각화의 국내외 사례 3개를 찾고 비교하여 정리하시오
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

데이터시각화 ) 1 COVID-19 관련 데이터 시각화의 국내외 사례 3개를 찾고 비교하여 정리하시오에 대한 보고서 자료입니다.

목차

데이터시각화
1. COVID-19 관련 데이터 시각화의 국내외 사례 3개를 찾고 비교하여 정리하시오. (반드시 2022년 데이터가 포함된 사례를 사용할 것. 이미지를 캡처하여 한글이나 워드 파일에 첨부할 것. 이미지를 별도의 파일로 제출하지 말 것) (6점)
2. 한스 로즈링의 TED 강의(아래의 URL 이용)를 보고 데이터 시각화의 역할 등 느낀 점을 1페이지 이내로 정리하시오.(6점)
https://www.ted.com/talks/hans_rosling_let_my_dataset_change_your_mindset
(오른쪽 아래 메뉴에서 한글 자막 설정 가능)
3. R의 datarium 패키지에 내장된 marketing 데이터셋은 광고 미디어에 사용한 비용과 판매액의 데이터이다. facebook 컬럼은 facebook 광고비로 사용한 금액이고, sales 컬럼은 판매액이다. facebook을 x축, sales를 y축으로 하는 산점도를 그리시오. facebook을 독립변수(설명변수), sales를 종속변수(반응변수, 결과변수)로 하는 회귀직선을 산점도 위에 그리시오. 산점도의 제목으로 본인의 학번을 출력하시오. (9점) (힌트: datarium 패키지를 설치, 로드한 후 콘솔에 dat<-marketing을 입력하면 marketing 데이터셋이 dat에 저장된다)
4. 한국, 미국, 프랑스, 일본의 COVID-19 신규 확진자 수의 시간에 따른 추이를 데이터 시각화로 비교하고 향후 추이에 대해 의견 기술하라(데이터는 과제 작성일까지 올라와 있는 것을 이용하면 되며 학생별로 동일할 필요는 없음).(9점)
*데이터 소스: https://ourworldindata.org/covid-deaths 에서 “Our work belongs to everyone“이라 쓰여있는 네모 안의 .csv(아래 그림에서 빨간 네모)를 클릭하여 데이터를 다운로드 받아서 사용할 것.
*변수이름: iso_code가 각 국가를 나타낸다. (한국: KOR, 미국:USA, 프랑스: FRA, 일본: JPN)
new_cases가 신규 확진자 수를 나타낸다.

본문내용

‘데이터’화 시켜 사용하고 있다는 점을 상기할 필요가 있다.
해당 강의에서 한스 로즈링은 모든 학생에게 뛰어난 설득력을 발휘한다. 해당 분야에 관심을 두고 있는 사람이 무지했던 부분을, 해당 분야에 무지한 이들에게 정확히 인지시켜 바른 사실을 알게 만든다. 강의를 듣는 나조차도 과연 그 강의의 주장에 설득되어 고개를 끄덕일 정도였으니 말이다. 그가 학생들을 설득하기 위해 꺼내 든 것은 과연 사실, ‘데이터’였다. 그렇다면 그는 어떠한 기술을 사용하였기에 이러한 결과를 끌어낼 수 있었나?
결국 강의를 듣는 학생들을 설득한 가장 용이한 방법은 바로, 그 ‘사실’을 ‘시각화’해서 보여주는 기술이라고 판단했다. 데이터 시각화 말이다. 즉, 데이터 시각화는 가장 강렬한 설득행위의 방법이라고 표현할 수 있겠다. 수많은 데이터를 명료하게 시각화하여 사람들이 직관적으로 받아들이기 쉬운 형태로 정리한 것이 데이터 시각화의 놀라운 점이다. 만약 같은 자료가 단순한 표로 나열되어 있었다면 수치를 읽고 나라의 이름을 한 번 훑는 것만으로도 아주 단편적인 사실만을 기억에 남겨둘 수 있었을 것이다. 바로 다음 표테이블을 읽어내리는 순간, 뚝뚝 끊기듯 이전에 확인했던 데이터의 전체적인 흐름은 희미해진다. 하지만 데이터 시각화는 이러한 단점을 극복하여 모든 데이터를 연속적으로 표현하는 데에 탁월한 효율성을 보인다.
한스는 선진국 국가와 개발도상국 국가 간의 발전 추이를 시기별로 데이터 시각화하여 학생들에게 보여주었다. 어떤 나라가 상승세를 타는지, 어떤 나라에 변동이 없으며 어떤 나라는 비정상적인 행보를 보이는지 데이터 시각화를 통해 명확하게 파악할 수 있었다. 해당 분야에 대해 무지하고, 잘 알지 못하는 비전문가로서도 나라를 표현하는 포인트가 시간이 흐를수록 어떠한 의미의 상승곡선을 타는지는 지나치게 쉬울 정도로 파악하기 쉬웠다. 데이터 시각화는 데이터를 파악하기 쉽게 만들어주며, 그 연속성의 흐름을 캐치하는 데 놀라운 효과를 드러낸다.
데이터를 명료하고, 쉽게 파악할 수 있다는 사실은 또한 데이터에 문제점이나 특이점이 관찰될 때, 그것을 빠르게 지적하고 초점을 맞추는 데에 큰 도움이 된다. 더불어 연속적으로 이어지는 데이터를 파악한다는 것은 앞으로의 추이를 분석하기에도 쉽다는 의미이다. 인과관계를 밝혀낼 수 있으며, 해당 데이터 사이에 관계가 있는 것도, 없는 것도 시각화를 통해 명확해진다. 한스가 말하기로, 인구를 바라볼 때는 사실에 기반해야 하므로 역시 인구를 바라볼 때는 파도처럼 범람하는 데이터를 통해 분석해야 함이 틀림없다. 그렇게 쌓여 가늠하기 어려운 데이터를 시각화하여 모두에게 쉽게 분석할 수 있도록 정돈하는 것이 데이터 시각화의 영향력이며, 역할이라고 볼 수 있겠다.
3.
datarium 패키지를 설치하고 로드하여 marketing 데이터셋을 dat에 저장한 후 산점도를 그린 과정에서 작성한 코드이다.
▶plot()함수로 좌표평면을 설정하여 학번을 제목으로, x축과 y축을 각각 facebook(광고비), sales(판매액)으로 설정한다.
▶그래픽 모수 pch는 큰 점으로 설정하고 그 색은 파란색으로 정의하였다.
▶화귀직선의 색은 붉은색으로 하고, facebook을 독립변수, sales를 종속변수로 하여 산점도 위에 그렸다.
▶cor()로 상관계수를 분석하였고, 회귀분석을 거쳐 회귀계수를 출력하였다.
4.
코드 및 설명
C드라이브로부터 다운받은 csv 파일을 불러와 경로를 지정하고, 도표 작성에 필요한 칼럼들을 추출한다. 사용될 문자열을 data 클래스로 변환한다.
차후 결측치를 0으로 설정하는 과정에서 오류가 발생하여 문자열로 전환해준다.
new_cases의 결측치 7068개를 0으로 처리한 후, is_code를 factor로 변환하여 칼럼 순서를 바꾸어준다.
시각화에 용이성을 위해 데이터를 넓은 모양으로 바꿔준다.
데이터 변환에서 발생한 결측치를 모두 0으로 변환해준 후, xts 패키지를 호출한다.
문자열을 다시 data 클래스로 전환하여 도표를 만든다. ‘시간에 따른 신규 확진자 수’라는 제목의 도표를 만든다.
나라 별 그래프의 색상을 표시한다.
각 국의 신규 확진자 수는 2021년까지 비교적 평이한 추이를 보이며 상승과 하락세를 반복했다. 하지만 2022년에 들어 신규 확진자 수가 급증한 사례를 확인할 수 있다. 미국의 상승세와 하락세가 유독 다른 나라에 비해 큰 것을 볼 수 있다. 다만, 현재는 모든 나라가 비슷한 추이를 보이고 있었다.
다만 2022년 초 코로나 확진자가 급증한 것은 오미크론 변이가 큰 영향을 미친 까닭이다. 따라, 앞으로 새로운 변이가 나타나지 않는 이상 계속 비슷한 수준을 유지할 것으로 보인다. 하지만 이 말인 즉슨, 새로운 변이가 나타나면 2022년 초에 보인 것과 같은 수치로 급증할 것으로 예상된다. 현재는 거의 하락세에서 적은 수치를 맴돌고 있으므로, 당장 눈에 띄는 상승세를 보이지는 않을 것이라고 예측하며, 바닥에서 맴도는 수준의 낮은 수치를 기록할 것이라고 유추된다.
코로나 바이러스는 변이를 쉽게 예측할 수 없어 한 번 걷잡을 수 없이 퍼지면 꺾여올라가는 듯한 상승세를 보이게 된다. 현재 많은 방역대책이 마련되어 이러한 사항이 또 다른 변이가 나타났을 때 오미크론 상승세보다는 낮은 상승률을 보이지 않을까 예상해 볼 수 있을 것 같다. 현재로서는 상승, 하락세를 주기적으로 반복하던 그래프가 안정기에 접어들 것이라고 예측하고, 변동폭도 이전에 비해 현저히 낮은 추세를 보일 것이라고 예상된다. 아마 먼 미래에는 이보다도 더 낮은 변동폭을 보일 것이라고 결론지어볼 수 있을 것이다.
1번 사이트 목록
https://health.hawaii.gov/coronavirusdisease2019/tableau_dashboard/hawai%ca%bbi-covid-19-summary-metrics-by-state-and-county/
https://covid.cdc.gov/covid-data-tracker/#global-counts-rates
https://www.childrens.com/covid-19/systemwide-covid-19-data

키워드

  • 가격3,700
  • 페이지수10페이지
  • 등록일2022.09.14
  • 저작시기2022.8
  • 파일형식한글(hwp)
  • 자료번호#1184332
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니