데이터과학개론 2025년 2학기 방송통신대 중간과제물)데이터에 대한 사전적 정의(1점)와 어원적 정의(1점)을 기술하시오. 정형 데이터와 비정형 데이터 범주형 데이터 데이터 주도권 필요 소양 데이터품질 관리 데이터시각화 사례 등
본 자료는 4페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
해당 자료는 4페이지 까지만 미리보기를 제공합니다.
4페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

데이터과학개론 2025년 2학기 방송통신대 중간과제물)데이터에 대한 사전적 정의(1점)와 어원적 정의(1점)을 기술하시오. 정형 데이터와 비정형 데이터 범주형 데이터 데이터 주도권 필요 소양 데이터품질 관리 데이터시각화 사례 등에 대한 보고서 자료입니다.

목차

1. 데이터에 대한 다음 질문에 답하시오.
(1) 데이터에 대한 사전적 정의(1점)와 어원적 정의(1점)을 기술하시오.
(2) 정형 데이터와 비정형 데이터의 의미를 비교하여 기술하시오. (2점)
(3) 정형 데이터 중 범주형 데이터의 두 가지 분류를 쓰고, 각 데이터의 사례(교재 외의 사례)를 제시하시오. (2점)
2. 교재에서 제시한 ‘데이터 주도권’의 의미를 약술하고 다섯 가지 필요 소양 중 개인적인 측면에서 가장 중요하다고 생각하는 소양 2가지를 선택하여 그 이유를 기술하시오. (분량 : 문제를 제외하고 한글 11pt 줄간격 160%, MS word 기준 글자 크기 11 pt, 줄간격 1.5로 하여 A4지 1매 이상 기술할 것) (9점)
1) 데이터 주도권을 위한 소양
① 이해력 ② 인문학적 소양 ③ 통찰력
④ 윤리의식 ⑤ 유연성
2) 가장 중요한 소양 2가지
3. 데이터품질의 의미를 약술하고 데이터품질 관리의 실패가 조직의 경영에 미치는 영향에 대해 교재 외의 사례를 조사하여 기술하시오. (분량 : 문제를 제외하고 한글 11pt 줄간격 160%, MS word 기준 글자 크기 11 pt, 줄간격 1.5로 하여 A4지 1매 이상 기술할 것) (9점)
1) 데이터품질의 의미
2) 데이터품질 관리의 실패 사례 3가지 (교재외)
4. 빅데이터 시대의 주요 분석 방법 중 하나로서 데이터시각화 기법을 꼽을 수 있다. 데이터시각화의 의미를 약술(2점)하고 데이터시각화가 성공적으로 이루어진 사례와 그렇지 못한 사례를 조사하여 비교하고 기술(4점)하시오.
1) 데이터시각화의 의미
2) 데이터시각화의 성공 사례
3) 데이터시각화의 실패 사례

5. 참고문헌

본문내용

정하지 않아(221만여건) 주민등록번호 오류가 발생한 것이다.
③ 호적정보 10명중 1명 주민번호 오류
대법원이 관리하고 있는 호적정보시스템에 기록돼 있는 국민 10명 중 1명꼴로 주민등록번호가 잘못 기록돼 있었던 것으로 밝혀졌다. 2004년 7일 대법원에 따르면 2003년 5월 구축돼 가동 중인 이 시스템에 입력된 인구 5254만8493명 중 10.5%인 551만7646명의 주민등록번호가 잘못 기록됐던 것으로 집계됐다. 또 사망이나 분가 등으로 호적이 말소된 2040만4484명 중 20.6%인 419만6693명의 주민등록번호에 오류가 있었다. 이처럼 호적정보시스템의 주민등록번호 오류는 2001년부터 2년5개월 동안 7300만여명의 호적을 전산화하는 과정에서 지방자치단체 공무원들의 실수나, 1975년부터 주민등록번호를 기록하기 시작한 호적 원본 자체의 오류 때문으로 추측된다.
4. 빅데이터 시대의 주요 분석 방법 중 하나로서 데이터시각화 기법을 꼽을 수 있다. 데이터시각화의 의미를 약술(2점)하고 데이터시각화가 성공적으로 이루어진 사례와 그렇지 못한 사례를 조사하여 비교하고 기술(4점)하시오.
1) 데이터시각화의 의미
데이터 시각화란 방대한 데이터를 단순히 나열하거나 표로 제시하는 데 그치지 않고, 그 속에 담긴 경향, 패턴, 의미를 시각적 요소로 변환하여 효과적으로 전달하는 방법을 의미한다. 빅데이터 시대에는 데이터의 양이 폭발적으로 증가하기 때문에 이를 분석하고 가치 있는 통찰을 얻는 과정에서 단순한 계산이나 알고리즘만으로는 한계가 존재한다. 따라서 시각화는 데이터를 한정된 공간 안에서 요약·정리하고, 그 결과를 직관적으로 이해할 수 있도록 돕는 도구로서 중요한 역할을 한다.
데이터 시각화의 목적은 정보를 명확하고 효과적으로 전달하는 데 있다. 수많은 데이터를 직접 나열하지 않고도, 시각적 표현을 통해 누구나 쉽게 의미를 파악할 수 있도록 하는 것이다. 특히 전문적인 배경 지식이 부족한 사람들도 시각화를 통해 데이터를 빠르게 이해할 수 있다는 점에서 큰 장점이 있다.
또한 데이터 분석에서 통계적 모형이나 알고리즘은 정확성과 유연성이라는 장점을 지니지만, 제한된 시간 안에 분석 결과를 신속하게 공유하고 해석하는 데는 한계가 따른다. 반면 시각화는 데이터를 신속히 정보화하고 효율적으로 전달할 수 있어 빠른 의사결정에 기여한다. 따라서 데이터 시각화는 데이터과학자의 분석 도구이자, 의사소통 수단으로서 빅데이터 시대에 필수적인 역할을 하고 있다.
2) 데이터시각화의 성공 사례
스웨덴 의사이자 통계학자인 한스 로슬링은 전 세계 국가들의 소득 수준과 기대수명 데이터를 버블 차트라는 혁신적 방식으로 표현하였다. 각 국가는 하나의 원형(버블)으로 나타내며, 버블의 크기는 인구를, 가로축은 소득, 세로축은 기대수명을 표시했다. 시간의 흐름에 따라 애니메이션을 적용함으로써, 세계 각국이 발전하면서 기대수명이 늘고 소득 수준이 높아지는 추세를 직관적으로 보여주었다.
위 차트는 2015년 전 세계 182개국의 기대 수명과 소득을 시각적으로 나타내는데, 각 국가는 버블로 표시되고, 그 크기는 인구, 색상은 지역을 의미한다. 이 시각화에서 중요한 통찰은 더 이상 세계를 단순히 “부유한 선진국과 가난한 개발도상국”이라는 이분법으로 나눌 수 없다는 점이다.
대신 국가들은 4단계 소득 수준으로 분류되며, 이 구분은 국가의 경제적 위치와 기대 수명을 이해하는 데 더 적합하다. 또한 국가의 위치는 고정된 것이 아니고 해마다 변화할 수 있으므로, 특정 국가에 영구적인 라벨을 붙이기보다는 현재 처한 소득 수준과 기대 수명의 상태로 이해하는 것이 합리적이다.
또한 차트에서 드러나는 또 다른 사실은 소득 수준과 기대 수명이 정확히 비례하지는 않는다는 점이다. 예를 들어 4단계(고소득) 국가 중 극도로 낮은 기대 수명을 가진 나라는 없으며, 반대로 1단계(저소득) 국가 중 기대 수명이 유난히 높은 나라도 존재하지 않는다. 다만 대부분의 세계 인구는 2단계와 3단계에 해당하는 중간 지점에 속해 있으며, 이 구간에서는 소득을 어떻게 사용하느냐에 따라 기대 수명의 차이가 크게 벌어질 수 있다.
즉, 이 차트는 소득과 기대 수명 간의 관계가 단순한 선형적 이분법이 아니며, 중간 단계에서의 정책적 선택과 자원 활용 방식이 국민 건강과 삶의 질에 큰 영향을 미친다는 사실을 강조한다.
3) 데이터시각화의 실패 사례
위 사례는 합계 193%를 보여주는 Fox 뉴스의 파이 차트이다. 오른쪽의 빨간 부분은 Sarah Palin 지지 70%, 파란 부분은 Mike Huckabee 지지 63%, 초록 부분은 Mitt Romney 지지 60%로 표시되어 있다. 이 그래프는 2012년 공화당 대선 후보 지지율을 묻는 설문 결과를 보여주려 했지만, 파이 차트 조각들의 합이 193%에 달해 심각한 오류를 드러냈다. 파이 차트는 전체를 100%로 나타내야 하는데, 복수응답 설문 결과를 파이 차트로 잘못 표현하면서 합계가 100%를 넘게 된 것이다.
해당 방송 화면이 캡처되어 인터넷에 퍼지자, 파이가 193%라는 조롱과 함께 큰 화제가 되었다. 이 사례는 데이터 시각화 분야에서 전형적인 실패 사례로 회자되는데, 애초에 겹치는 응답의 데이터 시각화는 막대 그래프 등으로 표현하는 것이 적절할 것이다.
5. 참고문헌
장영재·유찬우 『데이터과학개론』 KNOU Press, 2022.
https://www.datanet.co.kr/news/articleView.html?idxno=36044
https://biz.chosun.com/site/data/html_dir/2004/01/06/2004010670373.html
https://www.donga.com/news/Politics/article/all/20040707/8080816/1
https://www.cliffsnotes.com/study-notes/20083449#:~:text=Dynamics%20%28Bartosik%2C%202009%29,Fox%20News%20Chart
과제 스트레스 싹~ 학점 쑥!
https://www.happycampus.com/store/zzzyzyztusz/
  • 가격5,000
  • 페이지수13페이지
  • 등록일2025.09.03
  • 저작시기2025.09
  • 파일형식한글(hwp)
  • 자료번호#5252433
본 자료는 최근 2주간 다운받은 회원이 없습니다.
다운로드 장바구니