목차
1. 데이터에 대한 다음 질문에 답하시오
1-1. 데이터에 대한 사전적 정의와 어원적 정의를 기술하시오.
1) 사전적 정의
2) 어원적 정의
1-2. 정형 데이터와 비정형 데이터의 의미를 비교하여 기술하시오.
1) 정형 데이터(Structured Data)
2) 비정형 데이터 (Unstructured Data)
3) 비교
1-3. 정형 데이터 중 범주형 데이터의 두 가지 분류를 쓰고, 각 데이터의 사례(교재 외의 사례)를 제시하시오.
1) 명목형 데이터 (Nominal Data) 및 사례
2) 순서형 데이터 (Ordinal Data) 및 사례
2. 교재에서 제시한 '데이터 주도권'의 의미를 약술하고 다섯 가지 필요 소양 중 개인적인 측면에서 가장 중요하다고 생각하는 소양 2가지를 선택하여 그 이유를 기술하시오.
2-1. '데이터 주도권'의 의미
2-2. 개인적인 측면에서 가장 중요한 소양 2가지 선택 및 이유
1) 이해력 (Understanding)
2) 통찰력 (Insight)
3. 데이터품질의 의미를 약술하고 데이터품질 관리의 실패가 조직의 경영에 미치는 영향에 대해 교재 외의 사례를 조사하여 기술하시오.
3-1. 데이터품질의 의미
3-2. 데이터 품질관리의 실패가 조직 경영에 미치는 영향: 교재 외 사례
1) 데이터 품질관리의 실패의 사례
2) 데이터 품질관리의 실패가 조직 경영에 미친 영향
4. 빅데이터 시대의 주요 분석 방법 중 하나로서 데이터시각화 기법을 꼽을 수 있다. 데이터 시각화의 의미를 약술하고 데이터시각화가 성공적으로 이루어진 사례와 그렇지 못한 사례를 조사하여 비교하고 기술하시오.
4-1. 데이터 시각화의 의미
4-2. 데이터 시각화 성공 사례와 실패 사례 조사 및 비교
1) 성공 사례
2) 실패 사례
3) 성공 사례와 실패 사례의 비교
5. 참고문헌
1-1. 데이터에 대한 사전적 정의와 어원적 정의를 기술하시오.
1) 사전적 정의
2) 어원적 정의
1-2. 정형 데이터와 비정형 데이터의 의미를 비교하여 기술하시오.
1) 정형 데이터(Structured Data)
2) 비정형 데이터 (Unstructured Data)
3) 비교
1-3. 정형 데이터 중 범주형 데이터의 두 가지 분류를 쓰고, 각 데이터의 사례(교재 외의 사례)를 제시하시오.
1) 명목형 데이터 (Nominal Data) 및 사례
2) 순서형 데이터 (Ordinal Data) 및 사례
2. 교재에서 제시한 '데이터 주도권'의 의미를 약술하고 다섯 가지 필요 소양 중 개인적인 측면에서 가장 중요하다고 생각하는 소양 2가지를 선택하여 그 이유를 기술하시오.
2-1. '데이터 주도권'의 의미
2-2. 개인적인 측면에서 가장 중요한 소양 2가지 선택 및 이유
1) 이해력 (Understanding)
2) 통찰력 (Insight)
3. 데이터품질의 의미를 약술하고 데이터품질 관리의 실패가 조직의 경영에 미치는 영향에 대해 교재 외의 사례를 조사하여 기술하시오.
3-1. 데이터품질의 의미
3-2. 데이터 품질관리의 실패가 조직 경영에 미치는 영향: 교재 외 사례
1) 데이터 품질관리의 실패의 사례
2) 데이터 품질관리의 실패가 조직 경영에 미친 영향
4. 빅데이터 시대의 주요 분석 방법 중 하나로서 데이터시각화 기법을 꼽을 수 있다. 데이터 시각화의 의미를 약술하고 데이터시각화가 성공적으로 이루어진 사례와 그렇지 못한 사례를 조사하여 비교하고 기술하시오.
4-1. 데이터 시각화의 의미
4-2. 데이터 시각화 성공 사례와 실패 사례 조사 및 비교
1) 성공 사례
2) 실패 사례
3) 성공 사례와 실패 사례의 비교
5. 참고문헌
본문내용
hn Snow는 1854년 런던 브로드 스트리트(Broad Street) 지역에서 발생한 콜레라 발병 사태를 조사하며, 빅데이터(당시로서는 수백 건의 발병 기록)를 시각화한 지도를 만들었다. 이 지도는 발병 위치를 점(dot map)으로 표시하고, 중앙의 물 펌프(water pump)를 중심으로 패턴을 드러냈다. 결과적으로, 콜레라가 오염된 물 펌프를 통해 전파된다는 사실을 증명했으며, 이는 현대 역학의 기초를 마련했다.
(1) 구체적인 설명
지도는 런던 소호(Soho) 지역의 거리와 집 위치를 배경으로, 각 발병 사례를 검은 점으로 표시했다. 총 578건의 사망자를 분석한 결과, 대부분의 점이 브로드 스트리트 펌프 주변에 집중되어 있음을 보여주었다. Snow는 이 시각화를 통하여 펌프 손잡이를 제거하도록 제안했고, 이후 발병이 급감했다. 이 작업은 빅데이터의 초기 예로, 공간 데이터(geospatial data)를 활용한 시각화로 패턴을 발견한 사례이다. 현재에도 Tableau나 GIS 도구로 재현되며, 데이터 시각화의 역사적 이정표로 평가된다.
(2) 성공 요인
①명확성과 직관성: 점 지도 형식으로 공간적 패턴을 즉시 드러내, 텍스트 설명 없이도 원인(오염된 물)을 파악할 수 있었다. 빅데이터의 복잡성을 단순화해서 비전문가(의사, 당국)에게 효과적으로 전달했다.
②영향력: 이 시각화는 콜레라 전파 이론을 입증하고, 하수 시스템 개선과 같은 공공 보건 정책을 촉진했다. 사회적 영향으로, 수만 명의 생명을 구한 것으로 추정되며, 현대 빅데이터 분석(예: COVID-19 추적 지도)의 기반이 되었다.
③빅데이터 적용: 당시 수집된 발병 데이터(시간, 위치, 인구 통계)를 통합해 분석, 시각화의 힘으로 인과관계를 증명했다.
2) 실패 사례
실패 사례는 2009년 스페인 정부의 전기 가격 변화 그래프 (Spanish Government Electricity Price Graph)이다. 2009년 스페인 정부는 마리아노 라호이(Mariano Rajoy) 총리 재임 동안의 전기 가격 변화를 보여주는 막대그래프를 발표했다. 이 그래프는 가격 상승을 최소화해 긍정적으로 보이게 조작되었으나, 실제 데이터는 상승 추세를 나타냈다. 이는 정치 캠페인 자료로 사용되었으며, 데이터 시각화의 악용 사례로 유명하다.
(1) 구체적인 설명
당시 그래프는 2004~2009년 전기 가격 변화를 세로막대(bar chart)로 표현했으나, 각 막대가 비례하지 않게 왜곡되었다. 이를테면, 가격이 10% 상승한 막대는 이전 막대보다 훨씬 길게 그려져 변화를 과장되게 보이게 했다. 실제 데이터(스페인 에너지 규제 기관 CNE 자료)에 따르면, 라호이 재임 기간 가격은 2004년 대비 약 30% 상승했으나, 그래프는 이를 -12% 변화로 축소 왜곡했다. 그로 인해 대중은 가격 안정화를 믿었으나, 실제로는 가계 부담 증가를 초래했다.
(2) 실패 요인
①왜곡과 오해 유발: 막대 길이를 비례적으로 하지 않아(예: 3D 효과나 불균형 스케일 사용), 시각적 착시를 일으켰다. 빅데이터(연간 가격 통계)를 다루었으나, y-축 스케일을 0에서 시작하지 않고 조작해서 변화를 과소평가했다. 이는 관객의 잘못된 해석을 유발, 정치적 신뢰 상실로 이어졌다.
②영향력: 이 시각화는 정부 정책의 신뢰성을 떨어뜨렸으며, 야당과 미디어로부터 비판을 받았다. 경제적으로는 소비자들이 실제 가격 상승을 인지하지 못해 에너지 정책 논란이 지속되었고, 장기적으로 EU 규제 조사로 이어졌다. 빅데이터의 정치적 악용으로, 데이터 윤리 문제를 제기했다.
3) 성공 사례와 실패 사례의 비교
아래 표에서 성공 사례(John Snow의 콜레라 지도)와 실패 사례(스페인 전기 가격 그래프)를 비교했다. 비교 기준은 시각화 기법, 데이터 처리, 영향, 그리고 빅데이터 시대의 함의이다.
(1) 비교표
항목
성공 사례: John Snow의 콜레라 지도
실패 사례: 스페인 전기 가격 그래프
시각화 기법
점 지도(dot map): 공간적 패턴을 직관적으로 표현, 단순하고 정확한 비례 사용
막대 그래프(bar chart): 비례 왜곡(길이 불균형, 스케일 조작)으로 착시 유발.
데이터 처리
빅데이터(발병 위치·시간 통합) 정확히 반영, 인과관계 명확히 드러냄.
빅데이터(가격 통계) 왜곡, 실제 상승(30%)을 -12%로 축소 표현
명확성 및 이해도
높음: 비전문가도 패턴 파악 가능, 오해 없음
낮음: 시각적 착시로 오판 유발, 데이터 원본과 불일치.
영향
긍정적: 공공 보건 혁신(펌프 제거, 하수 시스템 개선), 생명 구함. 사회적·과학적 영향 큼
부정적: 정치 신뢰 상실, 경제 정책 논란, EU 조사 유발. 소비자 피해 증대.
빅데이터 함의
빅데이터의 공간 분석 성공 모델: 패턴 발견으로 의사결정 지원
빅데이터 악용 위험: 정치·비즈니스에서 왜곡 시 윤리 문제 발생, 오판 초래.
(2) 전반적 비교 분석
성공 사례는 데이터의 진실성을 유지하며 시각화의 목적(패턴 발견)을 달성하여 장기적 가치를 창출했다. 반대로 실패 사례는 시각적 매력을 위해 데이터를 조작해 단기적 이득을 노렸으나, 신뢰 상실과 사회적 비용을 초래했다. 빅데이터 시대에서 성공은 정확성과 직관성(적절한 차트 선택, 비례 유지 등)에 달려 있으며, 실패는 왜곡(스케일 조작, 색상 착시 등)으로 이어진다. 이러한 교훈은 데이터 시각화가 단순 도구가 아닌, 책임 있는 커뮤니케이션임을 강조한다. 이를테면, 현대 빅데이터 도구(Tableau, Power BI)에서 Snow의 접근처럼 공간·시간 데이터를 활용하면 성공 가능성이 커지며, 스페인 사례처럼 정치·마케팅에서 왜곡을 피해야 한다.
5. 참고문헌
장영재, 유찬우(2022),데이터과학개론, 한국방송통신대학교출판문화원
과학기술정보통신부·한국데이터산업진흥원, 2023 데이터산업 현황조사 보고서 , 2024
고태우, 국내 데이터산업 시장 현황, 2024 데이터산업 백서, 한국데이터산업진흥원, 2024.
김동완(2013), 빅데이터의 분야별 활용사례, 동아대학교 경영문제연구소
김성원(2015), 빅데이터가 기업의 경쟁력에 미치는 영향에 관한 연구, 경기대학교
(1) 구체적인 설명
지도는 런던 소호(Soho) 지역의 거리와 집 위치를 배경으로, 각 발병 사례를 검은 점으로 표시했다. 총 578건의 사망자를 분석한 결과, 대부분의 점이 브로드 스트리트 펌프 주변에 집중되어 있음을 보여주었다. Snow는 이 시각화를 통하여 펌프 손잡이를 제거하도록 제안했고, 이후 발병이 급감했다. 이 작업은 빅데이터의 초기 예로, 공간 데이터(geospatial data)를 활용한 시각화로 패턴을 발견한 사례이다. 현재에도 Tableau나 GIS 도구로 재현되며, 데이터 시각화의 역사적 이정표로 평가된다.
(2) 성공 요인
①명확성과 직관성: 점 지도 형식으로 공간적 패턴을 즉시 드러내, 텍스트 설명 없이도 원인(오염된 물)을 파악할 수 있었다. 빅데이터의 복잡성을 단순화해서 비전문가(의사, 당국)에게 효과적으로 전달했다.
②영향력: 이 시각화는 콜레라 전파 이론을 입증하고, 하수 시스템 개선과 같은 공공 보건 정책을 촉진했다. 사회적 영향으로, 수만 명의 생명을 구한 것으로 추정되며, 현대 빅데이터 분석(예: COVID-19 추적 지도)의 기반이 되었다.
③빅데이터 적용: 당시 수집된 발병 데이터(시간, 위치, 인구 통계)를 통합해 분석, 시각화의 힘으로 인과관계를 증명했다.
2) 실패 사례
실패 사례는 2009년 스페인 정부의 전기 가격 변화 그래프 (Spanish Government Electricity Price Graph)이다. 2009년 스페인 정부는 마리아노 라호이(Mariano Rajoy) 총리 재임 동안의 전기 가격 변화를 보여주는 막대그래프를 발표했다. 이 그래프는 가격 상승을 최소화해 긍정적으로 보이게 조작되었으나, 실제 데이터는 상승 추세를 나타냈다. 이는 정치 캠페인 자료로 사용되었으며, 데이터 시각화의 악용 사례로 유명하다.
(1) 구체적인 설명
당시 그래프는 2004~2009년 전기 가격 변화를 세로막대(bar chart)로 표현했으나, 각 막대가 비례하지 않게 왜곡되었다. 이를테면, 가격이 10% 상승한 막대는 이전 막대보다 훨씬 길게 그려져 변화를 과장되게 보이게 했다. 실제 데이터(스페인 에너지 규제 기관 CNE 자료)에 따르면, 라호이 재임 기간 가격은 2004년 대비 약 30% 상승했으나, 그래프는 이를 -12% 변화로 축소 왜곡했다. 그로 인해 대중은 가격 안정화를 믿었으나, 실제로는 가계 부담 증가를 초래했다.
(2) 실패 요인
①왜곡과 오해 유발: 막대 길이를 비례적으로 하지 않아(예: 3D 효과나 불균형 스케일 사용), 시각적 착시를 일으켰다. 빅데이터(연간 가격 통계)를 다루었으나, y-축 스케일을 0에서 시작하지 않고 조작해서 변화를 과소평가했다. 이는 관객의 잘못된 해석을 유발, 정치적 신뢰 상실로 이어졌다.
②영향력: 이 시각화는 정부 정책의 신뢰성을 떨어뜨렸으며, 야당과 미디어로부터 비판을 받았다. 경제적으로는 소비자들이 실제 가격 상승을 인지하지 못해 에너지 정책 논란이 지속되었고, 장기적으로 EU 규제 조사로 이어졌다. 빅데이터의 정치적 악용으로, 데이터 윤리 문제를 제기했다.
3) 성공 사례와 실패 사례의 비교
아래 표에서 성공 사례(John Snow의 콜레라 지도)와 실패 사례(스페인 전기 가격 그래프)를 비교했다. 비교 기준은 시각화 기법, 데이터 처리, 영향, 그리고 빅데이터 시대의 함의이다.
(1) 비교표
항목
성공 사례: John Snow의 콜레라 지도
실패 사례: 스페인 전기 가격 그래프
시각화 기법
점 지도(dot map): 공간적 패턴을 직관적으로 표현, 단순하고 정확한 비례 사용
막대 그래프(bar chart): 비례 왜곡(길이 불균형, 스케일 조작)으로 착시 유발.
데이터 처리
빅데이터(발병 위치·시간 통합) 정확히 반영, 인과관계 명확히 드러냄.
빅데이터(가격 통계) 왜곡, 실제 상승(30%)을 -12%로 축소 표현
명확성 및 이해도
높음: 비전문가도 패턴 파악 가능, 오해 없음
낮음: 시각적 착시로 오판 유발, 데이터 원본과 불일치.
영향
긍정적: 공공 보건 혁신(펌프 제거, 하수 시스템 개선), 생명 구함. 사회적·과학적 영향 큼
부정적: 정치 신뢰 상실, 경제 정책 논란, EU 조사 유발. 소비자 피해 증대.
빅데이터 함의
빅데이터의 공간 분석 성공 모델: 패턴 발견으로 의사결정 지원
빅데이터 악용 위험: 정치·비즈니스에서 왜곡 시 윤리 문제 발생, 오판 초래.
(2) 전반적 비교 분석
성공 사례는 데이터의 진실성을 유지하며 시각화의 목적(패턴 발견)을 달성하여 장기적 가치를 창출했다. 반대로 실패 사례는 시각적 매력을 위해 데이터를 조작해 단기적 이득을 노렸으나, 신뢰 상실과 사회적 비용을 초래했다. 빅데이터 시대에서 성공은 정확성과 직관성(적절한 차트 선택, 비례 유지 등)에 달려 있으며, 실패는 왜곡(스케일 조작, 색상 착시 등)으로 이어진다. 이러한 교훈은 데이터 시각화가 단순 도구가 아닌, 책임 있는 커뮤니케이션임을 강조한다. 이를테면, 현대 빅데이터 도구(Tableau, Power BI)에서 Snow의 접근처럼 공간·시간 데이터를 활용하면 성공 가능성이 커지며, 스페인 사례처럼 정치·마케팅에서 왜곡을 피해야 한다.
5. 참고문헌
장영재, 유찬우(2022),데이터과학개론, 한국방송통신대학교출판문화원
과학기술정보통신부·한국데이터산업진흥원, 2023 데이터산업 현황조사 보고서 , 2024
고태우, 국내 데이터산업 시장 현황, 2024 데이터산업 백서, 한국데이터산업진흥원, 2024.
김동완(2013), 빅데이터의 분야별 활용사례, 동아대학교 경영문제연구소
김성원(2015), 빅데이터가 기업의 경쟁력에 미치는 영향에 관한 연구, 경기대학교
키워드
추천자료
근현대한일관계와국제사회중간과제물공통형
데이터과학개론 2024년 2학기 방송통신대 중간과제물)범주형 데이터와 수치형 데이터의 의미...
빅데이터 시대에 접어들어 인공지능 등 첨단 기술의 발전이 가속화되는 상황에서 데이터 주도...
(운영체제 2025학년도 1학기 방송통신대 중간과제물 - 교재와 강의를 기준으로 다음에 대해 ...
[인터넷생활윤리 2025학년도 1학기 중간과제물] 하기 싫은 일 하기 전략을 활용한 주체적 디...
데이터과학개론 2025년 2학기 방송통신대 중간과제물)데이터에 대한 사전적 정의(1점)와 어원...
(데이터과학개론) 1. 데이터에 대한 다음 질문에 답하시오
(데이터과학개론) 1. 데이터에 대한 다음 질문에 답하시오. (1) 데이터에 대한 사전적 정의와...
데이터통계1 데이터과학개론 데이터 주도권의 의미를 약술하고 다섯 가지 필요 소양 중 개인...
소개글