(30점 만점) 데이터과학입문 출석수업대체과제 한국방송통신대학교 정보통계학과
본 자료는 5페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
해당 자료는 5페이지 까지만 미리보기를 제공합니다.
5페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

(30점 만점) 데이터과학입문 출석수업대체과제 한국방송통신대학교 정보통계학과에 대한 보고서 자료입니다.

목차

1. 데이터 분석에 기계학습과 같은 알고리즘 접근방법이 도입된 이유를 기술하시오. (3점) 이러한 기계학습과 같은 알고리즘 접근방법의 특징을 모수적 모형 접근방법과 비교하여 약술하시오. (6점)
2. 빅데이터 시대의 주요 기술 중 하나로서 더그 커팅(Doug Cutting)이 공개한 하둡(Hadoop)을 꼽을 수 있다. 하둡의 개념을 조사하여 간략하게 기술하시오. (6점)
3. 추천 시스템에 활용되는 협업필터링은 무엇인지 설명하고 이의 종류로서 어떤 방법이 있는지 기술하시오. (6점)
4. 빅데이터 시대의 도래로 우리 사회는 많은 변화를 겪고 있다. 이러한 환경 변화로부터 비롯될 수 있는 긍정적인 영향과 부정적인 영향에 대한 자신의 견해를 기술하시오. (3점) 또한, 이와 관련한 데이터과학자의 역할을 논하시오. (3점)
5. 데이터 품질의 정의를 기술하고, 좋은 품질의 데이터가 기업경영에 미치는 영향에 대해 논하시오. (3점)

본문내용

있는 기회를 주며, 국제적으로 데이터를 공유할 수 있는 중요한 토대가 될 수 있다. 글로벌 데이터 공유가 가능해진다면 기업 경영활동의 스펙트럼이 훨씬 넓어질 것이다.
데이터 환경이 급변함에 따라 데이터 관리는 공공기관의 영역에서도 핵심적인 문제로 제기되는 추세이다. 민간기관의 노력은 말할 것도 없고, 공공기관에서도 데이터 품질관리의 중요성에 대한 인식을 가지고 있으며, 다양한 공공기관에서 데이터 품질관리체계를 도입하고 데이터 품질을 향상시키려는 노력을 지속적으로 투자하고 있다. 과거에는 단순히 데이터의 수집과 저장에만 주의를 기울이던 행태와는 매우 다른 양상을 보이고 있다. 예를 들어, 한국보건산업진흥원의 경우, 지난 2012년 4개 연구전문기관이 공동으로 사용하는 표준과제관리 시스템을 운영하기 시작하면서 연구지원 서비스의 품질 향상을 도모하는 한편, 궁극적으로는 데이터 품질의 일관성을 확보하기 위한 개선활동에 들어간 바 있다. 데이터 품질관리 체계 수준을 업그레이드하기 위하여 데이터 관리활동 개선을 수행하고 관련 인프라를 구축하였다. 이처럼 각계의 노력을 토대로 데이터 품질의 중요성에 관한 인식이 확대되었으며, 일반인들도 데이터가 품질관리의 중요한 대상임을 인지하게 되었다.
좋은 품질의 데이터가 기업경영에 미치는 영향 (데이터 품질관리의 필요성)
데이터 품질관리는 어떠한 의미를 갖는가? 데이터 품질관리란 과업목적을 효과성 있게 달성하도록 데이터의 품질관리를 지속적으로 수행하는 프로세스를 뜻한다. 경영자는 데이터 품질관리를 통하여 많은 이점을 취할 수 있다. 좋은 데이터 품질은 재화, 용역이나 서비스의 공급 측면에서 볼 때, 공급체계의 효율성을 높일 수 있는 가장 중요한 요소이다. 좋은 품질의 데이터를 지속적으로 유지하면 오류나 오차를 줄일 수 있을 뿐만 아니라, 업무효율성 자체를 증진시킨다. 결국 상당한 비용절감을 가져올 수 있으며, 그 결과 고객만족으로 이어진다. 또한 높은 품질의 데이터는 거래 상대방과의 신뢰관계 구축, 원활한 거래활동, 빠른 의사결정 및 합의 등을 이끌어내는 기반이 되므로 기업성과에 상당히 긍정적인 영향을 미치게 된다. 따라서 기업 경영활동의 효율성을 위해서 데이터의 품질관리가 필수불가결하다고 할 수 있다.
더하여 좋은 품질의 데이터는 다양한 문제들을 풀어낼 수 있는 솔루션을 제시한다. 기업 경영활동과 관련된 의사결정(decision-making)의 문제를 예로 들면, 언제 상품을 판매해야 하는지, 언제 신상품을 출시하는지 등의 문제가 기업의 매출에 크게 영향을 미치게 된다. 이 과정에서 양질의 데이터가 충분히 뒷받침되지 않는다면 기업은 심각한 손해를 입을 수 있다.
데이터 품질관리가 제대로 되지 않을 경우 발생할 수 있는 상황을 상상해 보자. 만일 알레르기를 유발하는 제품의 함유도 및 제품이나 서비스를 제공하는 장소의 청결상태 등에 관한 데이터가 부정확한 상태로 의사결정이 진행되었다고 가정하면, 이렇게 받아들여진 정보에 의거하여 제품이 생산·판매되거나 서비스로 제공된다면 고객 불만 정도에서 끝나는 것이 아니라 심한 경우 법적 소송에 이르게 될 수도 있다.
거래상대와 틀린 거래물품 번호를 교환하는 등 부정확한 데이터의 활용은 판매가격 오류나 판매시점 지연 등을 초래할 수 있다. 오류투성이의 데이터로 인해 과다생산으로 재고누적을 발생시키거나, 반대로 판매상품의 생산부족으로 판매기회를 잃고, 결과적으로 고객불만도 커질 수 있다. 또한 판매시점이 지연되면 각 소매점의 제품 구매거절 증가로 판매기회 손실로 이어지게 된다. 잘못된 데이터에 기반한 제품설명이나 오류투성이의 측정치, 가격책정 오류 등은 고객불만을 초래하고, 이는 결국 판매기회의 손실과 고객상실에 이르게 된다.
잘못된 데이터가 유통과정에 미치는 영향도 크다. 만일 틀린 거래번호가 전해지면 당연히 각 소매점이나 유통센터에서 수령해야 하는 제품을 적절히 받지 못하게 될 것이다. 또한 파손되기 쉬운 제품이나 취급주의가 필요한 제품에 관한 정보가 잘못되었을 경우에는 큰 피해를 입을 수 있다. 제품규격이나 형태 등에 관한 데이터가 잘못되었다고 가정해 보면, 이 경우에는 제품을 진열하거나 저장하는 공간낭비를 가져오게 되거나 판매에 적절하지 않게 배치하게 될 수도 있다. 적재중량의 데이터에 오류가 있을 경우 과적 등의 문제로 법적인 처분을 받을 수 있고, 이것으로 인하여 유통시간이 지연되는 부차적인 문제가 생길 수도 있다.
법적인 부분이나 규제 등과 관련하여 보면, 제품의 성분에 대한 조사결과가 부정확하게 반영된 데이터나 오류가 있는 측정 데이터는 결국 기업에 벌금이나 경영활동 제재 등의 법적인 부담을 안게 되는 결과를 불러오게 될 수 있다.
이처럼 데이터 품질관리가 제대로 수행되지 않으면 매우 다양한 영역에서 경영활동에 상당한 제약과 부담을 지게 된다. 따라서 이러한 피해를 사전에 방지하고 기업성과를 극대화하기 위한 기본은 데이터의 품질관리를 적절히 해내는 것이라고 할 수 있다.
분야
데이터 품질관리 오류
오류에 따른 영향
소매판매
제품설명 오류
가격책정 오류
판매기회 손실
고객불만
유통
취업주의 정보 오류
규격 정보 오류
물품파손
진열·적재 문제
법·규제
함유요소 누락
부정확한 측정
벌금
제재
<참고문헌>
최대우, 장영재, 이석호, 「데이터과학입문」, 한국방송통신대학교 출판문화원, 2016.
이긍희, 함유근, 김용대, 이준환, 원중호, 「빅데이터의 이해」, 한국방송통신대학교 출판문화원, 2014.
한국소프트웨어기술인협회 빅데이터전략연구소, 「빅데이터 개론」, 광문각, 2016.
박형준, 「빅데이터 전쟁」, 세종서적, 2015.
함유근, 채승명, 「빅데이터 경영을 바꾸다」, 삼성경제연구소, 2012.
함유근, 「이것이 빅데이터 기업이다」, 삼성경제연구소, 2015.
http://blrunner.com/12 빅데이터란 무엇인가? 쉽게 풀어 쓴 빅데이터와 하둡 이야기.
http://blog.naver.com/PostView.nhn?blogId=kmj20808&logNo=221274071948 빅데이터의 활용과 미래
https://kimstreasure.tistory.com/405 빅데이터의 중요성
  • 가격5,000
  • 페이지수15페이지
  • 등록일2020.03.26
  • 저작시기2019.11
  • 파일형식한글(hwp)
  • 자료번호#1127782
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니