목차
1. 빅데이터란?
2. 빅데이터 기술동향
3. 구글의 빅데이터 처리 기술
4. 빅데이터 활용 방안
5. 마치며..
2. 빅데이터 기술동향
3. 구글의 빅데이터 처리 기술
4. 빅데이터 활용 방안
5. 마치며..
본문내용
을 개발하기 위해 유전체 및 진료 데이터 기반 빅데이터 분석 필요성이 증대하고 있다.
DNA 염색체 하나의 크기가 750메가바이트며 유전자 변이까지 감안하면 약1기가 바이트까지 커질 수 있다. 이를 전세계 68억 인구로 환산하면 6억 8,000만 페타바이트에 달하는 엄청난 규모의 비정형 빅데이터에 해당한다. 한 명의 DNA 염기 서열은 데이터로서는 가치가 없지만, 다수의 염기 서열과의 비교를 통해 발병 가능한 병을 예측하는 정보가 됨으로써 특정 암을 앓고 있는 환자가 자신의 게놈 정보를 알고 있다면 유전 형질을 따져서 예후가 좋은 항암제를 처방 받을 수 있는 근거가 될 수 있다.
유전체 진료 빅데이터를 활용한 가치는 매우 크다. 2011년 5월 맥킨지 자료에 따르면, 빅데이터를 활용하면 미국 의료 분야에서 매년 3,300억 달러 가치의 생산 가능 효과가 있다고 분석하였으며, 이 액수는 연간 스페인 전체 의료비 지출의 2배에 달하는 액수이다. 또한, 유럽 공공 분야에서 빅데이터를 활용하면 2,500억 유로의 절감 효과가 있다고 하는데 이 액수는 그리스 GDP와 비슷하다. 국내에서도 2012년 11월 보건복지부, 농림수산식품부, 국토해양부, 교육과학기술부, 지식경제부, 농촌진흥청이 공동 기획한 “포스트게놈 신산업 육성을 위한 다 부처 유전체 사업”을 통해 오는 2014년부터 8년 간 5대 분야 17개 유전체 연구에 5,788억 원을 투입한다고 발표하였다. 특히, 정부의 유전체 기술 개발을 통해 생산되는 데이터는 최대 용량이 될 것이고, 이 데이터들을 통합 관리하는 체제의 구축 또한 시급히 검토할 필요가 있다.
각 염기 서열에서 발생한 정보와 환자의 질병 기록 데이터간 상관 관계 연구를 위해 각 유전자 값의 속성, 질병 유전자와의 교차 분석, 정합성 정도를 따지기 위한 검증 작업까지 매 순간이 복잡한 데이터 처리의 연속이다. 특히, 유전자 변이에 의해 발생하는 변이 여부를 파악하고 질병의 원인을 분석하기 위해 염기 서열 정보 해독 방법이 사용되며, 이러한 분석을 위해 유전체 빅데이터의 수집 및 관리 체제 구축, 진료 빅데이터의 수집/연계 및 상호운용성을 고려한 관리 체제 구축, 유전체 서열 고속 해석 기술 개발, 고빈도 주요 질환의 유전자 위험도 분석 및 예측기술 개발, 진료 빅데이터 분석을 통한 질환 원인 규명 기술 개발이 우선되어야 한다.
이러한 유전체 및 진료 데이터에 대한 적합한 빅데이터 분석기술 개발을 통해 질병의 조기 진단과 개인별 맞춤형 신약기술 개발이 가능해짐으로써 국민의 질병 예방 및 건강을 증진할 수 있다.
< 빅데이터 분석 플랫폼 활용을 통한 강소기업 육성 지원 >
기업은 지속 가능한 성장을 위해서 신기술, 신제품의 발굴이 매우 중요하다. 하지만 체계적으로 이를 지원해주는 시스템이 부족한 실정이다. 중소기업의 경우 내부 역량도 부족하므로 사업성 있는 신사업 발굴을 지원해 줄 수 있는 지능형 시스템을 활용할 기회도 얻기 쉽지 않다.
좌측의 그림은 KISTI에서 개발한 인사이트 어댑티브 서비스로서 과학기술 문헌 빅데이터를 기반으로 R&D 전략 수립을 위한 심층적인 분석과 예측 결과를 제공한다.
특히 다양한 과학기술 개체 간 연관 관계분석 기술개발, 과학기술 트렌드 분석 및 예측기술, 대용량 분산 온톨로지 추론기술, 미래 대응 기술 발굴 및 추천기술, 소셜 데이터 기반 사용자 요구사항 분석기술 개발 등을 통해 트렌드 분석 및 유망 기술 정보를 제공할 수 있으며, 이를 통해 강소기업 육성을 지원함으로써 개별 연구자 및 중소기업의 비용을 획기적으로 절감시키고, 나아가 국가 R&D의 경제적 효율성을 개선시키는 효과를 가질 수 있다.
마치며
이와 같이 IT기술의 발달에 따른 고성능 첨단 연구 장비 및 대용량 관측 데이터 등을 통해 획득한 희소한 과학기술 빅데이터의 경우 국가점 관점에서 중요 연구 자원이라 할 수 있다.
또한, 빅데이터 활용 가치를 높이기 위해 과학기술 빅데이터의 폭넓은 영역에 대한 해박한 지식을 고루 갖춘 빅데이터 전문 인력을 선제적으로 확보해야 하며, 글로벌 빅데이터 전문 인력 네트워크 또한 구축해야 한다.
이렇듯이 빅데이터는 다양한 분야별 데이터 연계를 통해 학제 간 연구 및 융합 연구를 촉진하고, 전 지구적 문제와 국가적 현안 문제 해결이 가능하게 하는 자원이자 도구라 할 수 있다. 국가 과학기술 빅데이터 공유를 위한 제도적 기반 역시 학제 간 연구 및 융합 연구를 장려하고 국가 과학기술 경쟁력을 제고하기 위해 조속히 마련되어야 한다.
DNA 염색체 하나의 크기가 750메가바이트며 유전자 변이까지 감안하면 약1기가 바이트까지 커질 수 있다. 이를 전세계 68억 인구로 환산하면 6억 8,000만 페타바이트에 달하는 엄청난 규모의 비정형 빅데이터에 해당한다. 한 명의 DNA 염기 서열은 데이터로서는 가치가 없지만, 다수의 염기 서열과의 비교를 통해 발병 가능한 병을 예측하는 정보가 됨으로써 특정 암을 앓고 있는 환자가 자신의 게놈 정보를 알고 있다면 유전 형질을 따져서 예후가 좋은 항암제를 처방 받을 수 있는 근거가 될 수 있다.
유전체 진료 빅데이터를 활용한 가치는 매우 크다. 2011년 5월 맥킨지 자료에 따르면, 빅데이터를 활용하면 미국 의료 분야에서 매년 3,300억 달러 가치의 생산 가능 효과가 있다고 분석하였으며, 이 액수는 연간 스페인 전체 의료비 지출의 2배에 달하는 액수이다. 또한, 유럽 공공 분야에서 빅데이터를 활용하면 2,500억 유로의 절감 효과가 있다고 하는데 이 액수는 그리스 GDP와 비슷하다. 국내에서도 2012년 11월 보건복지부, 농림수산식품부, 국토해양부, 교육과학기술부, 지식경제부, 농촌진흥청이 공동 기획한 “포스트게놈 신산업 육성을 위한 다 부처 유전체 사업”을 통해 오는 2014년부터 8년 간 5대 분야 17개 유전체 연구에 5,788억 원을 투입한다고 발표하였다. 특히, 정부의 유전체 기술 개발을 통해 생산되는 데이터는 최대 용량이 될 것이고, 이 데이터들을 통합 관리하는 체제의 구축 또한 시급히 검토할 필요가 있다.
각 염기 서열에서 발생한 정보와 환자의 질병 기록 데이터간 상관 관계 연구를 위해 각 유전자 값의 속성, 질병 유전자와의 교차 분석, 정합성 정도를 따지기 위한 검증 작업까지 매 순간이 복잡한 데이터 처리의 연속이다. 특히, 유전자 변이에 의해 발생하는 변이 여부를 파악하고 질병의 원인을 분석하기 위해 염기 서열 정보 해독 방법이 사용되며, 이러한 분석을 위해 유전체 빅데이터의 수집 및 관리 체제 구축, 진료 빅데이터의 수집/연계 및 상호운용성을 고려한 관리 체제 구축, 유전체 서열 고속 해석 기술 개발, 고빈도 주요 질환의 유전자 위험도 분석 및 예측기술 개발, 진료 빅데이터 분석을 통한 질환 원인 규명 기술 개발이 우선되어야 한다.
이러한 유전체 및 진료 데이터에 대한 적합한 빅데이터 분석기술 개발을 통해 질병의 조기 진단과 개인별 맞춤형 신약기술 개발이 가능해짐으로써 국민의 질병 예방 및 건강을 증진할 수 있다.
< 빅데이터 분석 플랫폼 활용을 통한 강소기업 육성 지원 >
기업은 지속 가능한 성장을 위해서 신기술, 신제품의 발굴이 매우 중요하다. 하지만 체계적으로 이를 지원해주는 시스템이 부족한 실정이다. 중소기업의 경우 내부 역량도 부족하므로 사업성 있는 신사업 발굴을 지원해 줄 수 있는 지능형 시스템을 활용할 기회도 얻기 쉽지 않다.
좌측의 그림은 KISTI에서 개발한 인사이트 어댑티브 서비스로서 과학기술 문헌 빅데이터를 기반으로 R&D 전략 수립을 위한 심층적인 분석과 예측 결과를 제공한다.
특히 다양한 과학기술 개체 간 연관 관계분석 기술개발, 과학기술 트렌드 분석 및 예측기술, 대용량 분산 온톨로지 추론기술, 미래 대응 기술 발굴 및 추천기술, 소셜 데이터 기반 사용자 요구사항 분석기술 개발 등을 통해 트렌드 분석 및 유망 기술 정보를 제공할 수 있으며, 이를 통해 강소기업 육성을 지원함으로써 개별 연구자 및 중소기업의 비용을 획기적으로 절감시키고, 나아가 국가 R&D의 경제적 효율성을 개선시키는 효과를 가질 수 있다.
마치며
이와 같이 IT기술의 발달에 따른 고성능 첨단 연구 장비 및 대용량 관측 데이터 등을 통해 획득한 희소한 과학기술 빅데이터의 경우 국가점 관점에서 중요 연구 자원이라 할 수 있다.
또한, 빅데이터 활용 가치를 높이기 위해 과학기술 빅데이터의 폭넓은 영역에 대한 해박한 지식을 고루 갖춘 빅데이터 전문 인력을 선제적으로 확보해야 하며, 글로벌 빅데이터 전문 인력 네트워크 또한 구축해야 한다.
이렇듯이 빅데이터는 다양한 분야별 데이터 연계를 통해 학제 간 연구 및 융합 연구를 촉진하고, 전 지구적 문제와 국가적 현안 문제 해결이 가능하게 하는 자원이자 도구라 할 수 있다. 국가 과학기술 빅데이터 공유를 위한 제도적 기반 역시 학제 간 연구 및 융합 연구를 장려하고 국가 과학기술 경쟁력을 제고하기 위해 조속히 마련되어야 한다.
키워드
추천자료
- [사회대]-컴퓨터,인터넷과 현대사회
- [OCU] 생활과컴퓨터의이해 2차레포트
- [정보처리]컴퓨터 시스템의 개요 - 워드프로세서(문서실무)
- [사이버범죄]컴퓨터범죄의 특성과 사례분석 및 대응체제
- [IT와경영정보시스템]컴퓨터 시스템의 하드웨어 직렬처리 및 병렬처리방식 분석과 소프트웨어...
- [해킹][해커][보안][보안시스템][컴퓨터범죄][해킹 역사][해킹 종류][해킹 사례][해킹에 대한...
- [IT와경영정보시스템]컴퓨터시스템 하드웨어의 직렬처리 방식에 비해 병렬처리 방식의 특징과...
- [보건교육B]중.고등학생의 컴퓨터중독증에 대한 보건교육 - [그린의 PRECEDE-PROCEDE 모형 적...
- 정보화 사회에 대한 고찰 (Key word : 컴퓨터/ 정보사회/ 세계화)
- 웹 정보기술 서비스, 컴퓨터 바이러스, 바이러스의 역사, 바이러스 향후 사회적 영향, 바이러...
- [e-비즈니스 공통] A.컴퓨터 통신 프로토콜중 프로토콜의 역할과 기능 설명한 모형으로 OSI 7...
- 데이터 베이스 빅데이터,빅데이타 개념(컴퓨터공학)
소개글