음성인식 레포트 - 교육 레포트

본 자료는 4페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.

해당 자료는 4페이지 까지만 미리보기를 제공합니다.
4페이지 이후부터 다운로드 후 확인할 수 있습니다.

본문내용

01 Light 버전이 무료로 배포되고 있으며 시스템 사양은 다음과 같다.
● OS: Windows 95/98/ME, Windows NT 4.0, Windows 2000 Professional 또는 Server
● CPU: Pentium3 - 400㎒ 이상
● RAM: 정식버전 - 최소 128MB (256MB 권장), Light 버전 - 최소 64MB (128MB 권장)
● HDD: 정식버전 80 MB, Light 버전 15 MB (프로그램 사용용량)
● Internet Browser: Internet Explorer v.5.0 이상
● 기타: 사운드 블래스터 호환 사운드 카드 (양방향-Full Duplex 지원필수), 일반 PC 마이크
Ⅲ. D&M Technoolgy의 VoiceExplorer
VoiceExplorer는 화자독립 가변어휘 핵심어 음성인식 엔진인 SRE-1000을 탑재하여 음성명령만으로 인터넷을 즐길 수 있는 음성인식 브라우저이다. 이 프로그램에서 사용된 가변어휘 기술이란 문자정보만 있으면 무제한 인식하는 기술이며, 핵심어 기술이란 명령어 발음 시 해당 명령어를 포함하여 문장의 형태로 발음하여도 인식을 가능하게 하는 기술이다.
Ⅳ. 엑트벨리의 Voice Voyager
엑트밸리의 음성인식기 AVS-2000을 기반으로 개발한 Voice Voyager™는 무제한 웹 검색 인식 버전이다. 이는 웹사이트를 검색할 때, 링크 된 페이지를 마우스 클릭 대신 헤드셋이나 마이크로폰을 이용해 음성으로 입력하면 자동 연결되는 기술이다. Voice Voyager™ 는 MS Internet Explorer에 플러그인 형태로 서비스를 제공된다.
인식 상태창에서 음성 입력의 진행과 결과를 보여줘 사용상 편리했으며, 잘못 인식할 경우 언제든지 재입력이 가능할 뿐만 아니라 필요한 때 사용하고 필요하지 않을 경우 언제든지 종료할 수 있도록 제작되었다. 또한 어떠한 페이지로의 이동도 단지 목소리 하나로 이동 가능합니다. 이 프로그램은 Microsoft Window 98/ 2000, 메모리는 64MB 이상, CPU는 Pentium III 이상에서 작동된다.
Ⅴ. L&H사의 Voice Xpress.
L&H의 VoiceXpress
이 프로그램은 Microsoft사의 MS-Office2000과 연계되어, 음성으로 프로그램을 실행시킬 수 있고, 또한 키보드로 문서를 칠 필요 없이, 음성으로 불러주는 대로 dictation하게 하고 또한 그것을 음성으로 읽혀 주는 프로그램이다. 이 프로그램은 화자가 읽는 속도 그대로 음성을 인식할 수 있으며, 음성으로 문서의 편집까지 가능하다. 이 프로그램은 자체 개발한 마이크가 제공되어, 에러 없이 깨끗하게 음성을 입력할 수 있다. 또한 바로 레코딩 장치로 출력 음성이 녹음될 수 있고, 또 사람의 음성뿐 아니라 라디오나 카세트에서 나오는 문장이 Dictation될 수도 있다. 또 이 제품은 여러 언어의 버전으로 개발되어, 업그래이드될 수 있다. 지금은 독일어, 프랑스어, 스페인어, 영국 영어 버전 등이 나왔다.
Ⅵ. Philips사의 SpeechPro.
SpeechPro는 마이크처럼 들고 다닐 수 있는 장치로서, 컴퓨터와 연결되어, 화자가 말하는 음성을 MS-Office 프로그램에 Dictation할 수 있다. 이 제품을 특히 비즈니스 전문용어 데이터 베이스가 구축되어 그 분야에 종사하는 사람에게 편리하도록 되었다. 그리고 다중언어인식기는 사용자의 언어 중에 섞여 있는 외래어도 그 언어스펠링으로 Dictation하게 한다. 또한 받아 적은 내용을 다시 음성으로 재생할 수 있는 TTS기능도 있어, 지금까지 입력한 내용을 확인할 수도 있다.
6. 음성인식의 전망
최근 음성인식기술은 미국을 중심으로 구체적인 응용분야가 개척되어오고 있고 멀티모드/멀티미디어 환경 속에서의 다른 미디어와 통합에 관한 연구가 진행되고 있다. 향후 이러한 멀티미디어와 결합되는 연구가 더욱 활발하게 진행될 것으로 기대된다. 이러한 멀티모드/ 멀티미디어 기술의 활용분야로는 각종 멀티미디어 정보기기의 입출력 인터페이스, 카 네비게이션 시스템 개발, 시각 장애자를 위한 서비스 시스템, 대화형 자판기, 대화형 Robot, 3차 컴퓨터 시스템 개발, 제품의 검사, 멀티모드 의료 서비스, 각종 멀티모달 데이터 베이스 검색 멀티모드형 인터넷 검색기, 홈쇼핑, 자동 예약/문의 시스템, 음성 입출력 PC, 전자 메일 시스템 개발, 멀티모드형 자동항법 장치 개발, KIOSK 개발 등 그 분야는 이루 헤아릴 수 없다. 이와 같은 응용연구와 더불어 자연어 처리기술을 적극적으로 이용하는 자연발화 대화체 연속음성 인식에 관한 연구가 더욱 활발하게 진행될 것 생각된다. 이와 더불어 각국간의 자동통역전화에 관한 연구 도 가속화될 것으로 보인다.
음성인식 전반적으로서는 현재의 통계적 방법을 기반으로 실재의 대량의 음성 데이터의 음성 데이터에 기초를 둔 일상 언어의 언어모델을 구축하는 것, 다수화자의 음성데이터에 기저하여 개인차의 모델을 구출하여 이에 의한 다수 화자의 음성에의 적응화 알고리즘에 개발하는 것, 여러 종류의 잡음, 왜곡에 자동적으로 적응되는 방법을 확립하는 것 등이 중요한 기술적 과제로 될 것이다.
국내적으로는 하루빨리 대규모 한국어 음성데이터베이스가 구축되어 많은 음성연구자들이 공동으로 이용하여 서로의 연구결과를 평가하고 그 결과를 공유할 수 있는 기반이 조성되어야 할 것으로 생각된다.
-참고문헌-
1. 미와나미 기획신서 멀티미디어 정보학 4- 문자와 소리의 정보처리
나가오 마코토 외 공저 미국 멀티미디어 랩 번역
한국학술정보(주) 2000
2. http://www.voiceware.co.kr/korean/front/product3.html
3. http://www.voiceware.co.kr/korean/front/product4.html
4. http://www.dnmtech.co.kr/voiceexplorer.html
5. http://www.speech.philips.com/ud/get/Pages/pc_home.htm
6. http://www.lhsl.com/voicexpress/

키워드

음성인식, 음성정보, 입력음성, 대상화자, 음성인지

목차

본문내용

키워드

추천자료