목차
Ⅰ. 서 론
Ⅱ. 본 론
1. 자연언어처리(natural language processing)
1) 자연언어처리의 개념과 정의
2) 자연언어처리의 목적
3) 자연언어처리의 과정
(1) 형태소분석 단계
(2) 구문분석 단계
(3) 의미분석 단계
(4) 실용분석단계
4) 톰스키가 정의한 문법(4가지)
2. 컴퓨터 언어학(computational linguistics)
1) 컴퓨터 언어학의 개념과 정의
2) 컴퓨터언어학의 역사
3) 기호처리와 확률처리
4) 컴퓨터언어학과 언어연구
(1) 맞춤법 검사와 교정
(2) 문법 검사와 교정
(3) 음성합성과 음성인식
(4) 기계번역
5) 언어연구와 컴퓨터, 디지털 인문학
6) 언어학과 컴퓨터언어학
Ⅲ. 결 론
Ⅳ. 참고문헌
Ⅱ. 본 론
1. 자연언어처리(natural language processing)
1) 자연언어처리의 개념과 정의
2) 자연언어처리의 목적
3) 자연언어처리의 과정
(1) 형태소분석 단계
(2) 구문분석 단계
(3) 의미분석 단계
(4) 실용분석단계
4) 톰스키가 정의한 문법(4가지)
2. 컴퓨터 언어학(computational linguistics)
1) 컴퓨터 언어학의 개념과 정의
2) 컴퓨터언어학의 역사
3) 기호처리와 확률처리
4) 컴퓨터언어학과 언어연구
(1) 맞춤법 검사와 교정
(2) 문법 검사와 교정
(3) 음성합성과 음성인식
(4) 기계번역
5) 언어연구와 컴퓨터, 디지털 인문학
6) 언어학과 컴퓨터언어학
Ⅲ. 결 론
Ⅳ. 참고문헌
본문내용
face/hands/hair’의 경우, 영어의 ‘wash’가 그 대상이 무엇인지에 따라 ‘씻다’와 ‘감다’ 두 가지로 대응이 될 수 있다. 또한 우리말의 ‘손을 씻다’의 경우에는 이 표현이 정말 ‘손’과 ‘씻다’의 의미가 결합되어서 합성적 방식에 의해서 의미가 해석되는 표현인지 알 수가 없다. 맥락에 따라서는 ‘손을 씻다.’가 관용구로 ‘부정적인 일이나 찜찜한 일에 대하여 관계를 청산하다.’의 의미로 사용 될 수도 있기 때문이다.
5) 언어연구와 컴퓨터, 디지털 인문학
컴퓨터언어학의 발전과 더불어서 언어에 대한 지식을 컴퓨터로 이식시키기 위한 연구 이외에도 컴퓨터언어학에서 활용되는 다양한 기술들을 언어연구에 적용하는 방법론들이 이루어지고 있다.
그리고 언어연구뿐만 아니라, 전통적인 인문학 영역에 속하는 비판정본, 문헌계보연구, 고전문헌 주석 디지털 아카이브 시스템 등에도 컴퓨터언어학의 기법들이 적용되기 시작을 했다.
방언학(dialectology)과 역사언어학(historical linguistics)은 언어학 분야에서도 자료의 수집과 분석에 기반 한 경험적 연구방법론이 주요 연구방법론으로 적용이 되어 온 분야이다. 방언학 분야에서는 다양한 계산통계적 기법을 적용하여 방언의 차이를 계산하는 방법이 이루어져왔다. 전통적인 방언학을 바탕으로 계산모델과 음성, 음운·형태 대조에 컴퓨터를 이용한 분석 방법을 적용하여 이루어진 연구로는 히링가(Heeringa, 2004)의 연구가 있다.
히링가는 방언 간의 차이를 척도로 구별하기 위해 단어의 대응 관계에 나타나는 차이를 측정하는 방법을 사용했다. 단어의 차이 측정에는 동적프로그래밍 알고리즘의 한 가지인 레벤시타인 거리(Levenshtein distance)를 사용하였으며, 측정 결과의 분석을 위해서 다차원척도법(multi-dimensional scaling)을 사용하였고, 그 결과를 방언지도에 사상시킴으로써 방언연구에 컴퓨터언어학의 방법론과 전산통계를 활용하였다. 이러한 방법론은 최근 활발히 이루어지고 있는 언어유형론 분석에도 적용되고 있다.
고전문헌학(classic philology) 분야에서는 중세영어의 필사본인 ‘캔터베리 이야기’의 전승과정을 생물정보학(生物情報學, bioinformatics) 분석 방법을 이용해 그 계통분석을 수행한 ‘캔터베리 이야기 프로젝트(The Canterbury Tales Project)’1)가 있다. 이 프로젝트에서는 문헌의 전승과정을 유전자 변이과정에 비유하여 PAUP와 Splits라는 계통분석 소프트웨어를 활용해서 문헌의 전승과정을 밝혀냈다. 이와 같이 전통적 인문학 연구 방법론에 컴퓨터를 활용한 분석 방법과 컴퓨터언어학의 방법론을 융합하는 연구를 ‘디지털 인문학(Digital Humanities)’이라는 융합 분과로 통합하는 것이 최근 인문학 연구의 한 경향이다.
6) 언어학과 컴퓨터언어학
컴퓨터언어학의 특정 목적을 수행하기 위한 컴퓨터 시스템을 개발하는 목적을 위한 연구 수행을 위해서는 음성학, 음운론, 형태론, 통사론, 의미론, 화용론 등의 언어학의 전 분야에 대한 지식이 필요하다.
뿐만 아니라, 컴퓨터 알고리즘에 대한 이해와 다양한 언어 모델을 설명하는 수리언어학(mathematical linguistics), 이산수학, 선형대수, 통계학(statistics) 등의 지식과 프로그래밍 작성 능력도 함께 필요한 분야이다.
또한, 언어 자원을 구축하고 처리하기 위한 코퍼스언어학 방법론에 대한 지식이 함께 요구가 된다.
무엇보다 제일 중요한 것은 방대한 언어 자료를 관찰하고, 기존의 언어 분석 방법론을 계산 가능한 모델로 전환할 수 있는 자료 기반 분석 능력이 제일 필요한 분야라고 할 수 있다.
Ⅲ. 결 론
현대는 컴퓨터가 사회에 널리 보급이 될수록 보다 많은 사람들이 사용하기 편리한 컴퓨터라야 한다는 점이 중요한 사항으로 부각된다. 따라서 사람과 컴퓨터의 접점이 되는 부분, 소위 휴먼 인터페이스(Human Interface)라고 불리고 있는 부분에 대한 연구가 중요해진다.
또한 현대 사회에 급속도로 보급되고 있는 인터넷망에 의해서 사람들은 전 세계의 엄청난 정보를 함께 공유하게 되었다. 이에 따라 이와 같은 정보를 빠르고 정확하게 검색해 줄 수 있는 정보검색(Informatiion Retrieval) 기술은 멀티미디어 기술의 출현과 매우 중대한 요소가 되었다.
이제는 온라인상에서 이와 같은 검색엔진들의 도움을 얻어서 전자도서관 자료를 검색하는 것도 가능해졌다. 따라서 앞으로는 다국어(Multi-lingual) 문서를 검색할 수가 있거나, 올바른 정보만을 검색할 수 있는 보다 지능화된 검색 기술이 요구될 것이며, 바로 이와 같은 기술의 향상에는 바로 컴퓨터언어학의 연구가 자리를 잡고 있다.
언어 이론은 과거 수십 년에 걸쳐 연구되고 발전해 왔으며, 여러 방식의 이론이 제창되었지만, 실제의 언어 처리에 바로 활용될 수 있는 것은 현재 존재하지 않는다.
언어 이론은 언어에 내재하는 법칙성을 발견하고, 이를 명시적 형태로 표현하는 것이다. 하지만 언어는 자연과학이 대상으로 하는 외계세계와는 달리, 인간의 두뇌가 가진 능력이며, 확실한 규칙성에 의거하고 있는 것으로는 보이지 않는다. 즉, 근사적인 방법으로 문장은 어떠한 구조를 하고 있다고 말을 할 수는 있어도 엄밀히 모든 문장에 대해 적용 가능한 문법규칙의 집합은 만들 수가 없다는 것이다. 따라서 제1차 근사로 만족할 수 없는 경우에는 제2차 근사, 제3차 근사라는 형태로 국소적으로 적용되는 규칙을 쌓아 두어야만 한다.
미묘한 표현의 차이를 번역해 내고자 할 때, 단순히 통사적 문법규칙과 대역단어의미 사전만을 중심으로 번역을 하는 것은 불충분하기 때문에, 보다 정교한 언어 지식 및 보완 장치가 요구된다.
Ⅳ. 참고문헌
권재일(2015). 언어의 이해. 한국방송통신대학교출판문화원.
강범모(2011). 언어, 컴퓨터, 코퍼스 언어학. 고려대학교출판부.
김진호(2019). 언어의 이해. 역락.
김경학(2017). 언어의 이해와 활용. 신아사.
바르가브 스리니바사 디지칸. 마창수 역(2019). 자연어 처리와 컴퓨터 언어학. 에이콘출판.
5) 언어연구와 컴퓨터, 디지털 인문학
컴퓨터언어학의 발전과 더불어서 언어에 대한 지식을 컴퓨터로 이식시키기 위한 연구 이외에도 컴퓨터언어학에서 활용되는 다양한 기술들을 언어연구에 적용하는 방법론들이 이루어지고 있다.
그리고 언어연구뿐만 아니라, 전통적인 인문학 영역에 속하는 비판정본, 문헌계보연구, 고전문헌 주석 디지털 아카이브 시스템 등에도 컴퓨터언어학의 기법들이 적용되기 시작을 했다.
방언학(dialectology)과 역사언어학(historical linguistics)은 언어학 분야에서도 자료의 수집과 분석에 기반 한 경험적 연구방법론이 주요 연구방법론으로 적용이 되어 온 분야이다. 방언학 분야에서는 다양한 계산통계적 기법을 적용하여 방언의 차이를 계산하는 방법이 이루어져왔다. 전통적인 방언학을 바탕으로 계산모델과 음성, 음운·형태 대조에 컴퓨터를 이용한 분석 방법을 적용하여 이루어진 연구로는 히링가(Heeringa, 2004)의 연구가 있다.
히링가는 방언 간의 차이를 척도로 구별하기 위해 단어의 대응 관계에 나타나는 차이를 측정하는 방법을 사용했다. 단어의 차이 측정에는 동적프로그래밍 알고리즘의 한 가지인 레벤시타인 거리(Levenshtein distance)를 사용하였으며, 측정 결과의 분석을 위해서 다차원척도법(multi-dimensional scaling)을 사용하였고, 그 결과를 방언지도에 사상시킴으로써 방언연구에 컴퓨터언어학의 방법론과 전산통계를 활용하였다. 이러한 방법론은 최근 활발히 이루어지고 있는 언어유형론 분석에도 적용되고 있다.
고전문헌학(classic philology) 분야에서는 중세영어의 필사본인 ‘캔터베리 이야기’의 전승과정을 생물정보학(生物情報學, bioinformatics) 분석 방법을 이용해 그 계통분석을 수행한 ‘캔터베리 이야기 프로젝트(The Canterbury Tales Project)’1)가 있다. 이 프로젝트에서는 문헌의 전승과정을 유전자 변이과정에 비유하여 PAUP와 Splits라는 계통분석 소프트웨어를 활용해서 문헌의 전승과정을 밝혀냈다. 이와 같이 전통적 인문학 연구 방법론에 컴퓨터를 활용한 분석 방법과 컴퓨터언어학의 방법론을 융합하는 연구를 ‘디지털 인문학(Digital Humanities)’이라는 융합 분과로 통합하는 것이 최근 인문학 연구의 한 경향이다.
6) 언어학과 컴퓨터언어학
컴퓨터언어학의 특정 목적을 수행하기 위한 컴퓨터 시스템을 개발하는 목적을 위한 연구 수행을 위해서는 음성학, 음운론, 형태론, 통사론, 의미론, 화용론 등의 언어학의 전 분야에 대한 지식이 필요하다.
뿐만 아니라, 컴퓨터 알고리즘에 대한 이해와 다양한 언어 모델을 설명하는 수리언어학(mathematical linguistics), 이산수학, 선형대수, 통계학(statistics) 등의 지식과 프로그래밍 작성 능력도 함께 필요한 분야이다.
또한, 언어 자원을 구축하고 처리하기 위한 코퍼스언어학 방법론에 대한 지식이 함께 요구가 된다.
무엇보다 제일 중요한 것은 방대한 언어 자료를 관찰하고, 기존의 언어 분석 방법론을 계산 가능한 모델로 전환할 수 있는 자료 기반 분석 능력이 제일 필요한 분야라고 할 수 있다.
Ⅲ. 결 론
현대는 컴퓨터가 사회에 널리 보급이 될수록 보다 많은 사람들이 사용하기 편리한 컴퓨터라야 한다는 점이 중요한 사항으로 부각된다. 따라서 사람과 컴퓨터의 접점이 되는 부분, 소위 휴먼 인터페이스(Human Interface)라고 불리고 있는 부분에 대한 연구가 중요해진다.
또한 현대 사회에 급속도로 보급되고 있는 인터넷망에 의해서 사람들은 전 세계의 엄청난 정보를 함께 공유하게 되었다. 이에 따라 이와 같은 정보를 빠르고 정확하게 검색해 줄 수 있는 정보검색(Informatiion Retrieval) 기술은 멀티미디어 기술의 출현과 매우 중대한 요소가 되었다.
이제는 온라인상에서 이와 같은 검색엔진들의 도움을 얻어서 전자도서관 자료를 검색하는 것도 가능해졌다. 따라서 앞으로는 다국어(Multi-lingual) 문서를 검색할 수가 있거나, 올바른 정보만을 검색할 수 있는 보다 지능화된 검색 기술이 요구될 것이며, 바로 이와 같은 기술의 향상에는 바로 컴퓨터언어학의 연구가 자리를 잡고 있다.
언어 이론은 과거 수십 년에 걸쳐 연구되고 발전해 왔으며, 여러 방식의 이론이 제창되었지만, 실제의 언어 처리에 바로 활용될 수 있는 것은 현재 존재하지 않는다.
언어 이론은 언어에 내재하는 법칙성을 발견하고, 이를 명시적 형태로 표현하는 것이다. 하지만 언어는 자연과학이 대상으로 하는 외계세계와는 달리, 인간의 두뇌가 가진 능력이며, 확실한 규칙성에 의거하고 있는 것으로는 보이지 않는다. 즉, 근사적인 방법으로 문장은 어떠한 구조를 하고 있다고 말을 할 수는 있어도 엄밀히 모든 문장에 대해 적용 가능한 문법규칙의 집합은 만들 수가 없다는 것이다. 따라서 제1차 근사로 만족할 수 없는 경우에는 제2차 근사, 제3차 근사라는 형태로 국소적으로 적용되는 규칙을 쌓아 두어야만 한다.
미묘한 표현의 차이를 번역해 내고자 할 때, 단순히 통사적 문법규칙과 대역단어의미 사전만을 중심으로 번역을 하는 것은 불충분하기 때문에, 보다 정교한 언어 지식 및 보완 장치가 요구된다.
Ⅳ. 참고문헌
권재일(2015). 언어의 이해. 한국방송통신대학교출판문화원.
강범모(2011). 언어, 컴퓨터, 코퍼스 언어학. 고려대학교출판부.
김진호(2019). 언어의 이해. 역락.
김경학(2017). 언어의 이해와 활용. 신아사.
바르가브 스리니바사 디지칸. 마창수 역(2019). 자연어 처리와 컴퓨터 언어학. 에이콘출판.
추천자료
- [중국공연예술 4학년] 교재 제14장과 제15장의 내용을 토대로 하여 20세기 초에 나온 중국 최...
- [중국공연예술 A형] 교재 제14장과 제15장의 내용을 토대로 하여 20세기 초부터 21세기 초에 ...
- (중국공연예술 A형) 교재 제14장과 제15장의 내용을 토대로 하여 20세기 초부터 21세기 초에 ...
- [2019 언어의이해1B] AI와 컴퓨터언어학에 대해 간략히 서술하시오 [교재 제14장과 교재 14장...
- [중어중문학과] [방통대 중어중문학과 3학년 중국공연예술 A형] 교재 제14장과 제15장의 내용...
- [2020 언어의이해1C] 언어치료에 대해 간략히 서술하시오 [교재 제14장과 교재 14장의 참고문...
- [2020 언어의이해1B] 자연언어처리와 컴퓨터언어학에 대해 간략히 서술하시오. [교재 제14장...
- [언어의이해A형]언어습득에 대해서 간략히 설명하시오(30점). [교재 제13장과 교재 13장의 참...
- [언어의이해C형]언어치료에 대해 간략히 서술하시오(30점). [교재 제14장과 교재 14장의 참고...
소개글