국어 정보 처리를 위한 품사 태그의 몇 문제
본 자료는 4페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
해당 자료는 4페이지 까지만 미리보기를 제공합니다.
4페이지 이후부터 다운로드 후 확인할 수 있습니다.

목차

제1절 서 론

제2절 본 론
2.1 국어 품사 태그의 형식적 분류 기준
2.2 국어 품사 태그의 내용적 분류 기준

제3절 결 론

본문내용

. 우리말 명사와 부사 가운데 시간을 나타내는 형태는 문장 내에서 동일 형태이지만 다른 기능을 하는 경우가 많다. 문장 안에서의 기능에 따라 각각 다르게 태깅하도록 하였다.
e) 와 f)는 대명사와 관형사의 중의적 형태이다. 대명사와 관형사의 구분은 격조사의 결합 여부로 판단할 수 있다. 격조사와 결합할 수 있는 형태는 대명사이고, 격조사가 결합할 수 없으면 관형사가 된다.

a)노력한 만큼 얻을 것이다. → 만큼/nbn
b)너만큼만 되었어도 좋겠다. → 너/npp + 만큼/jxc + 만/jxc
c)그가 간 대로 따라갔다. → 대로/nbn
d)나는 나대로 노력하겠다. → 나/npp + 대로/jxc
e)여기가 종점이다. → 여기/npd + 가/jcs
f)그가 여기 있다. → 여기/mad
a) b) c) d)는 의존 명사와 통용 보조사의 중의적 형태이다. 의존 명사와 통용 보조사의 구분은 관형형 어미 뒤어 사용되었느냐, 체언 뒤에 사용되었느냐로 구분할 수 있다.
e)와 f)는 대명사와 부사의 중의적 형태이다. 대명사와 부사의 구분도 역시 격조사의 결합 여부로 구분할 수 있다.
) 그러나 "그가 여기에 있다."의 경우에는 '여기'에 부사격 조사 '-에'가 결합한 형태이다. 이와 같이 부사격 조사가 결합하는 경우에는 체언으로 보아 여기/npd + 에/jca로 태깅하도록 한다.

a)"그가 나를 사랑한다."라고 말했다. → 라고/jcr
b)그걸 말이라고 하느냐? → 말/ncn + 이/jp + 라/ef + 고/jcr
c)나 혼자만 편하라고 하는 일이냐? → 편하/paa + 라고/ecc
a)는 인용격 조사로 쓰였고, b)는 종결어미와 인용격 조사가 결합한 형태이며 c)는 종속적 연결 어미로 쓰인 경우이다. '-라고''의 기능은 위와 같이 문장 속에서의 기능에 따라 세 가지로 나눌 수 있다.

a)그 후부터 잘 살게 되었다. → 살/pvg + 게/ecx
b)그가 잘 살게 복을 빌어라. → 살/pvg + 게/ecs
c)사과를 먹어 버렸다. → 먹/pvg + 어/ecx
d)사과를 많이 먹어 영양을 섭취하자. → 먹/pvg + 어/ecs
a) b) c) d) 는 보조적 연결 어미와 종속적 연결 어미의 중의적 형태이다. '-게'의 형태가 a)에서는 보조적 연결 어미로 쓰였으나, b)에서는 종속적 연결 어미로 쓰였다.
'-어/-아'도 b)에서는 보조적 연결 어미로, d)는 종속적 연결 어미로 사용되었다.

a)공부도 하고 심부름도 하였다. → 하/pvg + 고/ecc
b)그는 일만 하고 있다. → 하/pvg + 고/ecx
c)이젠 학교에 가지. → 가/pvg + 지/ef
d)학교에 가지 말아라. → 가/pvg + 지/ecx
e)숙제를 하다 학교에 갔다. → 하/pvg + 다/ecs
f)숙제를 다 끝내었다. → 끝내/ pvg + 었/ep + 다/ef
a)와 b)는 '-고'가 대등적 연결 어미와 보조적 연결 어미로 쓰였다.
c)와 d)는 '-지'가 종결 어미와 보조적 연결 어미로 쓰였다.
e)와 f)는 '-다'가 종속적 연결 어미와 종결 어미로 쓰인 경우이다. 종속적 연결 어미 '-다'는 중단의 의미를 나타내고, 종결 어미로 쓰이면 문장의 종결을 나타낸다.
제3절 결 론
국어 말뭉치에 품사 태그를 부착하는 것은 매우 어려운 일이다. 이에는 품사 태그 집합의 표준화가 선행되어야 한다. 품사 분류에는 학문성, 규범성 그리고 실용성을 동시에 만족시켜야 되는 부담이 있다. 더구나 우리말의 말뭉치가 대부분 구어체로 되어 있기 때문에 형태 분석의 어려움도 있다.
본고에서는 이와 같은 문제의 해소를 돕기 위해 일반적인 기준에 따라 정리한 내용을 몇 가지로 정리하였다.
1. 말뭉치의 원자료는 되도록 원형태를 살려 분석한다. 고어, 사투리, 비어, 외국어 및 사어 등도 비문이 아니면 원문대로 태깅토록 한다.
2. 준말이나 축약 형태는 원칙적으로 복원하지 않고 표기 형태를 살려서 태깅힌다. 예를 들면 '게' '건가' '뭐' '누' 등은 '것이' '것인가' '무엇' '누구'등 원말로 복원하지 않고 표기대로 분석한다.
3. 그러나 음운론적 변이 형태에서 굳어진 형태 이외는 그 원형을 복원토록 하였다. 예를들면 '추워 → 춥/paa + 어/ecc', '주셔요→ 주/pvg + 시/ep + 어/ef + 요/jxc'와 같은 불규칙 용언은 그 어간의 원형을 복원하였다.
4. 복합 형태는 분석을 원칙으로 하였다. 그런데 복합 형태의 대부분을 차지하고 있는 복합 명사의 경우 병렬 복합어나 종속 복합어는 분석하지만 융합 복합어는 분석하지 않았다. 분석에 따른 의미의 상실이 있기 때문이다.
5. 중의적 형태의 품사 태그는 문맥적 의미와 기능에 따라 달리 태깅하도록 하였다.
<참고문헌>
강승식(1993), <음성 정보와 복수어 단위 정보를 위용한 한국어 형태소 분석>, 서울대학교 컴퓨터공학과 박사학위 논문
국립국어연구원(1992), <국어사전에서의 파생어 처리에 관한 연구>, 국립국어연구원
권재일(1986), <형태론적 구성으로 인식되는 복합문 구성에 대하여>, 국어학 15
김영희(1987), <국어의 접속문>, 국어생활 제11호, 국어연구소
김재훈, 서정연(1995), <자연 언어 처리를 위한 한국어 품사태그>, 한국과학기술원
김진규(1996), <자연 언어 처리를 위한 한국어 품사 태그의 몇 가지 문제, 한글 233호
김진규(1996), <국어 품사 태그의 문제점(1)>, 웅진어문학 제4호
김진규, 박석문(1996), <국어 형태 통사 태그>, 국어 정보 처리 기반 구축을 위한 연구(3) 보고서, 문화체육부
노명희(1990), <한자어의 어휘 형태론적 특성에 관한 연구>, 국어연구 95
노명희(1997), <한자어 형태론>, 국어학 29
박석문(1992), <부사 형성의 통시적 연구>, 성균관대학교 박사학위 논문
박석문(1994), <'-하-'의 구성에 대하여>, 한림어문학 1집
안동언(1996), <품사분류(verl. 1)>, 전북대학교 컴퓨터공학과
한영균, 유동석(1993), <컴퓨터를 이용한 국어 자료 분석을 위한 기초적 연구>, 국립국어연구원
한영균(1996), <품사 태그 매뉴얼>, 울산대학교
  • 가격2,300
  • 페이지수13페이지
  • 등록일2002.03.13
  • 저작시기2002.03
  • 파일형식한글(hwp)
  • 자료번호#191877
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니