[문서영상, 처리기술, 워터마킹, 검색, 단어검색시스템, 단어단위분할시스템]문서영상의 처리기술, 문서영상의 워터마킹, 문서영상의 검색, 문서영상의 단어검색시스템, 문서영상과 단어단위분할시스템 분석
본 자료는 2페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
해당 자료는 2페이지 까지만 미리보기를 제공합니다.
2페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

[문서영상, 처리기술, 워터마킹, 검색, 단어검색시스템, 단어단위분할시스템]문서영상의 처리기술, 문서영상의 워터마킹, 문서영상의 검색, 문서영상의 단어검색시스템, 문서영상과 단어단위분할시스템 분석에 대한 보고서 자료입니다.

목차

Ⅰ. 개요

Ⅱ. 문서영상의 처리기술

Ⅲ. 문서영상의 워터마킹

Ⅳ. 문서영상의 검색
1. OCR 기반 검색
1) 낮은 인식률
2) 수작업에 의한 OCR 결과의 검증
2. 단어 매칭에 의한 검색

Ⅴ. 문서영상의 단어검색시스템

Ⅵ. 문서영상과 단어단위분할시스템
1. 줄 분리
2. 단어 분리

참고문헌

본문내용

연산자를 사용한 웨이블릿 변환 기법에 의해 획득한다. 한글 단어 영상 검색에서 Harr 웨이블릿 특징들의 효율성은 잘 기술되어있다. 웨이블릿 계수들을 특징 벡터로 사용하는데, 큰 값을 갖는 계수들은 원 영상을 대표하는 중요한 역할을 하기 때문에, 상위 k개의 계수만을 가지고 특징 벡터로 사용한다.
Ⅵ. 문서영상과 단어단위분할시스템
단어 단위 분할 시스템은 구조 분석을 통해 추출된 텍스트 영역을 단어 단위로 분할하는 것이다. 먼저 텍스트 영역을 줄 단위로 분리하기 위해 수평방향 투영 프로파일을 구하여 분할 지점을 찾는다. 다음으로 텍스트 영역에 대해 8방향 연결요소 레이블링을 이용해 각각의 연결요소를 구분 짓는다. 각각의 8방향 연결요소 레이블링 객체에 대해 중심점을 찾고 각각의 중심점 사이의 간격 정보를 얻어낸다. 단어와 단어 사이의 공간을 분류하기 위한 방법으로는 평균-결합 클러스터링을 이용한다.
1. 줄 분리
문서 영상의 구조분석을 통해 얻어진 텍스트 영역에 대해 줄단위로 분할을 한다. 제안하는 방법은 텍스트 영역의 수평 투영 프로파일을 분석하여 각 텍스트 줄의 구분점을 찾는다. 구분점을 찾는 방법은 프로파일에서 얻어진 a와 b를 분리점으로 사용할 수 있다.
일반적으로 텍스트 줄은 수평 투영 프로파일을 이용하여 쉽게 분리할 수 있다.
2. 단어 분리
단어 단위 분리는 수평 투영 프로파일을 통해 분리된 텍스트 줄에 대해 8방향 연결요소, 중심점, 평균 결합 클러스터링을 이용하여 분류할 수 있다. 단어 단위 분할에 사용되는 중심점을 찾기 위한 과정으로 줄 단위로 분리된 텍스트 영역에 대해 8방향 연결 요소 레이블링을 수행한다.
레이블링을 통해 얻어진 요소들에 대해 각각의 중심점을 찾는다. 중심점이 갖는 특징은 글자 사이의 공백과 단어 사이의 공백을 이용한 방법보다 공백의 발생을 빈번하게 하는 특징을 가지고 있다.
중심점 사이의 거리를 계산하여 평균-결합 클러스터링을 이용하여 2개의 클러스터로 분류한다. 이 방법은 문서의 내용에 관계없이 다양한 간격 정보를 분류하기 위해 계층적 클러스터링(hierarchical clustering) 알고리즘에서 널리 쓰이는 방법이다. 이 방법은 각각의 텍스트 줄에 따라 가변적으로 적용되는 방법으로 단어 단위 분류를 위해서는 2개의 클러스터가 남게 되면 종료하게 되는 알고리즘을 가지고 있다.
참고문헌
○ 곽희규(2001), 문서 영상의 단어 단위 분할 및 단어 영상의 속성 추출에 관한 연구, 전남대학교
○ 김인중(2007), 화질 분석을 통한 카메라 문서 영상의 적응적 이진화, 한국정보과학회
○ 오일석, 김수형, 유태웅, 곽희규(2002), 문서 영상 처리 기술과디지털 라이브러리, 정보과학회지
○ 정규식, 권희웅(1999), 내용기반의 인쇄체 영문 문서 영상 검색을 위한 특징기반 단어 검색, 정보과학회논문지
○ 추현곤 외 1명(2005), 이진 문서 영상을 위한 특징 기반 텍스트 워터마킹, 한국정보처리학회
○ 최윤성 외 1명(2002), 한글 문서 영상의 단어 검색 시스템, 한국정보과학회
  • 가격6,500
  • 페이지수7페이지
  • 등록일2013.07.18
  • 저작시기2021.3
  • 파일형식한글(hwp)
  • 자료번호#861913
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니