인터넷정보검색과 WWW(월드와이드웹), 인터넷정보검색과 검색엔진, 인터넷정보검색과 TREC(세계검색컨퍼런스), 인터넷정보검색과 인덱싱, 인터넷정보검색과 정보봉사, 인터넷정보검색과 색인언어 분석
본 자료는 4페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
해당 자료는 4페이지 까지만 미리보기를 제공합니다.
4페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

인터넷정보검색과 WWW(월드와이드웹), 인터넷정보검색과 검색엔진, 인터넷정보검색과 TREC(세계검색컨퍼런스), 인터넷정보검색과 인덱싱, 인터넷정보검색과 정보봉사, 인터넷정보검색과 색인언어 분석에 대한 보고서 자료입니다.

목차

Ⅰ. 개요
1. 데이터베이스 생성과 구조
2. 탐색기능
3. 이용자의 노력

Ⅱ. 인터넷정보검색과 WWW(월드와이드웹)
1. Bates의 전술과의 비교
2. WWW에 있어서의 검색전술

Ⅲ. 인터넷정보검색과 검색엔진
1. 검색엔진의 정의
2. 주요 검색엔진의 특징
1) 디렉토리 유형의 종류
2) 로봇유형의 종류

Ⅳ. 인터넷정보검색과 TREC(세계검색컨퍼런스)
1. 루팅(routing)
2. TREC은 매년 회의의 마지막 부문에는 TREC의 미래에 대한 토론의 장을 마련

Ⅴ. 인터넷정보검색과 인덱싱
1. 단일 술어 인덱싱(single predicate indexing)
2. 이중 술어 인덱싱(double predicate indexing)

Ⅵ. 인터넷정보검색과 정보봉사
1. 즉답형 질문
2. 연구형 질문

Ⅶ. 인터넷정보검색과 색인언어
1. 색인언어와 탐색언어가 모두 통제언어인 시스템
1) 장점
2) 단점
2. 색인언어는 통제언어, 탐색언어는 자연언어인 시스템
1) 장점
2) 단점
3. 색인언어와 탐색언어가 모두 자연언어인 시스템
1) 단점
2) 해결방법
4. 색인언어는 자연언어, 탐색언어는 통제언어인 시스템
5. 색인언어와 탐색언어에 통제언어와 자연언어를 모두 사용하는 시스템
1) DIALOG
2) MEDLINE

참고문헌

본문내용

. 해쉬를 이용한 인덱싱을 그림으로 표현하면 다음과 같다.
술어를 세 개 이상 인덱싱 하는 경우를 생각해보자. IC의 몸체에 데이터베이스 술어가 하나 나타나는 것은 하나만 인덱스 엔트리를 만들고, 두 개 나타나는 것은 두 개의 술어이름을 접합시켜 만들고, 세 개가 나타나면 세 개를 모두 접합시켜 인덱스 엔트리를 만들 수도 있다. 이렇게 하면 인덱스 엔트리의 개수가 줄어든다. 정확히는 인덱스 엔트리의 개수와 IC의 개수가 같아진다. 그러나 본 시스템이 기반한 방법의 특성상 세 개 이상의 술어를 접합시켜 인덱스를 만드는 것은 불필요하다. 왜냐 하면 현재 기반이 되는 방법이 완전죠인쌍과 반완전죠인쌍을 찾는 것으로 출발한다. 다시 말하면 트레이스 테이블에서 어느 두 개도 서로 완전죠인쌍 또는 반완전죠인쌍인 세 개 이상의 트레이스를 찾아내는 일은 매우 어려운 일이다. 이는 트레이스 테이블에 대한 검색을 기하급수적으로 많이 해야 하는 문제를 야기한다. 더구나 몸체에 세 개 이상의 릴레이션이 죠인으로 나타나는 경우는 상대적으로 드물다.
결국 IC를 인덱싱 하는 것은 각각의 IC에 대해 모두 PRC인지 여부를 검사하는 비용과 트레이스 테이블에서 완전죠인쌍 혹은 반완전죠인쌍을 찾아내는 비용의 트레이드-오프(trade-off)이다. 그러나 일반적으로 트레이스 테이블의 엔트리 수가 IC의 개수보다 작으며 IC 인덱싱은 시스템 초기화 시에 한 번만 해두면 되므로 인덱싱을 사용하는 것이 효과적이라고 할 수 있다.
Ⅵ. 인터넷정보검색과 정보봉사
웹 상에는 현재 단순한 정보에서부터 통계, 서지, 진행 중인 연구정보, 연구자 주소와 같이 정보원으로서 가치 있는 정보에서 그렇지 못한 자료까지 다양한 정보를 포함하고 있다. 웹 정보원의 유형은 학술형 정보, 비즈니스형/사업용 정보, 기관 정보, 개인형 정보, 뉴스형 정보 등으로 구분될 수 있다.
이용자의 정보질문을 크게 2가지로 즉답형 질문과 연구형 질문으로 나누고 검색엔진을 활용한 정보서비스 측면을 살펴보고자 한다.
1. 즉답형 질문
간단하고 사실적인 정보질문에 해당하며 검색엔진을 이용하여 편리하고 빠르게 정보에 접근할 수 있다.
2. 연구형 질문
대학도서관이나 전문도서관의 교수, 대학원생, 연구자들은 그들의 관심있는 연구주제에 관련된 망라적인 정보원을 찾기를 희망한다. 웹 정보원은 학술적인 정보원을 찾고자 하는 이용자들에게는 크게 만족시켜주지 못하는 부분이 지적되기도 하지만, 이전에 인쇄물로된 자료로 구하기 어려운 자료들인 회색문헌 등은 오히려 검색엔진을 활용하여 수월하게 접근할 수 있다. 연구자들은 각종 보고서, conference proceedings, 번역자료, pre-print, 통계자료, working papers들에 대한 높은 관심을 보이고 있다. 특히 working paper와 pre-print는 공개된 논문보다 더 현재의 연구주제를 잘 표현하고 더 자세한 사항을 포함할 수 있기에 연구자들에게 중요한 정보원으로 여겨진다.
Ⅶ. 인터넷정보검색과 색인언어
1. 색인언어와 탐색언어가 모두 통제언어인 시스템
열거식분류표, 주제명표목표, 시소러스 등을 사용하여 용어를 통제하여 주는 사전 통제어휘시스템
1) 장점
특정한 개념은 언제나 동일한 용어로 색인되므로 검색효율의 재현율이 높다.
용어간의 다양한 어의적 관계를 이용하여 관련있는 용어로 추가탐색이 가능하므로 탐색범위를 확장할 수 있다.
2) 단점
용어의 특정성이 떨어져 주제의 구체적인 표현이 어렵다.
검색시스템의 정보전문가에게는 적합하지만 최종이용자에게는 불편
통제어휘집의 계속적인 갱신이 필요하다.
2. 색인언어는 통제언어, 탐색언어는 자연언어인 시스템
탐색자는 어떤 용어든지 사용할 수 있으나, 자연언어 형태의 탐색어를 시스템내에서 통제언어로 자동변환시켜주는 장치가 필요하다. 예)MEDLINE 시스템
1) 장점
탐색자가 통제어휘에 익숙할 필요없이 자연언어를 사용할 수 있다.
2) 단점
자연언어 형태의 탐색어들을 컴퓨터에 온라인으로 소장시키는데 따르는 어려움
동형이의어나 다의어로 인한 정확한 탐색의 어려움
완벽한 자동변환을 기대하기 어려움
3. 색인언어와 탐색언어가 모두 자연언어인 시스템
이용자의 편의라는 측면에서 미래의 점보검색시스템의 전형적 특징이 될 것이다.
1) 단점
문헌의 주제와는 별로 관련이 없는 용어를 탐색어로 사용하게 되어 검색효율의 정도율이 저하된다.
2) 해결방법
인접어탐색기법, 주제어로서의 중요도를 측정하는 여러가지 기준을 사용
용어를 통제하지 않음으로써 야기되는 재현율의 저하는 용어절단기법 사용
→ 정도율이 떨어지는 경우가 발생 → 어미변화에서의 글자수 제한기법이나 부적합한 단어를 제외시키는 ignore기법을 사용
4. 색인언어는 자연언어, 탐색언어는 통제언어인 시스템
검색시 동의어 사전과 유사한 탐색용 시소러스 등을 사용하여 검색효율을 높이기 위해 탐색어의 대략적인 통제만을 해 주는 사후통제어휘 시스템
자연언어시스템의 장점에 전통적인 통제언어시스템의 장점을 추가시킨 시스템
5. 색인언어와 탐색언어에 통제언어와 자연언어를 모두 사용하는 시스템
현재 운영되고 있는 대규모 정보검색시스템은 대부분 통제언어와 자연언어를 함께 사용
1) DIALOG
통제언어 색인어로 디스크립터를 사용하며, 표제나 초록에서 나타난 용어는 9개의 불용어를 제외하고는 자연언어를 탐색어로 사용
2) MEDLINE
통제어휘집인 MeSH에 나오는 주제명을 탐색어로 사용하며, 표제나 초록에 나타난 자연언어 형태의 용어로도 탐색
참고문헌
○ 박정수 외 3명(1999), 월드 와이드 웹 보안 기술, 한국전자통신연구원
○ 송영인 외 3명(2004), 생물학 도메인에서의 정보검색 : TREC의 Genomics Track을 중심으로, 한국정보과학회
○ 송언경(2004), 디지털 도서관에서의 정보봉사와 사서의 역할론, 신라대학교
○ 사공철(1990), 정보검색시스팀에 있어서 색인언어에 관한 연구, 숙명여자대학교
○ 이희석 외 4명(2009), 자동 인덱싱 비디오 검색 시스템에 관한 연구, 한국멀티미디어학회
○ 최범기 외 4명(2006), 동적분류에 의한 주제별 웹 검색엔진의 설계 및 구현, 한국인터넷정보학회
  • 가격7,500
  • 페이지수14페이지
  • 등록일2013.07.13
  • 저작시기2021.3
  • 파일형식한글(hwp)
  • 자료번호#858512
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니