인터넷 정보검색시스템과 정보검색, 인터넷 정보검색시스템과 검색수법, 인터넷 정보검색시스템과 CD-ROM(씨디롬), 인터넷 정보검색시스템과 TREC(세계검색컨퍼런스), 인터넷 정보검색시스템과 PRC 분석

본 자료는 4페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.

해당 자료는 4페이지 까지만 미리보기를 제공합니다.
4페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

인터넷 정보검색시스템과 정보검색, 인터넷 정보검색시스템과 검색수법, 인터넷 정보검색시스템과 CD-ROM(씨디롬), 인터넷 정보검색시스템과 TREC(세계검색컨퍼런스), 인터넷 정보검색시스템과 PRC 분석에 대한 보고서 자료입니다.

Ⅰ. 개요

Ⅱ. 인터넷 정보검색시스템과 정보검색
1. 색인 구조 및 과정
2. 질의어 유형 및 데이터 검색 과정
1) 질의어 유형
2) 데이터 검색 과정

Ⅲ. 인터넷 정보검색시스템과 검색수법

Ⅳ. 인터넷 정보검색시스템과 CD-ROM(씨디롬)
1. CD-ROM 데이터베이스 현황
2. CD-ROM 데이터베이스 전망
1) 정보저장매체로서 보편성을 확보
2) CD-ROM 데이터베이스를 운용하는 주변기기의 표준화에도 중요한 영향
3. 대량복제가 용이하여 저렴한 가격으로 도서관, 기관 및 개인에게 배포가 가능
4. CD-ROM 데이터베이스와 서버 데이터베이스는 상호 보완의 형태로 발전

Ⅴ. 인터넷 정보검색시스템과 TREC(세계검색컨퍼런스)
1. TREC의 문서집합
2. TREC의 질의설계
3. TREC의 적합문서 리스트의 생성

Ⅵ. 인터넷 정보검색시스템과 PRC
1. 서브시스템의 기능
1) 입력
2) 출력
3) 기능
2. 트레이스의 계산
3. 동치집합(equivalence set)의 생성
4. PRC의 판별

참고문헌

본문내용

과적인 방법으로 알려져 있다. British Library(BL)에서도 풀링방법을 사용하여 다양한 정보검색시스템에서 높은 순위를 부여받은 각각의 상위 200개의 문서들을 추출하여 적합성 판단에 이용한 결과 상당한 효과를 얻은 것으로 알려져 있다(Spark, 1979).
풀링방법을 적용하기 위해서는 다수의 정보검색시스템이 요구된다. 참고로 가장 최근에 발표된 TREC-7(1998)에서는 다양한 정보검색 결과를 생성하기 위하여 Carnegie Mellon Univ., Lexis-Nexis, Okapi, TwentyOne 등 54개의 정보검색시스템을 사용하였다.
TREC에서 사용한 샘플링 방법은 다양한 정보검색시스템에서 각각 주어진 질의에 대하여 높은 순위를 부여받은 100개의 문서를 추출하여 평가대상으로 하였다. 이 샘플링 방법은 모든 시스템들은 순위가 부여된 정보검색 방법을 사용하기 때문에 당연히 추출된 문서들은 적합성이 높은 것으로 인정할 수 있다는 점에서 근거가 있다고 할 수 있다.
Ⅵ. 인터넷 정보검색시스템과 PRC
1. 서브시스템의 기능
1) 입력
질의트리, IC 집합
2) 출력
트레이스 테이블, 동치 집합, PRC의 집합
3) 기능
질의트리에서 트레이스 테이블과 동치집합을 구성
트레이스 테이블과 IC 집합으로부터 PRC집합을 생성
2. 트레이스의 계산
AND 트레이스와 OR 트레이스는 트리의 특성상 트리의 각 노드들을 한 번만 방문함으로써 쉽게 구할 수 있다. 레이블이 노드에 저장되어 있기 때문에 부모노드의 유형, AND 트레이스와 OR 트레이스를 자식노드에게 넘겨주는 재귀적 호출을 통해서 트레이스 테이블을 만들 수 있다. 그러면 호출 당한 노드는 부모노드의 유형에 따라 AND 트레이스와 OR 트레이스를 갱신하고 현재노드의 유형에 따라 다시 재귀적으로 호출을 하거나 트레이스 테이블의 엔트리를 하나 만든다.
구체적인 트레이스 계산 알고리즘이 아래에 나타나 있다.
switch(부모노드 유형) {
case AND : strcat(AND 트레이스, 현재노드의 레이블);
break;
case OR : strcat(OR 트레이스, 현재노드의 레이블);
break;
나머지 : break;
}
switch(현재노드->유형) {
case AND 또는 OR:
현재노드의 모든 자식노드 Ci 에 대해
트레이스_계산(현재노드 유형, Ci, AND 트레이스,OR 트레이스);
return;
case 데이타베이스 술어 :
트레이스_테이블(현재노드 술어, 현재노드, AND 트레이스, OR 트레이스);
return;
case COMP:
동치_집합(현재노드,OR 트레이스);
return;
}
위의 의사코드에서 트레이스_테이블()은 트레이스 테이블의 엔트리를 하나 만드는 함수이다. 동치_집합()은 현재노드와 현재노드의 범위인 OR 트레이스를 이용해서 동치 집합(equivalence set)을 갱신하는 함수이다.
3. 동치집합(equivalence set)의 생성
동치집합이란 계산가능 술어를 평가하기 위해 도입된 개념으로 EQ(\"=\")로 관계지어진 상수 또는 변수들을 원소로 하는 집합이다. 질의에 계산가능 술어, 특히 EQ가 여러 번 나올 때, EQ의 인자가 되는 상수나 변수들을 분류할 필요가 생긴다. EQ도 고유의 범위를 가지므로 상수나 변수가 이름이 같더라도 범위가 다르면 서로 다른 변수로 취급한다. 다시 말하면 EQ 관계를 가지는 상수나 변수들은 이름과 범위가 동일해야 같은 변수로 본다. 이와 같이 범위가 있는 특수한 집합을 동치집합이라 한다. 동치집합은 최대 하나의 상수와 일련의 변수들로 구성되고 범위에 의해 특징지어진다.
질의트리를 탐색할 때, 현재노드가 계산가능 술어를 나타내면 현재노드의 범위 즉, OR 트레이스를 범위로 하는 동치집합이 있는지 검색하고 있으면 그 동치집합에 현재노드의 인자들을 첨가하고, 그러한 동치집합이 없으면 새로운 동치집합을 하나 생성한다. 이 동치집합은 세 번째 서브시스템에서 계산가능 술어들을 평가할 때 이용된다.
예를 들어, 다음의 질의 Q에 해당하는 트레이스 테이블과 동치집합은 다음과 같이 만들어진다.
Q : (D(X,W1)∧E(X,W1))∨(F(V1,a)∧G(V1,a))∧W1=X
같은 이름을 가진 술어가 질의에 여러 번 나타나는 것을 처리하기 위해 트레이스 테이블에 질의트리의 노드에 대한 포인터를 저장하는 것이 필요하다.
예를 들어, 다음과 같은 질의와 IC를 가정하자.
Q: (A∧B)∨(C∧A∧(B∨D))
IC: H2 ← A,B
질의 Q에서 A와 B는 각각 두 번씩 나타난다. 또한 IC역시 Q의 두 부분에서 PRC로 판명된다(밑줄 부분 참조). 따라서 중복되는 술어를 구분하기 위해 노드포인터가 필요하다.
4. PRC의 판별
질의 트리와 트레이스 테이블이 완성되면 각 IC에 대해 PRC인지의 여부를 판정할 수 있다.
여기에는 모든 IC에 대해 일일이 위의 검사를 수행하는 방법과 IC 인덱스를 이용해서 하는 방법이 있다.
첫째 방법을 따르면 연결리스트로 구성된 IC를 하나 가져온 후 각 IC의 몸체에 있는 데이타베이스 술어의 모든 쌍이 완전죠인쌍 혹은 반완전죠인쌍인지 트레이스 테이블을 조사하여 알아본다. 이 방법은 간단하기는 하나 전체 IC의 개수에 비해 주어진 질의에 관련된 IC가 적은 경우에도 모든 IC에 대해 PRC인지 검사를 수행하게 된다.
두 번째 방법은 IC의 몸체에 나타난 데이타베이스 술어에 대한 인덱싱을 미리 구성하여 질의가 들어왔을 때 검색할 IC의 범위를 좁혀 가는 방법이다
참고문헌
김광영 외 1명(2011) 주제분류 기반의 개인화 검색시스템에 관한 연구, 한국문헌정보학회
김재훈 외 1명(2011), 문서 확장을 이용한 표제어 검색시스템, 한국과학기술정보연구원
김신일 외 2명(2011), 한글화된 수식 패턴을 이용한 수학식 검색 시스템, 한국정보과학회
남영준 외 1명(2010), 강의자원 검색시스템에 관한 연구, 한국비블리아학회
이혜원 외 1명(2011), 매쉬업을 적용한 기관 내 정보검색시스템 통합 방안 연구, 한국과학기술정보연구원
윤홍준 외 6명(2011), 개념 네트워크 기반 사용자 인지형 웹 검색 시스템, 한국인터넷정보학회

키워드

인터넷 정보검색시스템, 정보검색시스템, 정보검색, CD-ROM, TREC, PRC , 데이터베이스, 색인 구조

소개글

목차

본문내용

키워드

추천자료