인터넷 정보검색

전응휘
서울 강남구 역삼동 718-25 경원빌딩 4층
장미디어 인터렉티브
E-mail : ehchun@polo.jmi.co.kr
Abstract:
인터넷이 초창기부터 갖고 있던 정보제공의 임의성이라는 특징때문에 인터넷에서는 정보검색이 근본적으로 어렵다. 인터넷에서 정보검색을 효과적으로 진행하기 위해서는 검색엔진의 특성에 대해서도 이해해야 하지만 인터넷이 제공하는 정보 들의 유형별 분석을 통해 별도의 접근방식을 활용해야 하며, 특히 커뮤니케이션 채널로서의 인터넷의 특성을 감안, 사람을 활용하여 정보를 수집하는 방법을 병행해야 한다. 보다 본격적인 정보검색은 상용데이타베이스를 활용하여야 하며, 이 경우 인터넷에서의 정보검색은 예비검색으로서의 성격을 갖게 된다.
Keywords:
information search, database, search engine
목차
  1. 인터넷 정보검색의 근본문제
  2. 참된 인터넷 정보마인드란?
  3. 인터넷이 제공하는 정보 서비스 유형별 검색방법
  4. 웹검색엔진의 종류별 유형 및 검색방법
  5. 사람을 이용하는 정보검색방법
  6. 기타 인터넷 정보검색 방법
  7. 참고자료

1. 인터넷 정보검색의 근본문제

인터넷 정보검색의 근본문제는 인터넷이라는 Global Network에 이를 전체적으로 관할, 통제하는 권위있는 기관이 존재하지 않는다는 사실에서부터 출발한다. 인터넷은 주인이 없으며, 어떤 의미에서 모든 호스트 사이트들이 주인이기도 하다. 따라서 인터넷 상에서 정보를 제공하는 정보제공자가 정보제공의 여부나 그 내용을 신고하거나 등록해야 할 의무도 없으며 그같은 업무를 수행, 관장하는 권위있는 기관도 존재하지 않는다. 인터넷 운영상의 이같은 자의성, 혹은 자발성은 한편으로는 이 네트워크의 큰 장점이기도 하지만 정보검색이라는 측면에서 보면 인터넷 정보찾기의 어려움을 낳는 근본원인이기도 하다. 따라서 인터넷상에서 제공되는 정보들은 어떤 의미에서 무정부상태로 존재하고 있다고 할 수 있다. 정보의 질적, 양적 측면에서 인터넷 정보들은 상당한 편차와 다양성을 내포한다. 인터넷에서 실제로 필요한 정보를 찾고자 할 때 부딪치는 최대의 난제는 찾고자 하는 정보가 인터넷상에 존재하는지 여부를 최종적으로 결론지을 방법도 없으며, 정보를 찾았다 하더라도 그 정보가 인터넷 상에 존재할 수 있는 관련 정보 중에서 가장 질적으로나 양적으로 우수한 정보인지를 판단하는 것이 근본적으로 불가능하다는 데에 있다.

  1. 정보제공자(IP)의 임의성
    - 정보제공자의 꾸준한 증가
    - 자의에 따른 정보제공/중단
    - URL의 잦은 변동

  2. 정보의 존재방식
    - 너무 많은 정보
    - 종류에 따라 존재하지 않는 정보
    - 무질서하게 존재하는 정보
    - 끊임없이 변화하는 정보

  3. 정보의 질적 측면
    - 정보제공자에 관한 포괄적 목록 부재
    - 정보간의 질적 편차가 현저함
    - 망라하는 주제범위가 고르지 못함

2. 참된 인터넷 정보마인드란?

1) 인터넷은 정보의 창고라기 보다는 커뮤니케이션 채널이다
네트워크는 자원공유라는 기능과 함께 커뮤니케이션이라는 기능을 동시에 가진다. 흔히 인터넷에서 정보를 찾으려는 사람들은 전자의 기능에만 주목하지만 인터넷은 현실적으로 자원공유라는 기능보다도 커뮤니케이션 기능에 있어 훨씬 우수하다. 이 문제는 사실 네트워크 자체의 문제보다도 네트워크 외부의 문제에서 비롯된다. 즉, 자원공유는 기본적으로 국가별 공공정보의 공개범위와 수준의 문제, 지적재산권의 문제, 데이터베이스 발달 정도의 수준 등의 요인에 더 큰 영향을 받는데 반하여 최소한 인터넷을 이용하는 이용자간의 상호 커뮤니케이션은 거의 무한정으로 자유롭기 때문이다.

2) 인터넷에서의 정보검색은 정보자체 보다도 정보원의 소재를 파악하는 것이 더 중요하다.
광활한 인터넷이라는 대해(大海)속에서 필요한 정보를 찾으려면 직접적으로 필요로 하는 정보 자체보다도 정보가 소재해 있을 것으로 추정되는 정보소스의 위치탐색에 더 주목해야 한다. 정보소스의 위치를 쉽게 찾기 위해서는 찾고자 하는 정보에 대한 방계적인 지식이 요구되며, 경우에 따라서는 해당분야에서 일하는 사람들의 도움을 받아야 한다.

3) 전문서비스보다는 목록정보, 메일링리스트 아카이브 등을 더 효율적으로 활용하는 것이 좋다.
우리나라에서 정보를 찾고자 하는 이들은 대개 전문(Full-text)정보만을 가치있는 정보로 평가하는 경향이 있다. 그러나 상용데이타베이스의 경우만 하더라도 전문을 서비스하는 정보는 그리 많지 않으며 있는 경우라 하더라도 경비가 적지않게 소요된다. 또한 서구의 경우에는 전문정보의 경우에는 이미 정리되어 공개된 정보에 속한다는 이유에서 다른 여타 정보보다도 가치를 낮게 평가하는 경우가 많다. 따라서 전문정보 뿐 아니라 요약정보, 현재 찾고자 하는 주제와 관련된 사람들의 의견, 피드백 등을 알 수 있는 메일, 메일링 리스트 아카이브 등도 중요하게 취급되며 이같은 정보들이 훨씬 가치있는 정보로 간주되는 경향이 있다.

4) 인터넷 정보검색은 상용 데이터베이스 활용과 병행되어야 한다.
인터넷에서만 찾을 수 있는 정보도 없는 것은 아니나 인터넷에서의 정보검색은 상용 데이터베이스의 경우와 비교하여 검색가능여부에 대한 판단이 쉽지 않고, 정보소스가 산재해 있으며, 정보제공자에 따라 제공되는 정보의 유형이 다양하다는 약점이 있다. 따라서 본격적인 정보검색을 위해서는 인터넷에서의 정보검색은 상용 데이터베이스에서의 정보검색과 병행되는 것이 바람직 하다. 상용데이타베이스의 경우에는 이용료가 비싸다는 문제가 있으나 인터넷을 통해서 예비검색을 거친 후 이용할 경우, 검색시간을 단축시킬 수 있고, 일반 상용데이타베이스의 경우에도 인터넷의 TCP/IP 프로토콜을 이용한 억세스가 가능한 경우가 많으므로 이를 이용하면 상용데이타베이스 이용에 소요되는 경비를 크게 줄일 수 있다.

3. 인터넷이 제공하는 정보서비스 유형별 정보검색방법

인터넷에서 제공되는 정보들은 정보제공자들에 따라 다양한 형태로 정보가 서비스되고 있다. 따라서 제공서비스의 유형에 따라 정보검색 접근방법을 달리 해야 효과적으로 필요로 하는 정보를 검색할 수 있다. 일반적인 Web Document의 경우에는 keyword 검색엔진을 이용하여 대부분 검색할 수 있으나 다른 유형의 정보서비스의 경우에는 1차적으로 정보소스를 찾은 후에 해당 서비스를 제공하는 사이트에서 검색하는 두단계의 검색방법을 이용해야 한다.

4. 웹 검색엔진의 종류별 유형

일반적으로 알려진 웹 검색엔진들은 크게 보아 Net Directory 유형과 Net Search 유형의 두가지 형태로 구분된다. 넷스케이프 브라우저는 2.x 버전까지는 서비스버튼에서 이 두가지 유형을 구분했었으나 3.x 버전부터는 구분하지 않고 있다. 그러나 인터넷에서 정보검색을 하려면 이 두가지 유형의 검색엔진의 특성을 잘 구분하여 활용하여야 한다.

1) Net Directory Search Engine (Web Index) : 일반 사용자들이 북마킹을 하듯이 인터넷에서 제공되는 정보들을 주제별로 분류하여 사람이 간략한 설명을 달아놓는 방식으로 정보소스를 찾을 수 있게 해 주는 검색서비스. 필요한 주제별로 정보를 제공하는 사이트의 URL을 찾는데 주로 이용한다. 인터넷에서 정보제공자가 증가할수록 검색엔진의 숫자도 늘고 있으며 점차로 각 주제별로 전문화하는 경향이 있다.
예) Yahoo, Argus Clearing House, WWW Virtual Library, AT&T Business Directory, Wall Street Directory

2) Net Search Engine (Keyword Search Engine) : 검색로봇이라는 소프트웨어가 일반 웹사이트를 서핑하면서 자체의 자료수집 알고리즘에 따라 웹문서를 인덱싱하여 검색어 처리방식에 따라 해당 키워드를 내포하고 있는 웹문서의 URL을 찾아주는 검색서비스. 인덱싱 데이터의 양이나 처리속도 등에 따라 검색엔진간에 많은 차이가 있으며, 검색옵션기능도 검색엔진간에 많은 차이가 있어 검색결과도 다양한 형태로 나타난다. 인터넷상에 존재하는 정보의 소재를 정교하게 검색할 때에 이용되며 검색시 부여하는 키워드를 내포하는 웹문서(Web Document)를 찾는데 이용된다.
예) Lycos, Alta Vista, HOTBOT, Infoseek, Excite, Opentext

3) Meta Search Engine : 위에서 소개한 두가지 유형의 검색엔진을 각각의 검색엔진 사이트를 찾아가지 않더라도 하나의 인터페이스에서 이용할 수 있게 하는 서비스. 몇몇 검색엔진은 동일한 키워드로 동시에 여러개의 검색엔진에 검색을 의뢰하여 병행검색을 할 수 있게 하는 기능을 갖고 있다. 키워드 부여시 특별옵션의 선택이 제한되므로 일반적인 검색에서는 잘 활용되지 않는다.
예) Savvy Search, MetaCrawler, All 4 One, Eureka!, The Internet Sleuth

5. 사람을 이용하는 정보검색 방법

웹검색엔진을 이용한 검색결과는 결국 인터넷 웹서비스상의 정보검색으로 검색범위가 한정된다. 그러나 웹서비스는 정보제공의 일방성, 홍보목적 위주의 정보, 일반적인 공개정보, HTML문서의 작성에 소요되는 시간상의 이유로 업데이트 속도가 늦다는 등의 약점을 갖는다. 따라서 실제로 요구되는 정보를 검색할 경우에는 웹검색과 병행하여 검색주제에 대한 정보를 제공할 가능성이 있는 사람을 인터넷상에서 찾아내어 그 사람과 의사소통을 통해서 정보를 얻는 과정이 필요하다. 이 경우에 접촉해야 할 사람들의 인터넷 전자우편주소를 먼저 찾아야 하는데 이것은 인터넷 정보서비스의 유형중에서 USENET Newsgroup과 Mailing List쪽을 검색함으로써 가능하다.

1) USENET Newsgroup의 활용
USENET Newsgroup을 검색할 경우에는 검색주제와 관련된 Newsgroup title검색을 하는 경우와 키워드로 Newsgroup에 올린 편지본문을 검색하는 두가지 경우로 나뉘어지며 특히 후자의 경우에는 적합한 사람을 찾아내었을 때 해당 인물의 다른 메일들을 함께 검색함으로써 해당 인물에 대한 보다 세부적인 정보를 얻을 수 있다.
예) DejaNews, Reference.Com, Alta Vista, USENET Info Center, Tile.Net, Liszt

2) Mailing List Archive의 활용
USENET Newsgroup의 경우 정보서비스가 개방되어 있는데 반하여 Mailing List는 가입절차를 거쳐야 하는 폐쇄이용자그룹에게만 정보서비스가 허용되므로 검색과정은 USENET Newsgroup보다는 조금 어렵지만 획득할 수 있는 정보의 질은 보다 전문적일 수 있는 장점이 있다. 주제별로 적합한 메일링리스트는 메일링리스트 title검색을 할 수 있는 검색엔진을 이용해서 검색한다.
예) Listserv, Directory of E Conferences, Mailbase

6. 기타 인터넷 정보검색 방법

1) Public Database의 검색
인터넷 상에는 유용한 Database들이 무료로 서비스되는 경우들도 상당히 많다. 이들 DB들을 이용해서 검색되는 검색결과는 일반 웹검색엔진으로는 검색할 수 없기 때문에 특정 주제와 관련된 정보를 찾으려면 이같은 Database Source들이 존재하는 사이트들에 대한 정보를 사전에 갖고 있어야 한다.
예) Washington Post, PR Newswire, Edgar Database, ERIC Database, Medline Database, GPO Access

2) Library Catalogue의 검색
문헌정보를 검색할 경우에는 특별히 Library Catalogue를 이용하여 검색하여야 한다. Library Catalogue는 검색결과로 확인된 문헌을 직접 온라인상에서 볼 수 없다는 제한점이 있으나 문헌에 대한 기본적인 정보를 얻은 후에는 상용 온라인 Delivery 서비스를 이용하여 문헌을 입수할 수 있으므로 온라인을 통한 이용이 가능하다.
예) CarlWeb, ZWeb, Library of Congress Catalogue

3) Drectory Service의 활용
인터넷의 전통적인 정보제공 유형중의 하나는 Directory(목록정보) 서비스이다. 이 서비스는 단순히 Contact Point를 파악하는 데 필요한 정보만을 제공하지만 Contact Point 자체가 정보소스라고 볼 수 있으므로 실제로는 대단히 중요한 정보원이라고 할 수 있다. Directory 서비스는 정보검색의 주제별로 다양하게 존재하지만 그 숫자가 아주 많지는 않으므로 적절하게만 이용하면 실무적으로 필요한 Contact Point를 가장 빠른 시간내에 얻을 수 있다.
예) Internet Business Directory International, World Wide Yellow Pages, NYNEX, BigBook

4) 유료 정보서비스 이용
전통적으로 널리 알려진 상용데이타베이스들도 최근에는 Internet Gateway를 통해서 정보서비스를 하는 경향이 늘어나고 있다. 이들 데이터베이스의 경우에는 예외없이 유료서비스 형식으로 서비스가 되므로 추가비용이 들지만 검색목적에 부합하는 DB를 적절하게 선택만 하면 가장 경제적으로 검색할 수 있다는 장점이 있다.
예) Online, Electric Library, NewsPage, UMI, CARL Web

7. 참고자료