시소러스의 필요성
한국데이터베이스진흥센터 - 시소러스 개발 지침 참조
표준 시소러스의 필요성
모든 문헌의 검색은 검색어를 사용해야 하며, 그 검색어는 색인어와 일관성을 가 져야 한다. 시소러스는, 색인 시에는 색인어의 선정에, 검색 시에는 검색어와 색인어 간의 관계를 연결해 주는 역할을 한다. 한국어 자료의 색인과 검색을 위한 시소러스 의 개발이 부진한 큰 이유는 한글 시소러스의 개발 기준이 없기 때문이다.
그러므로 시소러스 개발을 위한 기준이 마련되면 국내의 정보처리 기관에서 효율 적인 정보의 처리와 관리가 이루어질 수 있을 것이다.
기술적 측면
시소러스는 수많은 인간 지식에 대한 저장소이며, 이것을 편찬하는 것은 논리적 이며 잘 정의된 원칙을 기반으로 해야한다. 그러나 현재 국내에는 한글 시소러스를 구축하는데 참고로 사용할 시소러스 구축 지침이 마련되어 있지 않으며, 국제 표준 으로 사용되고 있는 ISO 2788을 준용해서 사용하고 있는 실정이다. 그러나 ISO 2788은 영어권 시소러스 구축에 초점을 맞추고 있기 때문에 한글 시소러스를 구축하 는데 참고자료로 이용하기에는 불편한 점이 많다.
이러한 이유 이외에도 국제 표준으로 사용되고 있는 ISO 2788은 용어관계를 너 무 단순히 표현하고 새로운 정보환경에 대응하기 어렵다. 특히 이것은 영어를 중심 으로 만들어졌기 때문에 한글 시소러스 구축을 위해 사용하기에는 맞지 않는 부분이 많이 있다. 또 이 지침은 인쇄형 시소러스에서 시소러스를 구축하는 기준에 초점을 맞추고 있기 때문에 현재의 정보검색 환경에서는 많은 부분이 적합하지 않다고 할 수 있다.
그러므로 온라인 검색환경으로 변화하는 정보환경에 맞는 한글 시소러스를 구축 하기 위해서는 ISO 2788에서 사용하고 있는 기존의 용어관계를 보다 확장시킨 용어 관계를 사용할 필요가 있으며, 한글의 특성을 반영한 새로운 규칙의 제정이 필요하 다. 다시 말해 표준 지침이란 그것을 이용함으로써 이익이 되고, 시소러스간 구조적 인 호환성을 지키는 데 도움을 줄 수 있다.
경제 산업적 측면
시소러스를 만드는 작업은 많은 노동집약적 업무이며, 계속적으로 갱신해야하는 반복적인 작업으로 시간과 노력, 그리고 비용이 소요되는 작업이다. 그러므로 시소러 스를 구축하기 위해서는 표준화되고 잘 정의된 된 지침이 필요하다.
명확히 정의된 시소러스 구축 지침이 마련된다면 지금까지 국내에서 시소러스 개 발을 위해 각 개별기관이 수행하던 개별규칙을 통합하는 결과를 가져오게 되므로 보 다 쉽게 시소러스를 구축할 수 있게 되어 보다 많은 정보처리 기관에서 시소러스를 구축하게 될 것이다. 그러므로 시소러스 사용에 따른 검색 효율의 향상을 가져올 수 있게 될 것이다. 그러므로 유형, 무형의 막대한 경제적 이점을 가져올 수 있게될 것 이다.
사회 문화적 측면
최근에 이르러 정보기술의 혁신은 시소러스의 기능에도 많은 변화를 가져왔다. 초기의 시소러스는 수작업 서지 데이터베이스에서 사용되었다면, 현재는 全文데이 터베이스가 주축을 이루는 환경으로 변화되었다. 全文데이터베이스시스템은 자연언 어처리를 기본으로 하기 때문에 수작업 색인에서 사용하던 전통적인 시소러스로는 대응할 수 없는 부분이 많다.
특히 한글은 어근(語根)을 중심으로 어미를 덧붙여서 단어를 만드는 첨가어이다. 한글은 용어활용이 다양하고 띄어쓰기가 자유롭다는 특성이 있다. 또한 외래어 표기 원칙이 마련되어 있으나 잘 지켜지지 않는 경우가 많다. 이러한 이유로 인해 새로운 시소러스를 구축하고자 할 때 많은 어려움을 겪게 된다. 그러므로 한글에 맞는 시소러스의 개발지침이 마련된다면, 우리말을 지키고 가꾸 는데도 많은 도움이 될 것이다.