온토러스 소개
우리말 시소러스인 온토러스는 용어의 의미 정보와 관련 용어 간의 관계를 구조화하고 있는 우리말에 대한 통제 어회 사전이다.
비구조화 데이터를 처리하기 위한 대부분의 알고리즘은 이미 개발되어 알려져 있으며 이를 보다 정교하게 처리하기 위해서는 구조화 데이터가 필요하다. 이를 위하여 의미 정보의 용어 간의 관계를 갖는 우리말 용어의 메타데이터를 구축한다는 목표아래 1993년부터 용어를 수집하고 이를 표준 시소러스 구조로 기술하고 있다. 시소러스는 용어의 구조화 형식으로 널리 알려져 있으며 용어 간의 복잡한 관계를 간결하게 추상화하고 있다. 본 사전에서는 기본적으로 표준 시소러스 구조를 채택하고 부가적으로 이랠 확장하고 있다.
통제 용어의 대상으로는 주제명, 인명, 기관/단체명, 지명, 동물명, 식물명, 법률명, 문헌명, 기념물명, 상품명, 회의/집회명, 사건명등의 명사류, 그리고 동사와 형용사를 포함시키고 있다. 2013년 8월 현재 130만 용어(한글 용어 80만 용어, 외국어 51만 용어)를 등재하고 용어 관계를 정리하였다. 아직 충분하지는 않으나 이제 현장의 비고조화 데이터를 어니정도 처리할 수 있는 양의 데이터를 구축하였다고 생각하여 지금까지의 결과를 공개하기로 한다. 매월 1만 용어 이상의 새로운 용어를 추가하고 있으며, 이 작업은 수정작업과 함께 계속될 것이다.
관련연구
1993.08 과학기술 한글 시소러스 개발 / 국방과학연구소
1994.10 시소러스 개발을 위한 프레임웍 / 한국문예진흥원
1994.12 주제명 검색용어집 개발에 관한 연구 / 국립중앙도서관
1995.12 하이텔 안내시스템용 시소러스의 개발 / 한국통신
1995.12 지능형 정보검색에 관한 연구 - 별책부록- 시소러스 / 한국통신연구개발원
1997.08 디지털도서관용 시소러스 및 전거 데이터 구축에 대한 연구 / 오롬정보
1998.12 법률분야 관련어집 / 법원도서관
1999.11 통일 및 북한 관련 전문용어 시소러스 / 통일연구원
2000.07 경기도 사이버도서관 시소러스 구축 / 경기도
2000.10 시소러스 개발 지침 / 한국데이터베이스진흥센터
2000.12 법률분야 관련어집 Ver.2.0 / 법원도서관
2000.12 디자인정보 구축방안 연구 및 시소러스 개발 / 산업자원부 한국디자인진흥원
2002.11 교육시소러스 개발 / 한국교육학술정보원
2002.12 국립중앙도서관 주제명표목표 개발 / 국립중앙도서관
2005.10 10만 범용 과학기술분야 전문용어에 대한 계층적 개념망/어휘망 구축 및 워크벤치 개발 / 한국과학기술정보연구원
2005.11 시소러스를 활용한 지능형 B2B 통합검색시스템 구축 전략 수립 / 한국전자거래협회
2006.11 10만 범용 과학기술분야 전문용어에 대한 계층적 개념망/어휘망 구축 및 워크벤치 개발 / 한국과학기술정보연구원
2006.12 과학기술 분야 시소러스 구축 연구 / 한국과학기술정보연구원
2007..09 용어데이터 레지스트리 설계 및 발전방향 연구 / 한국학술진흥재단
2007.12 과학기술 분야 시소러스 구축 연구 2007 / 한국과학기술정보연구원
2008.11 2008 전력기술용어 시소러스 개발 : 전력계통 기술 분야 / 한국전력연구원
2008.12 2008 기록물 관리, 검색용 시소러스 개발 / 국가기록원
2009.11 IT기반 정부규격 통합 서비스시스템 구축사업 : 표준용어사전 및 검색, 추론 API 개발 / 한국표준협회
2009.11 2009 전력기술용어 시소러스 개발 : 발전 및 에너지 기술 분야 / 한국전력연구원
2009.12 지능형 입법지원 시스템의 상용서비스를 위한 연구 / 법무부
2010.04 2010 전력기술용어 시소러스 개발 : 정보통신, 환경화학, 전축토목, 경영경제 일반 기술 분야 / 한국전력연구원
2010.11 국방과학기술전문용어 표준화 개념 연구 / 국방기술품질원
2011.12 국방과학기술용어사전 / 국방기술품질원