검색 상세

시맨틱 웹 추론 엔진을 이용한 개방형 링크드 데이터 브라우저 구현

Implementation of a Linked Open Data browser using a Semantic Web reasoning engine

초록/요약

링크드데이터는 웹상의 데이터 출시 스타일이다. 개방형 링크드데이터(Linked Open Data, LOD) 클라우드는 2019년 3월 기준 1,239개의 데이터셋들과 16,147개의 링크들을 포함하고 있다. 링크드데이터는 트리플 구조를 가지며, 트리플은 <주어, 서술어, 목적어> 형태로 구성된다. 이 구조는 주어와 목적어 사이의 관계를 서술어로 보여준다. 각 요소는 웹상에서 URI(Uniform Resource Identifier)로 식별되며 접근이 가능하다. 링크드데이터의 네 가지 이점은 다음과 같다. 첫째, LOD의 접근에 제한이 없다. 또한 링크드데이터의 트리플 구조는 규칙을 통해 추론이 가능토록 허용한다. 뿐만 아니라 이러한 특징은 사용자가 웹을 연속적으로 탐색할 수 있도록 한다. 마지막으로 서술어를 통해 각 관계의 시맨틱 정보를 제공한다. 그러나 LOD의 사용자는 대부분 연구자들인데 그 이유는 SPARQL(SPARQL Protocol and RDF Query Language) 과 같은 문법적 지식을 요구하기 때문이다. 의학 연구 분야나 약학 정보 관리, 도서관의 장서 관리에서 링크드데이터를 사용하는 경우들이 존재하나, 이 경우에는 트리플 구조 자체를 사용한다. 본 연구의 목적은 일반 사용자가 LOD를 어려움없이 사용하도록 돕는 것이다. 링크드데이터의 진입점은 총 네 가지가 있다. 먼저 URI로 직접 링크드데이터에 접근하는 방법이 있다. 만약 사용자가 기술적 지식이 있다면, SPARQL 종단점이 하나의 접근점이 될 수 있다. 또한 사용자는 덤프 데이터셋을 다운로드 받아서 읽을 수 있다. 때때로 몇몇 서비스 제공자들은 링크드데이터를 HTML(HyperText Markup Language)을 사용하여 사용자 친화적인 뷰로 제공하기도 한다. 앞선 세 가지 방법은 일반 사용자에게는 매우 어렵다. HTML로 렌더링된 경우 역시 어려운데, 왜냐하면 렌더링 수준이 고르지 않기 때문이다. 이러한 관점에서 본 연구에서는 링크드 데이터가 일반 사용자를 위한 쉬운 진입점을 요구한다고 보았다. 링크드데이터의 쉬운 진입점을 제공하기 위한 조건은 다음과 같다. 첫째, 기술적 지식을 요구하지 않아야 한다. 둘째, 시각화된 결과를 제공해야 한다. 셋째, 최소한으로 가공된 데이터셋을 제공해야 한다. 넷째, 사용자가 LOD를 자유롭게 검색하고 브라우징 하도록 허용해야 한다. 다섯째, 링크드데이터의 모든 이점을 활용할 수 있도록 지원해야 한다. 이를 위해 비전문가 사용자에게 사용자 친화적인 뷰를 제공하는 시스템이 필요하다. 본 연구에서는 디비피디아 의 정보를 키워드를 이용하여 탐색할 수 있는 RAB(Reasoning and Browsing) 시스템을 제공한다. 만일 사용자가 추론규칙을 가지고 있다면 시스템은 규칙을 이용하여 추론된 결과를 돌려준다. 이 과정을 위해 본 연구에서는 EYE 추론엔진을 사용한다. RAB은 세 종류의 사용자를 지원한다. 첫째, 링크드데이터에 관한 지식이 없는 사용자이다. 이 경우, RAB은 사용자들이 단순 검색을 하거나 추론규칙을 적용하여 검색하도록 한다. 둘째, 프로그래밍 경험이 있는 사용자이다. 사용자들은 추론규칙들을 직접 만들고 선택하여 검색할 수 있다. 셋째, 링크드데이터의 데이터셋을 다룰 수 있는 사용자이다. 이 사용자들은 SPARQL 쿼리를 이용하여 외부의 데이터셋들로부터 트리플을 가져올 수 있다.

more

초록/요약

Linked Data is a publication style of data on the Web. Linked Open Data(LOD) Cloud includes 1,239 datasets, 16,147 links(as of March 2019). Linked Data has a triple structure. The format of Linked Data triple is <Subject, Predicate, Object>. This structure shows the relation between the subject and the object with a predicate. Each component can be identified and accessed on the Web with a URI(Uniform Resource Identifier). There are four benefits of Linked Data. First, there is no limitation for accessing LOD. Also, the triple structure of the Linked Data allows users to infer with rules. On top of that, it allows users to explore the Web continuously. Finally, it provides a semantic information of each relationship by predicates. However, most users of LOD have been researchers so far because it requires grammatical knowledge such as SPARQL(SPARQL Protocol and RDF Query Language). Even though there are some cases that use the Linked Data in the medical research field, managing for medicine information and book information in the library system, they use triple structures only. The purpose of our research is to help non-expert users consume LOD without difficulties. There are four kinds of entry points for Linked Data. Users can access Linked Data with URI directly. If a user has technical knowledge, SPARQL Endpoint can be one of the access points. And a user can read data by downloading dump dataset. Sometimes, a few service providers show Linked Data using HTML(HyperText Markup Language) for a user-friendly view. The first three kinds are very hard for novice users. The HTML rendered case is also difficult because the rendering level is not even. With this understanding, we thought Linked Data requires a simple entry point for non-expert users. There are conditions to serve as a simple entry point. First, it should not require technical knowledges. Second, it should return visualized results. Third, it should provide minimally processed datasets. Fourth, it should allow users to search and browse LOD freely. Fifth, it should help users utilize all benefits of Linked Data. For that, there is a need for a system which supports user-friendly views to non-expert users. In this research, we propose a Reasoning and Browsing(RAB) system that allows users to explore information contained in DBPedia with keywords. In addition, if users have inference rules, the system will return the reasoning result by using the rules. For this process, we adapted EYE reasoner. RAB supports three types of users. First, users who do not have knowledge of Linked Data. In that case, RAB helps users do simple search or apply reasoning rules. Second, users who have programming experiences. Users make reasoning rules and select them for results with inferences. Third, users who can deal with dataset of Linked Data. The users bring triples from other datasets using SPARQL queries.

more

목차

제 1 장 서론 1
1.1 연구 배경 및 목적 1
1.2 연구의 필요성 6
1.3 논문의 구성 8
제 2 장 관련 연구 9
2.1 링크드데이터 관련 도구 9
2.2 본 연구의 차별성 12
제 3 장 RAB 시스템 16
3.1 모듈별 기능 18
3.2 시스템 구조 20
3.3 구현 내용 26
제 4 장 시스템 활용 41
4.1 초보 사용자 43
4.2 추론규칙 작성 사용자 46
4.3 데이터셋 보유 사용자 56
제 5 장 결론 68
참고문헌 71

more