Nghiên cứu và triển khai linked data cho các ứng dụng web ngữ nghĩa
Số trang: 14
Loại file: pdf
Dung lượng: 765.28 KB
Lượt xem: 50
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài báo này trình bày các khái niệm và các kỹ thuật nền tảng của Linked Data, mô tả cách xuất bản Linked Data lên Web. Phần cuối đưa ra ví dụ minh họa việc xuất bản Linked Data và liên kết đến các nguồn dữ liệu khác trên Web.
Nội dung trích xuất từ tài liệu:
Nghiên cứu và triển khai linked data cho các ứng dụng web ngữ nghĩa TẠP CHÍ KHOA HỌC, Đại học Huế, Số 65, 2011<br /> NGHIÊN CỨU VÀ TRIỂN KHAI LINKED DATA<br /> CHO CÁC ỨNG DỤNG WEB NGỮ NGHĨA<br /> Lê Thị Thanh Tâm, Trường Cao đẳng Công nghiệp Huế<br /> Hoàng Hữu Hạnh, Lê Mạnh Thạnh<br /> Đại học Huế<br /> <br /> TÓM TẮT<br /> Web ngữ nghĩa là xu thế phát triển trong việc biểu diễn dữ liệu để khắc phục các hạn<br /> chế của Web hiện tại và hướng đến một thế hệ Web đáp ứng tốt hơn nhu cầu của con người và<br /> các ứng dụng. Linked Data là thuật ngữ chỉ cách thức liên kết các nguồn dữ liệu trên Web hay<br /> đơn giản là sử dụng Web để kết nối các dữ liệu từ nhiều nguồn khác nhau, là một trong những<br /> cách tạo dựng nền tảng cho Web ngữ nghĩa. Vấn đề đặt ra là làm sao để chúng ta có thể chia sẻ<br /> các dữ liệu trên Web dễ dàng như chia sẻ các tài liệu trên Web ngày nay. Bài báo này trình bày<br /> các khái niệm và các kỹ thuật nền tảng của Linked Data, mô tả cách xuất bản Linked Data lên<br /> Web. Phần cuối đưa ra ví dụ minh họa việc xuất bản Linked Data và liên kết đến các nguồn dữ<br /> liệu khác trên Web.<br /> <br /> 1. Giới thiệu<br /> Mặc dù Web đã mang lại những lợi ích to lớn cho đến tận hôm nay. Tuy nhiên,<br /> những công nghệ đó chỉ áp dụng cho Web của tài liệu như hiện tại mà không thể áp<br /> dụng cho một thế hệ Web mới, Web dữ liệu (Web of Data). Thông thường, dữ liệu được<br /> xuất bản lên Web đã được định sẵn dưới dạng thô XML hay bằng HTML, mà bỏ qua<br /> nhiều cấu trúc và ngữ nghĩa của nó, dẫn đến thông tin thu được thiếu chính xác và đầy<br /> đủ. Trong Web siêu văn bản, tính tự nhiên của các mối quan hệ giữa hai tài liệu liên kết<br /> không rõ ràng vì định dạng dữ liệu HTML không hiệu quả khi biểu diễn các hạng mục<br /> riêng biệt được mô tả trong một tài liệu cụ thể và kết nối bởi liên kết định kiểu đến các<br /> mục liên quan. [1, 3]<br /> Xuất phát từ ý tưởng của Tim Berner-Lee năm 1998: “Web ngữ nghĩa không chỉ<br /> đưa dữ liệu lên Web. Nó còn là những liên kết để người hay máy có thể duyệt được dữ<br /> liệu trên Web. Với các dữ liệu được liên kết, khi bạn có một vài thứ bạn có thể tìm thấy<br /> những dữ liệu khác liên quan” [3]. Vấn đề đặt ra là làm sao để chúng ta có thể chia sẻ<br /> các dữ liệu (có cấu trúc) trên web dễ dàng như chia sẻ các tài liệu trên web ngày nay.<br /> Thuật ngữ Linked Data được Tim Berner-Lee đưa ra trong các ghi chép về kiến<br /> trúc Linked Data Web của mình. Thuật ngữ này chỉ cách thức (kiểu) để xuất bản và liên<br /> kết các dữ liệu có cấu trúc trên web. Giả định cơ bản của Linked Data là lợi ích và giá<br /> trị của dữ liệu tăng lên khi nó được liên kết với các dữ liệu khác [3, 9].<br /> 179<br /> <br /> Trong khi thành phần chính của Web hiện nay (hay còn gọi là web siêu liên kết)<br /> là tài liệu HTML được kết nối bởi các siêu liên kết không định kiểu (không xác định<br /> kiểu dữ liệu hay kiểu quan hệ), Linked Data dựa vào tài liệu chứa dữ liệu dạng RDF<br /> [19]. Tuy nhiên, tốt hơn các tài liệu kết nối đơn giản, Linked Data sử dụng RDF để làm<br /> các câu định kiểu liên kết các tài nguyên trong thế gới thực. Kết quả, những gì chúng ta<br /> tham chiếu trong Web của dữ liệu, có thể thực sự được mô tả như trong thế giới thực<br /> (Web of things), được mô tả bởi dữ liệu trên Web. [7, 8]<br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Liên kết<br /> <br /> Liên kết<br /> <br /> A<br /> <br /> B<br /> <br /> Liên kết<br /> <br /> C<br /> <br /> Liên kết<br /> <br /> D<br /> <br /> E<br /> <br /> Hình 1. Mô hình liên kết dữ liệu trong Web ngữ nghĩa<br /> <br /> 2. Một số khái niệm và thuật ngữ<br /> 2.1. Các nguyên lý của Linked Data<br /> Tim Berner Lee đã đưa ra 4 nguyên lý cơ bản của Linked Data như sau [3,7,11]:<br /> -<br /> <br /> Dùng URI để đặt tên cho mọi thứ, không chỉ là các tài liệu;<br /> <br /> -<br /> <br /> Sử dụng HTTP URI để tìm kiếm tên tài nguyên;<br /> <br /> -<br /> <br /> Khi tìm kiếm phải cung cấp thêm các thông tin hữu ích, sử dụng các kỹ thuật<br /> đã được chuẩn hóa (RDF, SPARQL);<br /> <br /> -<br /> <br /> Có những liên kết đến URI khác cho phép khám phá thêm những tài nguyên<br /> (tri thức) khác.<br /> <br /> Linked Data sử dụng mô hình dữ liệu RDF để xuất bản dữ liệu có cấu trúc trên<br /> Web và sử dụng liên kết RDF để kết nối các dữ liệu từ nhiều nguồn dữ liệu khác nhau.<br /> Điều đó tạo ra các nguồn dữ liệu chung trên Web nơi mà các cá nhân hay tổ chức có thể<br /> đưa dữ liệu lên hay sử dụng dữ liệu về bất cứ thứ gì [2, 8].<br /> 2.2. Tài nguyên<br /> Để xuất bản dữ liệu trên Web, đầu tiên chúng ta phải đặt tên hay định danh các<br /> thứ quan tâm trong lĩnh vực của ứng dụng. Khi mô tả chúng, ta cần quan tâm đến các<br /> thuộc tính và mối quan hệ của chúng với những thứ khác. Trong thuật ngữ của kiến trúc<br /> Web, tất cả các thứ quan tâm được gọi là tài nguyên [8].<br /> 180<br /> <br /> Có hai loại tài nguyên là tài nguyên thông tin và tài nguyên phi thông tin (tài<br /> nguyên thế giới thực hay còn gọi là thực thể thế giới thực) [8]. Tất cả tà ...
Nội dung trích xuất từ tài liệu:
Nghiên cứu và triển khai linked data cho các ứng dụng web ngữ nghĩa TẠP CHÍ KHOA HỌC, Đại học Huế, Số 65, 2011<br /> NGHIÊN CỨU VÀ TRIỂN KHAI LINKED DATA<br /> CHO CÁC ỨNG DỤNG WEB NGỮ NGHĨA<br /> Lê Thị Thanh Tâm, Trường Cao đẳng Công nghiệp Huế<br /> Hoàng Hữu Hạnh, Lê Mạnh Thạnh<br /> Đại học Huế<br /> <br /> TÓM TẮT<br /> Web ngữ nghĩa là xu thế phát triển trong việc biểu diễn dữ liệu để khắc phục các hạn<br /> chế của Web hiện tại và hướng đến một thế hệ Web đáp ứng tốt hơn nhu cầu của con người và<br /> các ứng dụng. Linked Data là thuật ngữ chỉ cách thức liên kết các nguồn dữ liệu trên Web hay<br /> đơn giản là sử dụng Web để kết nối các dữ liệu từ nhiều nguồn khác nhau, là một trong những<br /> cách tạo dựng nền tảng cho Web ngữ nghĩa. Vấn đề đặt ra là làm sao để chúng ta có thể chia sẻ<br /> các dữ liệu trên Web dễ dàng như chia sẻ các tài liệu trên Web ngày nay. Bài báo này trình bày<br /> các khái niệm và các kỹ thuật nền tảng của Linked Data, mô tả cách xuất bản Linked Data lên<br /> Web. Phần cuối đưa ra ví dụ minh họa việc xuất bản Linked Data và liên kết đến các nguồn dữ<br /> liệu khác trên Web.<br /> <br /> 1. Giới thiệu<br /> Mặc dù Web đã mang lại những lợi ích to lớn cho đến tận hôm nay. Tuy nhiên,<br /> những công nghệ đó chỉ áp dụng cho Web của tài liệu như hiện tại mà không thể áp<br /> dụng cho một thế hệ Web mới, Web dữ liệu (Web of Data). Thông thường, dữ liệu được<br /> xuất bản lên Web đã được định sẵn dưới dạng thô XML hay bằng HTML, mà bỏ qua<br /> nhiều cấu trúc và ngữ nghĩa của nó, dẫn đến thông tin thu được thiếu chính xác và đầy<br /> đủ. Trong Web siêu văn bản, tính tự nhiên của các mối quan hệ giữa hai tài liệu liên kết<br /> không rõ ràng vì định dạng dữ liệu HTML không hiệu quả khi biểu diễn các hạng mục<br /> riêng biệt được mô tả trong một tài liệu cụ thể và kết nối bởi liên kết định kiểu đến các<br /> mục liên quan. [1, 3]<br /> Xuất phát từ ý tưởng của Tim Berner-Lee năm 1998: “Web ngữ nghĩa không chỉ<br /> đưa dữ liệu lên Web. Nó còn là những liên kết để người hay máy có thể duyệt được dữ<br /> liệu trên Web. Với các dữ liệu được liên kết, khi bạn có một vài thứ bạn có thể tìm thấy<br /> những dữ liệu khác liên quan” [3]. Vấn đề đặt ra là làm sao để chúng ta có thể chia sẻ<br /> các dữ liệu (có cấu trúc) trên web dễ dàng như chia sẻ các tài liệu trên web ngày nay.<br /> Thuật ngữ Linked Data được Tim Berner-Lee đưa ra trong các ghi chép về kiến<br /> trúc Linked Data Web của mình. Thuật ngữ này chỉ cách thức (kiểu) để xuất bản và liên<br /> kết các dữ liệu có cấu trúc trên web. Giả định cơ bản của Linked Data là lợi ích và giá<br /> trị của dữ liệu tăng lên khi nó được liên kết với các dữ liệu khác [3, 9].<br /> 179<br /> <br /> Trong khi thành phần chính của Web hiện nay (hay còn gọi là web siêu liên kết)<br /> là tài liệu HTML được kết nối bởi các siêu liên kết không định kiểu (không xác định<br /> kiểu dữ liệu hay kiểu quan hệ), Linked Data dựa vào tài liệu chứa dữ liệu dạng RDF<br /> [19]. Tuy nhiên, tốt hơn các tài liệu kết nối đơn giản, Linked Data sử dụng RDF để làm<br /> các câu định kiểu liên kết các tài nguyên trong thế gới thực. Kết quả, những gì chúng ta<br /> tham chiếu trong Web của dữ liệu, có thể thực sự được mô tả như trong thế giới thực<br /> (Web of things), được mô tả bởi dữ liệu trên Web. [7, 8]<br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Tài nguyên<br /> <br /> Liên kết<br /> <br /> Liên kết<br /> <br /> A<br /> <br /> B<br /> <br /> Liên kết<br /> <br /> C<br /> <br /> Liên kết<br /> <br /> D<br /> <br /> E<br /> <br /> Hình 1. Mô hình liên kết dữ liệu trong Web ngữ nghĩa<br /> <br /> 2. Một số khái niệm và thuật ngữ<br /> 2.1. Các nguyên lý của Linked Data<br /> Tim Berner Lee đã đưa ra 4 nguyên lý cơ bản của Linked Data như sau [3,7,11]:<br /> -<br /> <br /> Dùng URI để đặt tên cho mọi thứ, không chỉ là các tài liệu;<br /> <br /> -<br /> <br /> Sử dụng HTTP URI để tìm kiếm tên tài nguyên;<br /> <br /> -<br /> <br /> Khi tìm kiếm phải cung cấp thêm các thông tin hữu ích, sử dụng các kỹ thuật<br /> đã được chuẩn hóa (RDF, SPARQL);<br /> <br /> -<br /> <br /> Có những liên kết đến URI khác cho phép khám phá thêm những tài nguyên<br /> (tri thức) khác.<br /> <br /> Linked Data sử dụng mô hình dữ liệu RDF để xuất bản dữ liệu có cấu trúc trên<br /> Web và sử dụng liên kết RDF để kết nối các dữ liệu từ nhiều nguồn dữ liệu khác nhau.<br /> Điều đó tạo ra các nguồn dữ liệu chung trên Web nơi mà các cá nhân hay tổ chức có thể<br /> đưa dữ liệu lên hay sử dụng dữ liệu về bất cứ thứ gì [2, 8].<br /> 2.2. Tài nguyên<br /> Để xuất bản dữ liệu trên Web, đầu tiên chúng ta phải đặt tên hay định danh các<br /> thứ quan tâm trong lĩnh vực của ứng dụng. Khi mô tả chúng, ta cần quan tâm đến các<br /> thuộc tính và mối quan hệ của chúng với những thứ khác. Trong thuật ngữ của kiến trúc<br /> Web, tất cả các thứ quan tâm được gọi là tài nguyên [8].<br /> 180<br /> <br /> Có hai loại tài nguyên là tài nguyên thông tin và tài nguyên phi thông tin (tài<br /> nguyên thế giới thực hay còn gọi là thực thể thế giới thực) [8]. Tất cả tà ...
Tìm kiếm theo từ khóa liên quan:
Triển khai linked data Ứng dụng web ngữ nghĩa Web ngữ nghĩa Linked Data Web dữ liệu Dữ liệu HTMLTài liệu có liên quan:
-
Bài giảng Một số hướng nghiên cứu và ứng dụng - Lê Thanh Hương
13 trang 246 0 0 -
Xây dựng ứng dụng tìm kiếm sách điện tử bằng phương pháp tìm kiếm ngữ nghĩa trên ontology
12 trang 57 0 0 -
Đề xuất hệ thống thông minh hỗ trợ tìm kiếm việc làm
6 trang 55 0 0 -
Xây dựng hệ thống web ngữ nghĩa hỗ trợ tra cứu pháp luật Việt Nam
6 trang 49 0 0 -
Bài giảng Công nghệ XML và WEB ngữ nghĩa
0 trang 47 0 0 -
Bài giảng Ontology và Web ngữ nghĩa - Lê Thanh Hương
12 trang 43 0 0 -
Bài thuyết trình Linked Data trong phát triển ứng dụng Web
20 trang 42 0 0 -
Một cải tiến trong đánh giá độ tương tự ngữ nghĩa giữa hai khái niệm trong kỹ nghệ Ontology
5 trang 37 0 0 -
28 trang 36 0 0
-
Một giải pháp chuyển đổi từ cơ sở dữ liệu quan hệ sang mô hình dữ liệu cho Web ngữ nghĩa
9 trang 33 0 0