Danh mục tài liệu

Tóm tắt Luận văn Thạc sĩ Hệ thống thông tin: Nghiên Cứu, Xây Dựng Ứng Dụng Đọc Tin Nhanh Bằng Cách Trích Rút Và Tổng Hợp Thông Tin Từ Các Trang Web

Số trang: 26      Loại file: pdf      Dung lượng: 769.94 KB      Lượt xem: 10      Lượt tải: 0    
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Mục tiêu nghiên cứu của đề tài là nghiên cứu các thuật toán trích rút thông tin từ trang web. Xây dựng ứng dụng đọc tin nhanh trên thiết bị di động đáp ứng nhu cầu cập nhật tin tức nhanh chóng hiệu quả. Để đạt được mục đích trên, nhiệm vụ chính của đề tài là: Tìm hiểu các nội dung lý thuyết liên về xử lý ngôn ngữ tự nhiên, khai phá dữ liệu web. Trích rút thông tin từ trang web để xây dựng ứng dụng. Biểu diễn kết quả trích rút thông tin từ trang web.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Hệ thống thông tin: Nghiên Cứu, Xây Dựng Ứng Dụng Đọc Tin Nhanh Bằng Cách Trích Rút Và Tổng Hợp Thông Tin Từ Các Trang Web BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN THỊ KHUYẾN NGHIÊN CỨU, XÂY DỰNG ỨNG DỤNGĐỌC TIN NHANH BẰNG CÁCH TRÍCH RÚT VÀ TỔNG HỢP THÔNG TIN TỪ CÁC TRANG WEB Chuyên ngành: Hệ Thống Thông Tin Mã số: 60.48.01.04TÓM TẮT LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Đà Nẵng - Năm 2016 Công trình được hoàn thành tại ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: TS. HUỲNH CÔNG PHÁP Phản biện 1: TS. HOÀNG THỊ THANH HÀ Phản biện 2: PGS.TS. LÊ MẠNH THẠNH Luận văn được bảo vệ tại Hội đồng chấm Luận văn tốtnghiệp thạc sĩ Hệ thống thông tin họp tại Đại học Đà Nẵng vàongày 31 tháng 07 năm 2016.Có thể tìm hiểu luận văn tại: Trung tâm Thông tin - Học liệu, Đại Học Đà Nẵng 1 MỞ ĐẦU 1. Lý do chọn đề tài Ngày nay công nghệ thông đóng một vai trò rất quan trọng tronghầu hết các lĩnh vực của đời sống xã hội. Sự phát triển nhanh chóngcủa của công nghệ thông tin nói chung và công nghệ World WideWeb nói riêng đã tạo ra một nguồn tài nguyên thông tin vô cùng rộnglớn, một kho tàng tri thức phong phú cho nhân loại. Tuy nhiên,nguồn tài nguyên thông tin này không biểu diễn một cách tập trungmà nằm rải rác phân tán khắp nơi trên mạng, không được sắp xếp,phân loại như mong muốn đã gây không ít những khó khăn cho conngười khi tìm kiếm và khai thác thông tin. Trong hoàn cảnh đó, tríchrút và tổng hợp thông tin ra đời giúp cho việc tìm kiếm và thu thậpthông tin trở nên hiệu quả, tiết kiệm thời gian và công sức trong việcsàng lọc và tổng hợp tri thức. Như tìm hiểu, tôi biết được trích rút thông tin là một trong nhữngphương thức điển hình của chủ đề khai thác nguồn thông tin gồm: - Tìm kiếm thông tin (Information Retrieval) - Tóm lược văn bản (Text Summarization) - Trích rút thông tin (Information Extraction) Trích rút thông tin là phương thức trích chọn để lấy ra thông tinhữu ích từ kho thông tin chưa được tổng hợp chọn lọc. Trích rútthông tin từ trang web là công nghệ bao gồm nhiều phương thứcgiúp trích xuất một phần thông tin hữu ích theo mục đích từ cáctrang web chứa nhiều danh mục, chủ đề, nội dung khác nhau. Khisử dụng công nghệ trích rút thông tin, con người không còn phải 2mất nhiều thời gian để đọc hết các kết quả tìm kiếm trên mạng haycác trang web với nhiều những thông tin, nội dung dung không liênquan để lọc ra những tin cần thiết. Ví dụ như khi chúng ta đọc báotrên mạng, các trang web chứa đầy các nội dung quảng cáo, cácdanh mục, các bài viết. Để biết được kết quả bóng đá, sổ số, bảngtin chứng khoán hay một mục nào đó, chúng ta phải lướt hết nộidung của trang web và tìm ra phần nội dung cần thiết. Việc làm đókhông những lãng phí thời gian mà còn gây ra tình trạng tốn lưulượng, tốn bộ nhớ. Bên cạnh đó, sự ra đời của báo điện tử đã thay đổi diện mạo củaphương thức tiếp cận tri thức, cũng như thay đổi trong thói quenđọc báo của con người. Với ưu thế về tốc độ và khả năng vươn xa,Internet giúp cho độc giả có thể tiếp cận tin tức mọi lúc, mọi nơivới sự hỗ trợ của các thiết bị di động thông minh như điện thoại diđộng thông minh (smartphone), thiết bị đọc sách thông minh(playbook), máy tính cầm tay thông minh (tablet),... Các thiết bị diđộng thông minh không những giao diện đẹp, thiết bị gọn nhẹ, màcòn hỗ trợ truy cập Internet với nhiều loại hình như mạng 3G, mạngkhông dây, GPRS,… đã tạo tiền đề cho nhu cầu đọc báo và cậpnhật tin tức trở thành nhu cầu thiết yếu, không thể thay thế của conngười. Tuy nhiên, việc đọc báo trên các thiết bị di động còn nhiều bấttiện vì màn hình nhỏ không cho phép hiển thị trang web được thiếtkế cho máy tính để bàn, phông chữ bị lỗi, thông tin quảng cáo và tiêuđề của ứng dụng cũng được tải về cùng lúc với ứng dụng làm giảmtốc độ và gây khó chịu cho người dùng,… Chính vì vậy, mục đích 3của luận văn này là xây dựng một hệ thống cho phép dễ dàng vàthuận tiện xem tin tức tiếng Việt của báo điện tử bất kỳ trên thiết bịdi động thông minh, mà chi tiết hơn là trên thiết bị di động hệ điềuhành android. Đó cũng chính là lý do tôi chọn đề tài “Nghiên Cứu, Xây DựngỨng Dụng Đọc Tin Nhanh Bằng Cách Trích Rút Và Tổng HợpThông Tin Từ Các Trang Web” 2. Mục tiêu và nhiệm vụ - Nghiên cứu các thuật toán trích rút thông tin từ trang web. - Xây dựng ứng dụng đọc tin nhanh trên thiết bị di động đáp ứngnhu cầu cập nhật tin tức nhanh chóng hiệu quả. - Để đạt được mục đích trên, nhiệm vụ chính của đề tài là: - Tìm hiểu các nội dung lý thuyết liên về xử lý ngôn ngữ tựnhiên, khai phá dữ liệu web. - Trích rút thông tin từ trang web để x ...

Tài liệu có liên quan: