Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu tóm tắt văn bản tự động và ứng dụng
Số trang: 24
Loại file: pdf
Dung lượng: 868.42 KB
Lượt xem: 18
Lượt tải: 0
Xem trước 3 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Luận văn Thạc sĩ "Nghiên cứu tóm tắt văn bản tự động và ứng dụng" Chương 1: Khái quát bài toán tóm tắt văn bản; chương 2: Một số nghiên cứu về tóm tắt văn bản; chương 3: Mạng nơ ron nhân tạo; chương 4: Xây dựng hệ thống tóm tắt văn bản theo hướng tóm lược, chương 5: Thử nghiệm và đánh giá. Mời các bạn cùng tham khảo đề tài.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu tóm tắt văn bản tự động và ứng dụngĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆNGUYỄN VIẾT HẠNHNGHIÊN CỨU TÓM TẮT VĂN BẢN TỰ ĐỘNG VÀỨNG DỤNGNgành: Công nghệ thông tinChuyên ngành: Kỹ thuật phần mềmMã số: 60480103TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TINHÀ NỘI - 20182MỤC LỤCMỤC LỤC ............................................................................................................................................... 2DANH MỤC HÌNH VẼ ........................................................................................................................... 4MỞ ĐẦU................................................................................................................................................. 6CHƯƠNG 1: KHÁI QUÁT BÀI TOÁN TÓM TẮT VĂN BẢN .............................................................. 71.1. Bài toán tóm tắt văn bản tự động ................................................................................................... 71.2. Các hướng tiếp cận tóm tắt văn bản. .............................................................................................. 7CHƯƠNG 2: MỘT SỐ NGHIÊN CỨU VỀ TÓM TẮT VĂN BẢN ......................................................... 72.1. Tóm tắt văn bản theo hướng trích chọn. ........................................................................................ 72.2. Tóm tắt văn bản theo hướng tóm lược ........................................................................................... 8CHƯƠNG 3: MẠNG NƠ RON NHÂN TẠO ........................................................................................... 93.1. Mạng nơ ron nhân tạo ANN .......................................................................................................... 93.1.1. Cấu trúc mạng nơ ron nhân tạo................................................................................................... 93.1.2. Hoạt động của mạng ANN ......................................................................................................... 93.2. Mạng nơ ron hồi quy RNN ......................................................................................................... 103.3. Mạng nơ ron có nhớ LSTM......................................................................................................... 10CHƯƠNG 4: XÂY DỰNG HỆ THỐNG TÓM TẮT VĂN BẢN THEO HƯỚNG TÓM LƯỢC............. 124.1. Quy trình tóm tắt theo hướng tóm lược sử dụng mạng LSTM...................................................... 124.2. Xây dựng bộ dữ liệu cho tóm tắt văn bản tiếng Việt .................................................................... 124.3. Word Embedding........................................................................................................................ 134.3.1. Embedding dựa trên tần xuất xuất hiện của từ. ......................................................................... 134.3.1.1. Count vector ......................................................................................................................... 134.3.1.2. Phương pháp vector hóa TF-IDF ........................................................................................... 144.3.2. Word2Vec ............................................................................................................................... 144.3.2.1. CBOW (Continuous Bag of Word) ........................................................................................ 144.3.2.2. Mô hình Skip-gram ............................................................................................................... 154.4. Xây dựng mô hình ...................................................................................................................... 15CHƯƠNG 5: THỬ NGHIỆM VÀ ĐÁNH GIÁ ...................................................................................... 175.1. Môi trường thử nghiệm ............................................................................................................... 175.2. Quá trình thử nghiệm .................................................................................................................. 185.2.1. Huấn luyện .............................................................................................................................. 185.2.2. Thử nghiệm ............................................................................................................................. 185.2.2.1. Thử nghiệm 1. ....................................................................................................................... 185.2.2.4. Thử nghiệm 4. ....................................................................................................................... 203KẾT LUẬN ....................................................................................................................... ...
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận văn Thạc sĩ Công nghệ thông tin: Nghiên cứu tóm tắt văn bản tự động và ứng dụngĐẠI HỌC QUỐC GIA HÀ NỘITRƯỜNG ĐẠI HỌC CÔNG NGHỆNGUYỄN VIẾT HẠNHNGHIÊN CỨU TÓM TẮT VĂN BẢN TỰ ĐỘNG VÀỨNG DỤNGNgành: Công nghệ thông tinChuyên ngành: Kỹ thuật phần mềmMã số: 60480103TÓM TẮT LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TINHÀ NỘI - 20182MỤC LỤCMỤC LỤC ............................................................................................................................................... 2DANH MỤC HÌNH VẼ ........................................................................................................................... 4MỞ ĐẦU................................................................................................................................................. 6CHƯƠNG 1: KHÁI QUÁT BÀI TOÁN TÓM TẮT VĂN BẢN .............................................................. 71.1. Bài toán tóm tắt văn bản tự động ................................................................................................... 71.2. Các hướng tiếp cận tóm tắt văn bản. .............................................................................................. 7CHƯƠNG 2: MỘT SỐ NGHIÊN CỨU VỀ TÓM TẮT VĂN BẢN ......................................................... 72.1. Tóm tắt văn bản theo hướng trích chọn. ........................................................................................ 72.2. Tóm tắt văn bản theo hướng tóm lược ........................................................................................... 8CHƯƠNG 3: MẠNG NƠ RON NHÂN TẠO ........................................................................................... 93.1. Mạng nơ ron nhân tạo ANN .......................................................................................................... 93.1.1. Cấu trúc mạng nơ ron nhân tạo................................................................................................... 93.1.2. Hoạt động của mạng ANN ......................................................................................................... 93.2. Mạng nơ ron hồi quy RNN ......................................................................................................... 103.3. Mạng nơ ron có nhớ LSTM......................................................................................................... 10CHƯƠNG 4: XÂY DỰNG HỆ THỐNG TÓM TẮT VĂN BẢN THEO HƯỚNG TÓM LƯỢC............. 124.1. Quy trình tóm tắt theo hướng tóm lược sử dụng mạng LSTM...................................................... 124.2. Xây dựng bộ dữ liệu cho tóm tắt văn bản tiếng Việt .................................................................... 124.3. Word Embedding........................................................................................................................ 134.3.1. Embedding dựa trên tần xuất xuất hiện của từ. ......................................................................... 134.3.1.1. Count vector ......................................................................................................................... 134.3.1.2. Phương pháp vector hóa TF-IDF ........................................................................................... 144.3.2. Word2Vec ............................................................................................................................... 144.3.2.1. CBOW (Continuous Bag of Word) ........................................................................................ 144.3.2.2. Mô hình Skip-gram ............................................................................................................... 154.4. Xây dựng mô hình ...................................................................................................................... 15CHƯƠNG 5: THỬ NGHIỆM VÀ ĐÁNH GIÁ ...................................................................................... 175.1. Môi trường thử nghiệm ............................................................................................................... 175.2. Quá trình thử nghiệm .................................................................................................................. 185.2.1. Huấn luyện .............................................................................................................................. 185.2.2. Thử nghiệm ............................................................................................................................. 185.2.2.1. Thử nghiệm 1. ....................................................................................................................... 185.2.2.4. Thử nghiệm 4. ....................................................................................................................... 203KẾT LUẬN ....................................................................................................................... ...
Tìm kiếm theo từ khóa liên quan:
Luận văn Thạc sĩ Công nghệ thông tin Tóm tắt văn bản tự động Mô hình kiến trúc Mạng nơ ron nhân tạoTài liệu có liên quan:
-
52 trang 468 1 0
-
Luận văn Thạc sĩ Kinh tế: Quản trị chất lượng dịch vụ khách sạn Mường Thanh Xa La
136 trang 377 5 0 -
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 367 0 0 -
97 trang 360 0 0
-
97 trang 335 0 0
-
155 trang 334 0 0
-
96 trang 334 0 0
-
74 trang 329 0 0
-
Đồ án tốt nghiệp: Xây dựng ứng dụng di động android quản lý khách hàng cắt tóc
81 trang 321 0 0 -
Tài liệu dạy học môn Tin học trong chương trình đào tạo trình độ cao đẳng
348 trang 320 1 0