![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://thuvienso.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Xây dựng các cặp câu hỏi - câu trả lời chất lượng cao từ các trang Web hỏi đáp cộng đồng
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Xây dựng các cặp câu hỏi - câu trả lời chất lượng cao từ các trang Web hỏi đáp cộng đồng Nguyễn Văn Tú, Lê Anh Cường, Nguyễn Hà Nam<br /> <br /> <br /> <br /> <br /> XÂY DỰNG CÁC CẶP CÂU HỎI - CÂU TRẢ LỜI CHẤT LƯỢNG CAO<br /> TỪ CÁC TRANG WEB HỎI ĐÁP CỘNG ĐỒNG<br /> <br /> Nguyễn Văn Tú1, Lê Anh Cường2, Nguyễn Hà Nam3<br /> 1<br /> Trường Đại học Tây Bắc<br /> 2<br /> Trường Đại học Tôn Đức Thắng<br /> 3<br /> Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội<br /> <br /> <br /> Tóm tắt: Các trang web hỏi đáp cộng đồng có chứa các tài liệu liên quan. Các đánh giá nổi tiếng nhất<br /> một lượng lớn thông tin hỏi - đáp có giá trị sinh về nhiệm vụ hỏi - đáp factoid là hội nghị truy hồi<br /> ra bởi những người sử dụng. Trong các trang web văn bản (Text REtrieval Conference-TREC). Các<br /> hỏi đáp cộng đồng, người dùng có thể gửi các câu câu hỏi và câu trả lời được phát hành bởi TREC<br /> hỏi, trả lời các câu hỏi của người khác, và cung cấp đã trở thành nguồn dữ liệu quan trọng cho các nhà<br /> thông tin phản hồi cho những câu hỏi/câu trả lời. nghiên cứu trong việc nghiên cứu xây dựng các hệ<br /> Trong nghiên cứu này chúng tôi sử dụng tiếp cận thống hỏi đáp tự động [1]. Tuy nhiên, khi phải đối<br /> học máy nhằm xây dựng các cặp câu hỏi - câu trả mặt với các câu hỏi non-factoid như các câu hỏi về<br /> lời chất lượng cao từ các trang web hỏi đáp cộng lý do tại sao, như thế nào, hoặc những gì về… hầu<br /> đồng. Các cặp câu hỏi - câu trả lời này sẽ được sử như không có hệ thống hỏi đáp tự động nào làm<br /> dụng làm nguồn dữ liệu cho các hệ thống hỏi đáp việc tốt.<br /> tự động. Chúng tôi thực hiện trích rút những đặc<br /> trưng quan trọng từ mỗi luồng hỏi đáp cũng như Các cặp câu hỏi - câu trả lời do người dùng tạo ra<br /> thông tin của người gửi câu trả lời và xây dựng mô chắc chắn sẽ rất quan trọng để giải quyết vấn đề<br /> hình phân loại để xác định được các cặp câu hỏi trả lời các câu hỏi non-factoid. Rõ ràng, những cặp<br /> - câu trả lời có ý nghĩa. Các kết quả thực nghiệm câu hỏi - câu trả lời tự nhiên thường được tạo ra<br /> trên bộ dữ liệu cung cấp bởi SemEval 2015 cho trong quá trình giao tiếp của con người thông qua<br /> thấy những đề xuất của chúng tôi sẽ mang lại kết phương tiện truyền thông xã hội Internet, trong đó<br /> quả cao. chúng tôi đặc biệt quan tâm tới các trang web hỏi<br /> đáp dựa vào cộng đồng. Các trang web hỏi đáp dựa<br /> Từ khóa: Hỏi đáp cộng đồng, phân loại, Support vào cộng đồng cung cấp nền tảng mà ở đó người<br /> Vector Machines, hệ thống hỏi đáp tự động.1 dùng có thể đặt câu hỏi, cung cấp câu trả lời và<br /> các thông tin phản hồi (ví dụ, bằng cách biểu quyết<br /> hoặc cho ý kiến) cho những câu hỏi/câu trả lời và<br /> I. TỔNG QUAN<br /> câu trả lời tốt nhất sẽ được lựa chọn để hiển thị cho<br /> Trong lĩnh vực xử lý ngôn ngữ tự nhiên và truy xuất người dùng.<br /> thông tin, vấn đề hỏi - đáp đã thu hút nhiều sự chú<br /> ý trong những năm qua. Tuy nhiên, các nghiên cứu Trong bài báo này, chúng tôi sử dụng tiếp cận học<br /> về hỏi - đáp chủ yếu tập trung vào việc tìm câu trả máy nhằm xây dựng các cặp câu hỏi - câu trả lời<br /> lời chính xác cho câu hỏi factoid được đưa ra trong có chất lượng cao từ các dữ liệu hỏi đáp thu thập<br /> từ các trang web hỏi đáp cộng đồng. Các cặp câu<br /> Tác giả liên hệ: Nguyễn Văn Tú<br /> hỏi - câu trả lời này có thể được sử dụng làm nguồn<br /> Email: tuspttb@gmail.com dữ liệu cho các hệ thống hỏi đáp tự động. Để xây<br /> Đến tòa soạn: 25/10/2016, chỉnh sửa: 28/12/2016, dựng các cặp câu hỏi - câu trả lời chất lượng từ các<br /> chấp nhận đăng: 1/1/2017 trang web hỏi đáp cộng đồng, trong bài báo này<br /> <br /> <br /> Số 3 - 4 (CS.01) 2016<br /> Tạp chí KHOA HỌC CÔNG NGHỆ 25<br /> THÔNG TIN VÀ TRUYỀN THÔNG<br /> XÂY DỰNG CÁC CẶP CÂU HỎI - CÂU TRẢ LỜI CHẤT LƯỢNG CAO TỪ CÁC TRANG WEB...<br /> <br /> chúng tôi đề xuất sử dụng sự kết hợp của nhiều loại Các nghiên cứu gần đây trong việc đánh giá chất<br /> đặc trưng quan trọng trích rút từ mỗi luồng hỏi đáp lượng của các câu trả lời cung cấp bởi các trang<br /> cũng như thông tin của người gửi câu trả lời và xây web hỏi đáp cộng đồng thường thông qua các đặc<br /> dựng mô hình phân loại để xác định được các cặp trưng biểu diễn văn bản của câu hỏi - câu trả lời<br /> câu hỏi - câu trả lời có ý nghĩa. như là độ dài của câu hỏi, độ dài của câu trả lời,<br /> tỷ lệ độ dài giữa câu hỏi và các câu trả lời của nó,<br /> Để thực hiệ ...
Tìm kiếm theo từ khóa liên quan:
Hỏi đáp cộng đồng Support Vector Machines Hệ thống hỏi đáp tự động Trang web hỏi đáp cộng đồng Xử lý ngôn ngữ tự nhiên Cặp câu hỏi - câu trả lờiTài liệu có liên quan:
-
12 trang 336 0 0
-
Phương pháp tạo ra văn bản tiếng Việt có đề tài xác định
7 trang 281 0 0 -
Giáo trình Lập trình logic trong prolog: Phần 1
114 trang 223 0 0 -
Đồ án tốt nghiệp đại học: Các đặc trưng ngôn ngữ cho bài toán phân loại câu hỏi tiếng Việt
60 trang 205 0 0 -
Xây dựng ontology trợ giúp ra quyết định về đào tạo cho các trường Đại học ở Việt Nam
10 trang 180 0 0 -
Tích hợp DSM và ảnh chụp UAV với mô hình nơ-ron tích chập trong phân loại lớp phủ mặt đất
8 trang 166 0 0 -
74 trang 160 0 0
-
Bài giảng Xử lý ngôn ngữ tự nhiên: Phân tích cú pháp xác suất - Lê Thanh Hương
19 trang 152 0 0 -
Trích xuất danh mục khía cạnh sử dụng BERT với hàm mất mát cân bằng
9 trang 140 0 0 -
Tóm tắt luận án Tiến sĩ Kỹ thuật: Sử dụng ngôn ngữ trục trong dịch đa ngữ
27 trang 100 0 0 -
Triển khai AI trong dạy học và nghiên cứu khoa học của sinh viên theo xu hướng chuyển đổi số
13 trang 76 0 0 -
Trích xuất thực thể trong an toàn thông tin sử dụng học sâu
8 trang 59 0 0 -
Mô hình thống kê học sâu trong nhận dạng khuôn mặt
11 trang 59 0 0 -
Mô hình Transformers và ứng dụng trong xử lý ngôn ngữ tự nhiên
11 trang 53 0 0 -
Xây dựng Wordnet tiếng Việt tự động bằng ngữ liệu song ngữ
8 trang 43 0 0 -
Xây dựng bộ ngữ liệu đồng tham chiếu cho tiếng Việt
7 trang 41 0 0 -
Nhận dạng cử chỉ bàn tay dùng mạng nơ-ron chập
4 trang 41 0 0 -
Giáo trình Trí Tuệ Nhân Tạo - chapter 1
43 trang 40 0 0 -
Một ý kiến nhỏ về cách ghi dấu thanh trên văn bản tiếng Việt
3 trang 40 0 0 -
Sử dụng mạng nơ-ron đồ thị để phân tích cảm xúc cho bình luận
15 trang 39 0 0