Danh mục

Xây dựng các cặp câu hỏi - câu trả lời chất lượng cao từ các trang Web hỏi đáp cộng đồng

Số trang: 9      Loại file: pdf      Dung lượng: 0.00 B      Lượt xem: 125      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Trong nghiên cứu này chúng tôi sử dụng tiếp cận học máy nhằm xây dựng các cặp câu hỏi - câu trả lời chất lượng cao từ các trang web hỏi đáp cộng đồng. Các cặp câu hỏi - câu trả lời này sẽ được sử dụng làm nguồn dữ liệu cho các hệ thống hỏi đáp tự động.
Nội dung trích xuất từ tài liệu:
Xây dựng các cặp câu hỏi - câu trả lời chất lượng cao từ các trang Web hỏi đáp cộng đồng Nguyễn Văn Tú, Lê Anh Cường, Nguyễn Hà Nam<br /> <br /> <br /> <br /> <br /> XÂY DỰNG CÁC CẶP CÂU HỎI - CÂU TRẢ LỜI CHẤT LƯỢNG CAO<br /> TỪ CÁC TRANG WEB HỎI ĐÁP CỘNG ĐỒNG<br /> <br /> Nguyễn Văn Tú1, Lê Anh Cường2, Nguyễn Hà Nam3<br /> 1<br /> Trường Đại học Tây Bắc<br /> 2<br /> Trường Đại học Tôn Đức Thắng<br /> 3<br /> Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội<br /> <br /> <br /> Tóm tắt: Các trang web hỏi đáp cộng đồng có chứa các tài liệu liên quan. Các đánh giá nổi tiếng nhất<br /> một lượng lớn thông tin hỏi - đáp có giá trị sinh về nhiệm vụ hỏi - đáp factoid là hội nghị truy hồi<br /> ra bởi những người sử dụng. Trong các trang web văn bản (Text REtrieval Conference-TREC). Các<br /> hỏi đáp cộng đồng, người dùng có thể gửi các câu câu hỏi và câu trả lời được phát hành bởi TREC<br /> hỏi, trả lời các câu hỏi của người khác, và cung cấp đã trở thành nguồn dữ liệu quan trọng cho các nhà<br /> thông tin phản hồi cho những câu hỏi/câu trả lời. nghiên cứu trong việc nghiên cứu xây dựng các hệ<br /> Trong nghiên cứu này chúng tôi sử dụng tiếp cận thống hỏi đáp tự động [1]. Tuy nhiên, khi phải đối<br /> học máy nhằm xây dựng các cặp câu hỏi - câu trả mặt với các câu hỏi non-factoid như các câu hỏi về<br /> lời chất lượng cao từ các trang web hỏi đáp cộng lý do tại sao, như thế nào, hoặc những gì về… hầu<br /> đồng. Các cặp câu hỏi - câu trả lời này sẽ được sử như không có hệ thống hỏi đáp tự động nào làm<br /> dụng làm nguồn dữ liệu cho các hệ thống hỏi đáp việc tốt.<br /> tự động. Chúng tôi thực hiện trích rút những đặc<br /> trưng quan trọng từ mỗi luồng hỏi đáp cũng như Các cặp câu hỏi - câu trả lời do người dùng tạo ra<br /> thông tin của người gửi câu trả lời và xây dựng mô chắc chắn sẽ rất quan trọng để giải quyết vấn đề<br /> hình phân loại để xác định được các cặp câu hỏi trả lời các câu hỏi non-factoid. Rõ ràng, những cặp<br /> - câu trả lời có ý nghĩa. Các kết quả thực nghiệm câu hỏi - câu trả lời tự nhiên thường được tạo ra<br /> trên bộ dữ liệu cung cấp bởi SemEval 2015 cho trong quá trình giao tiếp của con người thông qua<br /> thấy những đề xuất của chúng tôi sẽ mang lại kết phương tiện truyền thông xã hội Internet, trong đó<br /> quả cao. chúng tôi đặc biệt quan tâm tới các trang web hỏi<br /> đáp dựa vào cộng đồng. Các trang web hỏi đáp dựa<br /> Từ khóa: Hỏi đáp cộng đồng, phân loại, Support vào cộng đồng cung cấp nền tảng mà ở đó người<br /> Vector Machines, hệ thống hỏi đáp tự động.1 dùng có thể đặt câu hỏi, cung cấp câu trả lời và<br /> các thông tin phản hồi (ví dụ, bằng cách biểu quyết<br /> hoặc cho ý kiến) cho những câu hỏi/câu trả lời và<br /> I. TỔNG QUAN<br /> câu trả lời tốt nhất sẽ được lựa chọn để hiển thị cho<br /> Trong lĩnh vực xử lý ngôn ngữ tự nhiên và truy xuất người dùng.<br /> thông tin, vấn đề hỏi - đáp đã thu hút nhiều sự chú<br /> ý trong những năm qua. Tuy nhiên, các nghiên cứu Trong bài báo này, chúng tôi sử dụng tiếp cận học<br /> về hỏi - đáp chủ yếu tập trung vào việc tìm câu trả máy nhằm xây dựng các cặp câu hỏi - câu trả lời<br /> lời chính xác cho câu hỏi factoid được đưa ra trong có chất lượng cao từ các dữ liệu hỏi đáp thu thập<br /> từ các trang web hỏi đáp cộng đồng. Các cặp câu<br /> Tác giả liên hệ: Nguyễn Văn Tú<br /> hỏi - câu trả lời này có thể được sử dụng làm nguồn<br /> Email: tuspttb@gmail.com dữ liệu cho các hệ thống hỏi đáp tự động. Để xây<br /> Đến tòa soạn: 25/10/2016, chỉnh sửa: 28/12/2016, dựng các cặp câu hỏi - câu trả lời chất lượng từ các<br /> chấp nhận đăng: 1/1/2017 trang web hỏi đáp cộng đồng, trong bài báo này<br /> <br /> <br /> Số 3 - 4 (CS.01) 2016<br /> Tạp chí KHOA HỌC CÔNG NGHỆ 25<br /> THÔNG TIN VÀ TRUYỀN THÔNG<br /> XÂY DỰNG CÁC CẶP CÂU HỎI - CÂU TRẢ LỜI CHẤT LƯỢNG CAO TỪ CÁC TRANG WEB...<br /> <br /> chúng tôi đề xuất sử dụng sự kết hợp của nhiều loại Các nghiên cứu gần đây trong việc đánh giá chất<br /> đặc trưng quan trọng trích rút từ mỗi luồng hỏi đáp lượng của các câu trả lời cung cấp bởi các trang<br /> cũng như thông tin của người gửi câu trả lời và xây web hỏi đáp cộng đồng thường thông qua các đặc<br /> dựng mô hình phân loại để xác định được các cặp trưng biểu diễn văn bản của câu hỏi - câu trả lời<br /> câu hỏi - câu trả lời có ý nghĩa. như là độ dài của câu hỏi, độ dài của câu trả lời,<br /> tỷ lệ độ dài giữa câu hỏi và các câu trả lời của nó,<br /> Để thực hiệ ...

Tài liệu được xem nhiều:

Tài liệu có liên quan: