Danh mục tài liệu

Đề xuất thuật toán khuyến nghị theo phân bố dựa trên mô hình hỗn hợp Gaussian

Số trang: 12      Loại file: pdf      Dung lượng: 1.91 MB      Lượt xem: 12      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết thực hiện một hệ thống sử dụng chủ yếu những tính chất đặc trưng của sản phẩm của các trang thương mại điện tử để đưa ra được hệ thống khuyến nghị với độ chính xác cao và hiệu năng tốt nhất.
Nội dung trích xuất từ tài liệu:
Đề xuất thuật toán khuyến nghị theo phân bố dựa trên mô hình hỗn hợp Gaussian 1 ĐỀ XUẤT THUẬT TOÁN KHUYẾN NGHỊ THEO PHÂN BỐ DỰA TRÊN MÔ HÌNH HỖN HỢP GAUSSIAN Nguyễn Văn Đạt∗ , Tạ Minh Thanh‡† ∗ Sun* Inc., 13F Keangnam 72 Tower, Plot E6, Phạm Hùng, Nam Từ Liêm, Hà Nội † Học Viện Kỹ Thuật Quân Sự, 239 Hoàng Quốc Việt, Cầu Giấy, Hà Nội Tóm tắt—Ngày nay, các hệ thống khuyến nghị phân phối, Gaussian Mixture Model - GMM, Gaus- được tích hợp vào hầu hết các trang thương mai sianFilter Function, Collaborative Filtering. điện tử giúp tăng cường năng suất bán hàng cho các doanh nghiệp bằng cách hỗ trợ người tiêu dùng tìm được những sản phẩm phù hợp, chất lượng nhất. I. MỞ ĐẦU Hiện nay, có khá nhiều thuật toán khuyến nghị tốt A. Tổng quan và hiệu quả, tuy nhiên, thuật toán content-based recommendation vẫn là thuật toán phổ biến nhất Với sự phổ biến của mạng Internet trong những được sử dụng trong giai đoạn đầu của các dự án. năm gần đây, công nghệ đã mang lại những cơ Trong một số trường hợp, độ chính xác của kết hội rất lớn phục vụ tự động hoá đến cuộc sống quả từ thuật toán content-based vẫn là một điều lo của con người. Mặt khác, sự đa dạng và dư thừa ngại khi bài toán liên quan đến độ tương tự về phân thông tin, nội dung trên các website, thư viện số phối giữa các thành phần. Thêm nữa, các phương là yếu tố dẫn đến sự ngày càng khó khăn trong pháp để đo độ tương đồng cũng là một vấn đề quan việc tìm kiếm thông tin thực sự cần thiết cho mỗi trọng ảnh hưởng đến độ chính xác của các thuật nhu cầu cá nhân [7, 11, 2]. Hệ thống khuyến nghị toán content-based trong các bài toán về độ tương đồng giữa các phân phối. Để giải quyết hai vấn đề (Recommendation systems) là một giải pháp hiệu này, chúng tôi đề xuất một thuật toán content-based quả để giải quyết vấn đề này mà không cần người mới dựa trên mô hình hỗn hợp gaussian giúp tăng dùng cung cấp các yêu cầu cụ thể [31, 33]. Thay độ chính xác cho kết quả đầu ra. Mô hình đề xuất vào đó, các hệ thống khuyến nghị có thể phân tích được thực nghiệm trên một bộ dữ liệu về rượu bao nội dung các thuộc tính của các sản phẩm, đối gồm 6 chỉ số về mùi vị, dữ liệu tag mô tả về vị của tượng để có thể tự động gợi ý ra những thông tin rượu và một số trường thông tin khác. Thuật toán làm hài lòng những nhu cầu và sở thích của người này sẽ gom n bản ghi dựa trên n vectors 6 chiều dùng [17, 15]. Kiến trúc chung cho các thuật toán thành k nhóm (k < n) trước khi áp dụng một công content-based (CB) được hiển thị trong hình 1. thức để sắp xếp các kết quả trả về. So sánh kết quả mô hình đề xuất với 2 thuật toán phổ biến khác Ngày nay, làm thế nào để xây dựng và thiết kế trên bộ dữ liệu trên, kết quả thực nghiệm thu được một thuật toán khuyến nghị đã trở thành các chủ không chỉ đạt được độ chính xác tốt hơn, mà thời đề tập trung cần được nghiên cứu. gian thực thi của mô hình cũng vượt qua điều kiện Thuật toán content-base trong hệ thống khuyến cho việc áp dụng vào các ứng dụng thực tế. nghị được sử dụng rộng rãi bởi tính đơn giản Từ khóa—Hệ thống khuyến nghị, Content-Based, và hiệu quả của nó trong thời kỳ đầu của bất mô hình hỗn hợp gaussian, hệ thống khuyến nghị kỳ dự án nào. Theo Pasquale Lops et. al. [14] trong Chương 3 “Content-based recommendation Tác giả liên hệ: Nguyễn Văn Đạt, Email: system: State of the Art and Trends đã nhấn nguyen.van.dat@sun-asterisk.com. mạng rằng có rất nhiều lợi ích thu được từ các thuật toán content-based so với các thuật toán Đến tòa soạn: 04/2020, chỉnh sửa: 7/2020, chấp nhận đăng: 07/2020. cùng loại là Collaborative Filtering (CF) như là: ‡ Corresponding author tính độc lập giữa người dùng, minh bạch, vấnSỐ 02 (CS.01) 2020 TẠP CHÍ KHOA HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG 61Đề xuất thuật toán khuyến nghị theo phân bố dựa trên mô hình hỗn hợp Gaussian cột so sánh sự khác nhau giữa 6 thuộc tính của hai sản phẩm (1 sản phẩm gốc (màu lam), 1 sản phẩm được gợi ý (màu cam)) được trả về bằng việc sử dụng công thức sắp xếp khoảng cách (biểu đồ trên) và phân phối (biểu đồ dưới). Các bài toán khuyến nghị dựa trên xác xuất phân phối của các thuộc tính không thể được giải quyết bằng những phương pháp thông thường. Một điều khó khăn nữa, các nội dung mô tả sản phẩm đôi khi là không đáng tin cậy, không đầy đủ, không chính xác gây ra ...

Tài liệu được xem nhiều:

Tài liệu có liên quan: