Danh mục tài liệu

Tóm tắt Luận án tiến sĩ Khoa học máy tính: Khai phá và phân tích quan điểm người dùng trên mạng internet

Số trang: 27      Loại file: pdf      Dung lượng: 469.56 KB      Lượt xem: 11      Lượt tải: 0    
Xem trước 3 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Mục tiêu của luận án là đề xuất mô hình mạng nơ-ron xác định hạng và trọng số khía cạnh ẩn sản phẩm/dịch vụ. Sử dụng các véc-tơ biểu diễn khía cạnh được học từ mô hình véc-tơ Paragraph làm đầu vào. Đề xuất mô hình mạng nơ-ron xác định trọng số khía cạnh chung của sản phẩm/dịch vụ.
Nội dung trích xuất từ tài liệu:
Tóm tắt Luận án tiến sĩ Khoa học máy tính: Khai phá và phân tích quan điểm người dùng trên mạng internet ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ ——————— PHẠM ĐỨC HỒNG KHAI PHÁ VÀ PHÂN TÍCH QUAN ĐIỂM NGƯỜI DÙNG TRÊN MẠNG INTERNETChuyên ngành: Khoa học máy tínhMã số: 62 48 01 01 TÓM TẮT LUẬN ÁN Hà Nội - 2018 Công trình được hoàn thành tại: Trường Đại học Công nghệ, Đại học QuốcGia Hà Nội. Người hướng dẫn khoa học: PGS.TS. Lê Anh Cường Phản biện 1: Phản biện 2: Phản biện 3: Luận án đã được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận ántiến sĩ họp tại Trường Đại học Công nghệ, Đại học Quốc Gia Hà Nội vào hồi ...giờ ngày ... tháng ... năm 2018. Có thể tìm hiểu luận án tại: - Thư viện Quốc gia Việt Nam - Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà NộiChương 1Tổng quan1.1 Giới thiệu Trong khoảng 15 năm trở lại đây, cùng với sự phát triển của công nghệ Web2.0, các hệ thống thương mại trực tuyến phát triển rất nhanh, tiêu biểu như hệthống Amazon1 , Yelp2 , Tripadvisor3 và Thegioididong4 . Đặc điểm chung của cáchệ thống thương mại là cho phép các khách hàng có thể đặt/mua hàng trực tuyếnnhững sản phẩm mà họ yêu thích. Ngoài ra, các hệ thống cũng cho phép họ thểhiện ý kiến đánh giá về những sản phẩm mà họ quan tâm thông qua hệ thống.Những ý kiến đánh giá này là phần quan trọng của mỗi hệ thống, bởi nó cung cấpthông tin tới các nhà quản lý hệ thống thương mại cũng như với các khách hàngkhác, giúp họ có sự hiểu biết nhất định về sản phẩm hay dịch vụ của hệ thống.Hình 1.1 là ví dụ ý kiến đánh giá của sản phẩm iPhone X 64GB trên hệ thốngwww.thegioididong.com. Nhằm hỗ trợ các hệ thống thương mại cung cấp thôngtin hiệu quả tới người quản lý và khách hàng, một lĩnh vực mới của chuyên ngànhxử lý ngôn ngữ tự nhiên đã ra đời trong giai đoạn này là “Khai phá và phân tíchquan điểm”. Khai phá và phân tích quan điểm người dùng là nghiên cứu tính toán các quanđiểm, đánh giá, thái độ và cảm xúc của con người đối với các thực thể và các khíacạnh của thực thể. Thực thể thông thường đề cập tới các sản phẩm, dịch vụ vàcác tổ chức riêng biệt, v.v. Các khía cạnh là các thuộc tính hoặc các thành phầncủa các thực thể. Ví dụ trong Hình 1 là các ý kiến khách hàng thảo luận về thựcthể “iPhone X 64GB” với các khía cạnh là “Hệ điều hành”, “ Loa nghe”, và “Pin”. Các bài toán phân tích quan điểm được thực hiện ở ba mức độ là mức văn bản, 1 www.amazon.com 2 www.yelp.com 3 www.tripadvisor.com 4 www.thegioididong.com 1 Hình 1.1: Ví dụ các ý kiến đánh giá sản phẩm iPhone X 64GBmức câu, và mức khía cạnh. Trong đó, phân tích quan điểm mức văn bản là bàitoán được nghiên cứu sớm và rộng rãi nhất (Pang và các cộng sự, 2002). Bài toánphân loại một văn bản đánh giá sản phẩm/dịch vụ bằng cách đưa ra quan điểmtổng thể là tích cực hay tiêu cực. Xem xét toàn bộ tài liệu như là một đơn vị thôngtin cơ bản và nó giả thiết rằng tài liệu được biết là có quan điểm. Ở mức câu, việcphân loại quan điểm được áp dụng cho từng câu trong một tài liệu (Ellen và cáccộng sự, 2005). Tuy nhiên, không phải bất kỳ câu nào trong văn bản đánh giá cũngcó quan điểm. Do đó, nhiều nghiên cứu thực hiện bài toán xác định câu có thểhiện quan điểm của người dùng trước (Mihalcea và các cộng sự, 2007). Các câu cóquan điểm xác định được sau đó được phân loại là câu thể hiện ý kiến quan điểmtích cực hoặc tiêu cực. Mặc dù việc khai thác ý kiến ở mức văn bản và mức câu rất hữu ích trongnhiều trường hợp, nhưng chúng ta vẫn còn nhiều điều mong muốn hơn. Một vănbản đánh giá tích cực về một thực thể cụ thể không có nghĩa là người dùng có ýkiến tích cực về mọi khía cạnh của thực thể. Tương tự, một văn bản đánh giá tiêucực cho một thực thể không có nghĩa là người dùng không thích tất cả mọi khíacạnh của thực thể đó. Ví dụ, trong một bài đánh giá sản phẩm, người đánh giáthường ghi cả khía cạnh tích cực và tiêu cực của sản phẩm, mặc dù quan điểmchung về sản phẩm có thể là tích cực hoặc tiêu cực. Để có được nhiều phân tíchý kiến tốt hơn, chúng ta cần phải nghiên cứu sâu về khía cạnh. Ý tưởng này dẫnđến việc khai thác ý kiến dựa trên khía cạnh, nó lần đầu tiên được gọi là khai phávà phân tích quan điểm theo khía cạnh trong công trình nghiên cứu của Hu và cáccộng sự (2004). 21.2 Một số khái niệm và bài toán cơ bản trong phân tích quan điểm theo khía cạnh1.2.1 Một số khái niệm1.2.2 Một số bài toán1.3 Các nghiên cứu liên quan1.4 Tình hình nghiên cứu hiện nay Trong những năm gần đây một số mô hình học biểu diễn đã đạt được nhiều kếtquả xuất sắc trong lĩnh vực xử lý ngôn ngữ tự nhiên. Các mô hình học biểu diễnđã được đề xuất với các mức, như mức từ, mức câu, mức đoạn văn và mức cả vănbản. Học biểu diễn (representation learning) hay còn gọi là học đặc trưng (featurelearning)(Bengio và các cộng sự, 2014) là một lĩnh vực của học máy. Hầu hết cáckỹ thuật học biểu diễn được xây dựng dựa trên mô hình mạng nơ-ron với nhiềutầng ẩn và làm việc thực hiện thông qua các hàm chuyển phi tuyến như hàm tanh,sigmod. Lĩnh vực xử lý tín hiệu và nhận dạng tiếng nói là lĩnh vực áp dụng kỹthuật học biểu diễn sớm nhất (Bengio và các cộng sự, 1993), tiếp đến là lĩnh vựcphân loại ảnh (Hinton và các cộng sự, 2006). Trong lĩnh vực xử lý ngôn ngữ tựnhiên, học biểu diễn được giới thiệu lần đầu vào năm 1986 bởi Hinton và các cộngsự và được phát triển vào năm 2003 với mô hình mạng nơ-ron ngôn ngữ của Bengiovà các cộng sự. Tuy nhiên sự bùng nổ các kỹ thuật học biểu diễn cho lĩnh vực xửlý ngôn ngữ tự nhiên được bắt đầu từ năm 2013 đến nay. Một số mô hình tiêubiểu, học biểu diễn mức từ như Word2Vec (Mikolov và các cộng sự, 2013) và Glove(Penning ...

Tài liệu được xem nhiều:

Tài liệu có liên quan: