
Sử dụng mạng nơ-ron đồ thị để phân tích cảm xúc cho bình luận
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Sử dụng mạng nơ-ron đồ thị để phân tích cảm xúc cho bình luậnKỷ yếu Hội thảo khoa học Khoa Công nghệ thông tin, năm 2024 SỬ DỤNG MẠNG NƠ-RON ĐỒ THỊ ĐỂ PHÂN TÍCH CẢM XÚC CHO BÌNH LUẬN Huỳnh Thị Cẩm Dung1,*, Vũ Phú Lộc 1 Trần Khải Thiện2, Nguyễn Thị Bích Ngân3, Phạm Nguyễn Huy Phương4 1 Lớp cao học CNTT Khóa 01, Trường Đại học Công Thương Thành phố Hồ Chí Minh 2 Khoa CNTT, Trường Đại học Ngoại Ngữ - Tin Học Thành phố Hồ Chí Minh 3 Khoa Công nghệ Thông tin, Trường Đại học Công Thương Thành phố Hồ Chí Minh 4 Phòng Quản lý Sau Đại Học, Trường Đại học Công Thương Thành phố Hồ Chí Minh *Email: huynhthicamdung2906@gmail.com Ngày nhận bài: 07/04/2024; Ngày chấp nhận đăng: 20/05/2024 TÓM TẮT Hiện nay có nhiều bài toán trong thực tế mà dữ liệu khi ánh xạ qua đồ thị có cấu trúcphức tạp, không thuộc không gian Euclide, cũng không có hình thức cố định với kích thướcvà số chiều lớn. Chẳng hạn như: phát hiện thuốc giả, hệ thống thương mại điện tử cần pháthiện người bán, người mua sản phẩm độc hại, giải mã bộ gen hoặc khoa học vật liệu. Chínhvì vậy việc nghiên cứu và xây dựng các thuật toán xử lý dữ liệu đồ thị trở thành một chủ đềquan trọng trong phương pháp học sâu và học máy truyền thống. Trong bài báo này, chúngtôi nghiên cứu mô hình Graph neural networks (GNN) trong học sâu (deep learning) áp dụngtrên dữ liệu đồ thị để phân loại văn bản Tiếng Anh ứng dụng trong bài toán phân lớp bănbản. Kết quả thực nghiệm trên bộ dữ liệu Movie Reviews1 đã đạt đến độ chính xác lên đến76,468% so với một số mô hình học sâu khác trong bài toán phân lớp văn bản được trình bàytrong nghiên cứu. Từ khoá: Học sâu, Máy học, Phân lại văn bản, Xử lý ngôn ngữ tự nhiên, Mạng nơ-ron,Deep Learning, Machine Learning, Natural language processing, Graph neural network,Graph convolutional network, Text classification. 1. GIỚI THIỆU Hiện nay dữ liệu đồ thị trở thành một phần không thể thiếu và áp dụng nhiều trong cáclĩnh vực như: thị giác máy tính, nhận dạng mẫu, phân tích hình ảnh, xử lý ngôn ngữ tự nhiên,… Gần đây dữ liệu đồ thị còn được sử dụng để dự đoán cấu trúc phân tử protein bậc 3 và 4.Việc này có ý nghĩa quan trọng trong việc tìm ra các chất mới có khả năng tương tác sinhhọc ở mức độ phân tử và tế bào[1]. Sự đặc biệt của đồ thị là không giới hạn về kích thướchay số chiều nên việc khai thác tiềm năng của deep learning trên dữ liệu đồ thị trở thành xuhướng mà các nhà nghiên cứu hướng tới. Tương tự trong các bài toán phân loại văn bản, cónhiều phương pháp phân loại phổ biến được sử dụng trong lĩnh vực học máy và xử lý ngônngữ tự nhiên (Natural language processing - NLP) như: Cây quyết định, Support VectorMachines (SVM), Logistic Regression, và Neural Networks trong đó có mô hình Graph1 https://www.cs.cornell.edu/people/pabo/movie-review-data 238Huỳnh Thị Cẩm Dung và CSNeural Networks,…. Cây quyết định, Support Vector Machines (SVM), và LogisticRegression là những mô hình phân loại truyền thống trong học máy, trong khi NeuralNetworks (NN) là một mô hình phân loại dựa trên mạng nơ-ron [1]. Sự khác biệt giữa cácmô hình này dẫn đến hiệu suất khác nhau trong việc phân loại dữ liệu. Đối với với mạng nơ-ron thì có khả năng học và trích xuất các đặc trưng từ dữ liệu một cách tự động thông quaviệc học sâu, trong khi các mô hình truyền thống thường yêu cầu việc trích xuất đặc trưngthủ công. Ngoài ra mạng nơ-ron có thể được xây dựng và tinh chỉnh dễ dàng để phù hợp vớinhiều loại dữ liệu và bài toán khác nhau. Nó có thể kết hợp với các lớp và kiến trúc khácnhau để cải thiện hiệu suất. Graph Neural Networks (GNNs) là mô hình mạng nơ-ron có giám sát. Mỗi nơ-ron trongGNN tương ứng với một nút trong đồ thị, các nơ-ron được kết nối với nhau theo cách kết nốicủa các nút trong đồ thị. Nên GNN hiệu quả trong việc xử lý và phân tích cấu trúc phức tạpvà mối quan hệ trong dữ liệu đồ thị, bởi vì nó có khả năng cập nhật trạng thái của mỗi nútdựa trên trạng thái của các nút liên kết với nó. Chính vì vậy trong bài này chúng tôi tiếp cậnviệc tìm hiểu, giới thiệu các khía cạnh của GNN, nghiên cứu về sức mạnh biểu đạt và tínhlinh hoạt của GNN cũng như khám phá cách chúng có thể thay đổi cách chúng ta hiểu và xửlý dữ liệu đồ thị trong tương lai, đề xuất và xây dựng ứng dụng phân loại văn bản tiếng Anháp dụng với mạng neuron đồ thị [1]. 2. KIẾN THỨC NỀN TẢNG2.1 Tổng quan phương pháp Trong bài nghiên cứu chúng tôi sẽ áp dụng mô hình Graph Neural Network để phânloại cảm xúc trong tập dữ liệu Movie Reviews [2], đây là một nguồn dữ liệu gồm các bìnhluận bằng tiếng Anh phổ biến trong lĩnh vực xử lý ngôn ngữ tự nhiên và học máy, được tổnghợp bởi Pang và Lee vào năm 2005. Đầu vào của mô hình GNN là các đánh giá và nhận xéttừ người dùng về các bộ phim, với mục tiêu là phân loại chúng thành hai loại cảm xúc chính:tích cực (Positive) và tiêu cực (Negative). Đồng thời chúng tôi sẽ tiến hành so sánh kết quảthực nghiệm GNN với các phương pháp phân loại văn bản phổ biến khác, từ đó rút ra các kếtluận.2.2 Cấu trúc mô hình mạng2.2.1. Graph convolutional network(GCN) Mạng GCN (Graph Convolutional Network) là một dạng của mạng nơ-ron sử dụng đểxử lý dữ liệu đồ thị, cho phép nó hiểu và khai thác thông tin phức tạp và mối quan hệ trongdữ liệu đồ thị, từ đó nâng cao hiệu suất và độ chính xác của các ứng dụng liên quan đến họcsâu và trí tuệ nhân tạo. GCN được thiết kế để học cấu trúc và thông tin trong dữ liệu đồ thịbằng cách áp dụng phép tích chập (convolution) trên đồ thị. Đầu vào của GCN là một đặctrưng đỉnh ...
Tìm kiếm theo từ khóa liên quan:
Kỷ yếu Hội thảo khoa học Công nghệ thông tin Mạng nơ-ron đồ thị Phân tích cảm xúc Cảm xúc bình luận Mô hình Graph neural networks Xử lý ngôn ngữ tự nhiênTài liệu có liên quan:
-
52 trang 464 1 0
-
Top 10 mẹo 'đơn giản nhưng hữu ích' trong nhiếp ảnh
11 trang 363 0 0 -
12 trang 337 0 0
-
Yếu tố nhận diện người thứ ba ngay tình trong giao dịch dân sự
11 trang 336 0 0 -
96 trang 332 0 0
-
74 trang 328 0 0
-
Đồ án tốt nghiệp: Xây dựng ứng dụng di động android quản lý khách hàng cắt tóc
81 trang 318 0 0 -
Tài liệu dạy học môn Tin học trong chương trình đào tạo trình độ cao đẳng
348 trang 317 1 0 -
Báo cáo thực tập thực tế: Nghiên cứu và xây dựng website bằng Wordpress
24 trang 303 0 0 -
Tài liệu hướng dẫn sử dụng thư điện tử tài nguyên và môi trường
72 trang 299 0 0 -
EBay - Internet và câu chuyện thần kỳ: Phần 1
143 trang 292 0 0 -
64 trang 289 0 0
-
Phương pháp tạo ra văn bản tiếng Việt có đề tài xác định
7 trang 283 0 0 -
Cách tính nhanh giá trị riêng của ma trận vuông cấp 2 và cấp 3
4 trang 283 0 0 -
197 trang 282 0 0
-
Bài giảng An toàn và bảo mật thông tin - Trường đại học Thương Mại
31 trang 271 0 0 -
Một số vấn đề về chuyển đổi số và ứng dụng trong doanh nghiệp
11 trang 268 0 0 -
47 trang 259 0 0
-
LUẬN VĂN: TÌM HIỂU PHƯƠNG PHÁP HỌC TÍCH CỰC VÀ ỨNG DỤNG CHO BÀI TOÁN LỌC THƯ RÁC
65 trang 259 0 0 -
Giáo trình Hệ điều hành: Phần 2
53 trang 253 0 0