Danh mục tài liệu

Nhận diện ngôn ngữ độc hại tiếng Việt

Số trang: 12      Loại file: pdf      Dung lượng: 1.39 MB      Lượt xem: 28      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết này đề xuất một giải pháp sử dụng sức mạnh của học sâu. Bằng cách đào tạo các mô hình học sâu để xác định các cụm từ độc hại, các mô hình của chúng tôi có thể nhận dạng các dạng ngôn ngữ không phù hợp khác nhau, bao gồm cả từ nhạy cảm và những từ có vẻ vô hại được sử dụng với mục đích gây hại.
Nội dung trích xuất từ tài liệu:
Nhận diện ngôn ngữ độc hại tiếng Việt TẠP CHÍ KHOA HỌC GIÁO DỤC KỸ THUẬT Trường Đại học Sư phạm Kỹ thuật Thành phố Hồ Chí Minh Website: https://jte.edu.vn ISSN: 1859-1272 Email: jte@hcmute.edu.vn Toxic Text Detection In Vietnamese Language Dong Tran, Minh Phuoc Huynh, Mai Thanh Nhat Van, Nhat Quang Tran, Minh Tan Le* Ho Chi Minh City University of Technology and Education, Vietnam *Corresponding author. Email: tanlm@hcmute.edu.vnARCTICAL INFO ABSTRACTReceived: 04/02/2024 The rapid growth of online platforms in recent years, such as social In recent years, the online world has seen an explosion of platforms for communicationRevised: 11/03/2024 and sharing. Social networks, forums, and countless websites have created aAccepted: 27/03/2024 vast and diverse online landscape. This abundance of content, while exciting, has also introduced new challenges, particularly when it comes to protectingPublished: 28/04/2024 children. The ease of access to the internet can expose them to potential risks,KEYWORDS such as encountering toxic language and online bullying. Traditional methods of mitigation, like blocking connections or restricting screen time, can beMachine Learning; cumbersome and may not be entirely effective. This paper proposes a novelNatural Language Processing; solution that leverages the power of deep learning. By training deep learning models to identify malicious phrases, our models can recognize various formsText Classification; of inappropriate language, including both sensitive words and seeminglyLong Short-Term Memory; harmless words used with harmful intent. This intelligent filtering system can be implemented on both the server-side and client-side of online platforms,Gated Recurrent Unit. offering a robust layer of protection for users as they navigate the digital world. Nhận Diện Ngôn Ngữ Độc Hại Tiếng Việt Trần Đông, Huỳnh Minh Phước, Văn Mai Thanh Nhật, Trần Nhật Quang, Lê Minh Tân * Trường Đại học Sư phạm Kỹ Thuật Thành phố Hồ Chí Minh, Việt Nam *Tác giả liên hệ. Email: tanlm@hcmute.edu.vnTHÔNG TIN BÀI BÁO TÓM TẮTNgày nhận bài: 04/02/2024 Trong những năm gần đây, thế giới trực tuyến đã chứng kiến sự bùng nổ của các nền tảng giao tiếp và chia sẻ. Mạng xã hội, diễn đàn và vô số trang webNgày hoàn thiện: 11/03/2024 đã tạo ra một không gian trực tuyến rộng lớn và đa dạng. Mặc dù sự phongNgày chấp nhận đăng: 27/03/2024 phú về nội dung này thú vị và có thể hữu ích, nhưng nó cũng mang đến những thách thức mới, đặc biệt là về vấn đề bảo vệ trẻ em. Việc dễ dàng truy cậpNgày đăng: 28/04/2024 internet có thể khiến trẻ em tiếp xúc với các rủi ro tiềm ẩn, chẳng hạn nhưTỪ KHÓA gặp phải ngôn ngữ độc hại và bắt nạt trực tuyến. Các phương pháp giảm thiểu truyền thống, chẳng hạn như chặn kết nối hoặc hạn chế thời gian sử dụng mànHọc máy; hình, có thể không thực sự hiệu quả. Bài báo này đề xuất một giải pháp sửXử lí ngôn ngữ tự nhiên; dụng sức mạnh của học sâu. Bằng cách đào tạo các mô hình học sâu để xác định các cụm từ độc hại, các mô hình của chúng tôi có thể nhận dạng cácPhân loại văn bản; dạng ngôn ngữ không phù hợp khác nhau, bao gồm cả từ nhạy cảm và nhữngBộ nhớ dài-ngắn hạn; từ có vẻ vô hại được sử dụng với mục đích gây hại. Hệ thống lọc thông minh này có thể được triển khai trên cả phía máy chủ và phía máy khách của cácBộ nhớ tái phát. nền tảng trực tuyến, cung cấp một lớp bảo vệ tốt hơn cho người dùng trong thế giới kỹ thuật số.Doi: https://doi.org/10.54644/jte.2024.1528Copyright © JTE. This is an open access article distributed under the terms and conditions of the Creative Commons Attribution-NonCommercial 4.0International License which permits unrestricted use, distribution, and reproduction in any medium for non-commercial purpose, provided the original work isproperly cited.1. Giới thiệu Sự phát triển nhanh chóng của các nền tảng trực tuyến những năm gần đây, như mạng xã hội, diễnđàn, và trang mạng, đã làm nội dung trên internet ngày càng phong phú v ...

Tài liệu có liên quan: