
Xây dựng hệ thống thông tin tra cứu từ điển chuyên ngành có ngữ cảnh
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Xây dựng hệ thống thông tin tra cứu từ điển chuyên ngành có ngữ cảnh Science & Technology Development, Vol 18, No Q3 - 2015<br /> XÂY DỰNG HỆ THỐNG THÔNG TIN TRA CỨU TỪ ĐIỂN CHUYÊN NGÀNH CÓ<br /> NGỮ CẢNH<br /> BUILDING A INFORMATION SYSTEM FOR LOOKING UP CONTEXTUAL TECHNICAL<br /> DICTIONARY<br /> Hồ Trung Thành, Trần Thị Ánh<br /> Trường Đại học Kinh tế - Luật, ĐHQG HCM - Email: thanhht@uel.edu.vn<br /> Nguyễn Khánh Hoà<br /> Trường Đại học RMIT<br /> (Bài báo nhận ngày 28 tháng 07 năm 2015, hoàn chỉnh sửa chữa ngày 12 tháng 09 năm 2015)<br /> <br /> TÓM TẮT<br /> Ngữ cảnh của từ điển chuyên ngành là rất quan trọng. Ngữ cảnh là một phần thông tin bằng văn bản<br /> giúp cho người tra từ hiểu rõ nội dung ý nghĩa của từ khoá nhằm giúp việc sử dụng từ đúng vào từng<br /> trường hợp cụ thể trong văn bản chuyên ngành, đặc biệt là trong học tập, nghiên cứu. Tuy nhiên, các hệ<br /> thống tra cứu từ hiện tại thường tập trung hỗ trợ tra cứu từ và giải thích từ mà chưa quan tâm đến ngữ<br /> cảnh của từ. Khi có được ngữ cảnh của từ, câu hỏi đặt ra là làm thế nào để có thể tìm kiếm được chính<br /> xác ngữ cảnh hoặc hiển thị kết quả tìm kiếm gợi ý có liên quan đến từ khoá trong kho dữ liệu văn bản<br /> ngữ cảnh? Trong bài báo này, chúng tôi đề xuất xây dựng phương pháp và mô hình tra từ điển chuyên<br /> ngành có ngữ cảnh trên cơ sở phân tích, đánh giá và lựa chọn giải thuật tối ưu trong các phương pháp<br /> so khớp văn bản. Sau đó, chúng tôi áp dụng giải thuật vào kỹ thuật tra từ của hệ thống. Tích hợp mô<br /> hình đề xuất trên hệ thống website và thực nghiệm trên 1500 từ chuyên ngành cùng với ngữ cảnh thuộc<br /> lĩnh vực Hệ thống thông tin quản lý và Thương mại điện tử. Hệ thống có thể hỗ trợ cùng lúc việc tra từ<br /> điển bằng tiếng Anh và tiếng Việt.<br /> Từ khoá: Giải thuật so khớp mẫu, hệ thống thông tin, từ điển, chuyên ngành, ngữ cảnh.<br /> ABSTRACT<br /> The context of technical terms is very important. It is part of information in text which supports users in<br /> understanding the exact meaning of technical terms in particular specialized circumstances, especially<br /> in education and research. However, most of current dictionary systems only focus on the lookup<br /> function and the standard meaning of terms without considering related contexts. In this paper, we<br /> proposed the model for searching technical terms and context of terms based on analyzing, evaluating<br /> and choosing an optimal algorithm in pattern matching technique. Then, the model was integrated on a<br /> dictionary system and experimented on 1500 terms in the context of information system and electronic<br /> commerce. This dictionary system supports searching with technical terms both in Vietnamese and<br /> English.<br /> Keywords: Pattern - matching algorithm, information system, dictionary, technical term, context.<br /> <br /> 1. GIỚI THIỆU<br /> Dựa trên nền tảng phát triển Internet, hiện<br /> nay có rất nhiều công cụ hỗ trợ việc tra cứu<br /> <br /> Trang 82<br /> <br /> nghĩa của từ tiếng Anh và nhiều ngôn ngữ<br /> khác. Tại Việt Nam, có thể dễ dàng tìm thấy<br /> nhiều sách từ điển Anh - Việt được xuất bản,<br /> <br /> TẠP CHÍ PHÁT TRIỂN KH & CN, TẬP 18, SỐ Q3 - 2015<br /> các phần mềm tra cứu như Lạc Việt1, hay nhiều<br /> website hỗ trợ tra cứu online như: Vdict2,<br /> Google<br /> translate3,<br /> tratu.soha4,<br /> oxford<br /> 5<br /> 6<br /> dictionaries.com , Dictionary.com … Các<br /> website này có thể cung cấp đầy đủ từ điển mà<br /> người dùng cần. Đa phần các website đều có<br /> cấu trúc tương đối giống nhau với giao diện<br /> thân thiện, dễ sử dụng. Các hệ thống website<br /> này hỗ trợ tra cứu trên nhiều bộ từ điển như:<br /> Anh - Việt, Việt - Anh, Anh - Anh và một số<br /> ngôn ngữ khác như: Trung Quốc, Nhật, Pháp…<br /> Các hệ thống website từ điển hầu hết đều hỗ trợ<br /> dịch nghĩa của một từ và cả đoạn văn dài.<br /> Người dùng có thể truy cập vào hệ thống, thực<br /> hiện tra từ và hệ thống sẽ cung cấp một danh<br /> sách các nghĩa của từ, kể cả từ đồng nghĩa, từ<br /> liên quan,... Trong số các website tra từ điển<br /> tác giả đã khảo sát trên, trong đó một số<br /> website cho phép tra cứu từ chuyên ngành như<br /> thefreedictionary.com, whatis.techtarget.com,<br /> cambridge.org7… Các website này có công cụ<br /> lọc theo từng lĩnh vực chuyên ngành cụ thể.<br /> Trong đó, whatis.techtarget.com là một website<br /> hỗ trợ tra cứu và cho kết quả là định nghĩa các<br /> từ liên quan đến kỹ thuật và công nghệ;<br /> tudienthuoc.net8 và ykhoanet.com là các<br /> website từ điển chuyên ngành về thuốc, y khoa;<br /> latin-phrases.co.uk/9 là từ điển về câu thành<br /> ngữ; fetp, tratu.soha là các website hỗ trợ tra từ<br /> chuyên<br /> ngành<br /> về<br /> kinh<br /> tế;<br /> www.lawyerintl.com/law-dictionary10 chuyên<br /> về lĩnh vực luật học; và một số website như<br /> tratu.soha, Vdict,.. hỗ trợ tra từ thuộc nhiều<br /> lĩnh vực như tin học, kinh tế, luật,… Tuy<br /> <br /> 1<br /> <br /> http://tratu.coviet.vn/<br /> http://vdict.com/<br /> 3<br /> https://translate.google.com.vn/?hl=vi&tab=wT&authuser<br /> =0<br /> 4<br /> http://tratu.soha.vn/<br /> 5<br /> http://www.oxforddictionaries.com/<br /> 6<br /> http://dictionary.reference.com/<br /> 7<br /> http://dictionary.cambridg ...
Tìm kiếm theo từ khóa liên quan:
Tạp chí khoa học Giải thuật so khớp mẫu Hệ thống thông tin Từ điển chuyên ngành có ngữ cảnh Thương mại điện tửTài liệu có liên quan:
-
6 trang 932 0 0
-
Nghiên cứu sự hài lòng của sinh viên Hutech khi sử dụng ví điện tử Momo
6 trang 580 10 0 -
Bài giảng Quản trị tác nghiệp thương mại điện tử - PGS.TS Nguyễn Văn Minh
249 trang 554 10 0 -
Nghiên cứu sự hài lòng của sinh viên Hutech khi mua sắm tại cửa hàng GS25 tại Ung Văn Khiêm Campus
6 trang 532 9 0 -
6 trang 504 7 0
-
Giáo trình Thương mại điện tử căn bản: Phần 1 - PGS.TS. Nguyễn Văn Minh (Chủ biên)
188 trang 451 4 0 -
Giáo trình Thương mại điện tử: Phần 1 - TS. Ao Thu Hoài
102 trang 445 7 0 -
5 trang 387 1 0
-
7 trang 370 2 0
-
Bài tập thực hành môn Phân tích thiết kế hệ thống thông tin
6 trang 355 0 0 -
Giáo trình Thương mại điện tử căn bản: Phần 1 - TS. Trần Văn Hòe
181 trang 334 6 0 -
6 trang 325 0 0
-
Vấn đề bảo đảm chất lượng hàng hoá trong giao dịch qua sàn thương mại điện tử
10 trang 321 0 0 -
Bộ câu hỏi trắc nghiệm môn Thương mại điện tử (Có đáp án)
26 trang 309 2 0 -
Bài giảng Thanh toán điện tử: Chương 1 - ĐH Thương Mại
32 trang 304 4 0 -
Bài thuyết trình Hệ thống thông tin trong bệnh viện
44 trang 289 0 0 -
Thống kê tiền tệ theo tiêu chuẩn quốc tế và thực trạng thống kê tiền tệ tại Việt Nam
7 trang 275 0 0 -
Giáo trình Phát triển hệ thống thương mại điện tử: Phần 2
161 trang 268 6 0 -
Phương pháp và và ứng dụng Phân tích thiết kế hệ thống thông tin: Phần 1 - TS. Nguyễn Hồng Phương
124 trang 249 0 0 -
10 trang 246 0 0