Nhận dạng ký tự bằng mạng Neural lan truyền ngược
Số trang: 5
Loại file: pdf
Dung lượng: 604.64 KB
Lượt xem: 21
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài báo giới thiệu một phương pháp nhận dạng ký tự, đó là kỹ thuật mạng Neural lan truyền ngược. Kỹ thuật này hiện nay được ứng dụng rộng rãi giúp người dùng không phải mất thời gian và công sức cho việc nhập lại văn bản từ file ảnh chứa văn bản (đã được scan hoặc dùng các thiết bị khác chụp lại).
Nội dung trích xuất từ tài liệu:
Nhận dạng ký tự bằng mạng Neural lan truyền ngược 30 Khoa hoïc Coâng ngheä NHẬN DẠNG KÝ TỰ BẰNG MẠNG NEURAL LAN TRUYỀN NGƯỢC Character recognition by backpropagation neural network Trần Văn Nam1 Tóm tắt Nhận dạng ký tự quang học (Optical Character Recognition, viết tắt là OCR), là chương trình được tạo ra để chuyển các hình ảnh của chữ viết tay hoặc chữ đánh máy (thường được quét bằng máy scanner) thành các văn bản tài liệu. Bài báo giới thiệu một phương pháp nhận dạng ký tự, đó là kỹ thuật mạng Neural lan truyền ngược. Kỹ thuật này hiện nay được ứng dụng rộng rãi giúp người dùng không phải mất thời gian và công sức cho việc nhập lại văn bản từ file ảnh chứa văn bản (đã được scan hoặc dùng các thiết bị khác chụp lại). Kết quả thực nghiệm trên 90 ký tự với hai loại font : Arial và Tahoma cho thấy phương pháp này đạt được kết quả nhận dạng chính xác đến 98.89 phần trăm. Từ khóa: nhận dạng ký tự quang học, mạng neural nhân tạo, mạng truyền thẳng, mạng hồi qui, mạng tự tổ chức. Abstract Optical Character Recognition (Optical Character Recognition, abbreviated as OCR), a program is created to convert images of handwritten or typewritten text (usually scanned by a scanner) to text documents. This paper presents a method of character recognition, which is the technical backpropagation neural network. This technique is now widely applied to enable users not to spend time and effort to re-enter the text from the image file (scanned or use other capture devices). The experimental results on 90 characters with two types of fonts of Arial and Tahoma showed that this method gives the accurate recognition result to 98.89 percent. Keys words: optical Character Recognition, Artificial Neural Networks, feel- forward, feedback, self-organizing. 1. Dẫn nhập1 Mạng neural nhân tạo (Artificial Neural Networks: ANN) ra đời xuất phát từ ý tưởng mô phỏng hoạt động của bộ não con người. ANN là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh con người với vô số các neural được liên kết truyền thông với nhau qua mạng. Giống như con người, ANN được học bởi kinh nghiệm, lưu những kinh nghiệm đó và sử dụng trong những tình huống phù hợp. Trong một vài năm trở lại đây, mạng neural đã được nhiều người quan tâm và áp dụng thành công trong nhiều lĩnh vực khác nhau. Chẳng hạn như ở các cơ quan tài chính, y tế, địa chất và vật lý. Thật vậy, bất kỳ ở đâu có vấn đề về dự báo, phân loại và điều khiển, mạng neural đều có thể ứng dụng được. Mạng neural dựa trên việc mô phỏng cấp thấp hệ thống neural sinh học. Trong tương lai với sự phát triển mô phỏng neural sinh học, chúng ta có thể có loại máy tính thông minh thật sự. Trong phạm vi bài báo này, chúng tôi vận dụng lý thuyết mạng neural để thiết kế chương trình nhận dạng ký tự quang học. 1 Thạc sĩ, Trường Đại học Trà Vinh 2. Phương pháp huấn luyện mạng neural2 2.1. Phương pháp học Mạng neural nhân tạo phỏng theo việc xử lý thông tin của bộ não người. Do vậy, đặc trưng cơ bản của mạng là có khả năng học, khả năng tái tạo các hình ảnh và dữ liệu khi đã học. Trong trạng thái học, thông tin được lan truyền theo hai chiều nhiều lần để học các trọng số. Có 3 kiểu học chính, mỗi kiểu học tương ứng với một nhiệm vụ học trừu tượng. Đó là học có giám sát (có mẫu), học không giám sát và học tăng cường. Thông thường, loại kiến trúc mạng nào cũng có thể dùng được cho các nhiệm vụ. 2.2. Học có giám sát Một thành phần không thể thiếu của phương pháp này là sự có mặt của một người thầy (ở bên ngoài hệ thống). Người thầy này có kiến thức về môi trường thể hiện qua một tập hợp các cặp đầu vào - đầu ra đã được biết trước. Hệ thống học (ở đây là mạng neural) sẽ phải tìm cách thay đổi các tham số bên trong của mình (các trọng số và các 2 Trần, Hùng Cường. 2013. Nhận dạng ký tự quang học. Trường Đại học Công nghiệp Hà Nội. Số 14, tháng 6/2014 30 Khoa hoïc Coâng ngheä ngưỡng) để tạo nên một ánh xạ có khả năng ánh xạ các đầu vào thành các đầu ra mong muốn. Sự thay đổi này được tiến hành nhờ việc so sánh giữa đầu ra thực sự và đầu ra mong muốn. 2.3. Học không giám sát Trong học không có giám sát, ta được cho trước một số dữ liệu x và hàm chi phí cần được cực tiểu hóa có thể là một hàm bất kỳ của dữ liệu x và đầu ra của mạng, f – hàm chi phí được quyết định bởi phát biểu của bài toán. Phần lớn các ứng dụng nằm trong vùng của các bài toán ước lượng như mô hình hóa thống kê, nén, lọc, phân cụm. 2.4. Học tăng cường Dữ liệu x thường không được tạo trước mà được tạo ra trong quá trình một agent tương tác với môi trường. Tại mỗi thời điểm t, agent thực hiện hành động yt và môi trường tạo một quan sát xt với một chi phí tức thời Ct, theo một quy trình động nào đó (thường là không được biết). Mục tiêu là một sách lược lựa chọn hành động để cực tiểu hóa một chi phí dài hạn nào đó, nghĩa là chi phí tích lũy mong đợi. Quy trình hoạt động của môi trường và chi phí dài hạn cho mỗi sách lược thường không được biết, nhưng có thể ước lượng được. Mạng neural nhân tạo thường được dùng trong học tăng cường như một phần của thuật toán toàn cục. Các bài toán thường được giải quyết bằng học tăng cường là các bài toán điều khiển, trò chơi và các nhiệm vụ quyết định tuần tự (sequential decision making) khác. 3. Phương pháp và thuật toán nhận dạng ký tự Ở đây, chúng tôi sử dụng mạng feed-forward và thuật toán lan truyền ngược sai số Back Propagation để xử lý bài toán. 3.1. Cơ sở dữ liệu Cơ sở dữ liệu cho bài toán nhận dạng ký tự quang gồm 90 ký tự theo chữ cái Latin với hai loại font: Times New Roman và Arial, trong bảng mã Unicode tương ứng. 31 − Thu nhận ảnh − Tiến hành phân tích ảnh để tìm ký tự − Tiền xử lý ký tự − Mạng Neural nhận dạng ký tự − Hậu xử lý dữ liệu 3.2.1. Thu nhận ảnh Input văn bản, tài liệu có thể được thu nhận bằng máy quét scanner, webcam, hoặc các thiết bị thu nhận ảnh thông dụng khác. 3.2.2. Tiến hành phân tích ảnh để tìm ký tự Việc phân tích ảnh để tìm ký tự bao gồm các bước sau: − Đầu tiên, tiến hành tách dòng ký tự ra khỏi ảnh ký tự − Thứ h ...
Nội dung trích xuất từ tài liệu:
Nhận dạng ký tự bằng mạng Neural lan truyền ngược 30 Khoa hoïc Coâng ngheä NHẬN DẠNG KÝ TỰ BẰNG MẠNG NEURAL LAN TRUYỀN NGƯỢC Character recognition by backpropagation neural network Trần Văn Nam1 Tóm tắt Nhận dạng ký tự quang học (Optical Character Recognition, viết tắt là OCR), là chương trình được tạo ra để chuyển các hình ảnh của chữ viết tay hoặc chữ đánh máy (thường được quét bằng máy scanner) thành các văn bản tài liệu. Bài báo giới thiệu một phương pháp nhận dạng ký tự, đó là kỹ thuật mạng Neural lan truyền ngược. Kỹ thuật này hiện nay được ứng dụng rộng rãi giúp người dùng không phải mất thời gian và công sức cho việc nhập lại văn bản từ file ảnh chứa văn bản (đã được scan hoặc dùng các thiết bị khác chụp lại). Kết quả thực nghiệm trên 90 ký tự với hai loại font : Arial và Tahoma cho thấy phương pháp này đạt được kết quả nhận dạng chính xác đến 98.89 phần trăm. Từ khóa: nhận dạng ký tự quang học, mạng neural nhân tạo, mạng truyền thẳng, mạng hồi qui, mạng tự tổ chức. Abstract Optical Character Recognition (Optical Character Recognition, abbreviated as OCR), a program is created to convert images of handwritten or typewritten text (usually scanned by a scanner) to text documents. This paper presents a method of character recognition, which is the technical backpropagation neural network. This technique is now widely applied to enable users not to spend time and effort to re-enter the text from the image file (scanned or use other capture devices). The experimental results on 90 characters with two types of fonts of Arial and Tahoma showed that this method gives the accurate recognition result to 98.89 percent. Keys words: optical Character Recognition, Artificial Neural Networks, feel- forward, feedback, self-organizing. 1. Dẫn nhập1 Mạng neural nhân tạo (Artificial Neural Networks: ANN) ra đời xuất phát từ ý tưởng mô phỏng hoạt động của bộ não con người. ANN là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh con người với vô số các neural được liên kết truyền thông với nhau qua mạng. Giống như con người, ANN được học bởi kinh nghiệm, lưu những kinh nghiệm đó và sử dụng trong những tình huống phù hợp. Trong một vài năm trở lại đây, mạng neural đã được nhiều người quan tâm và áp dụng thành công trong nhiều lĩnh vực khác nhau. Chẳng hạn như ở các cơ quan tài chính, y tế, địa chất và vật lý. Thật vậy, bất kỳ ở đâu có vấn đề về dự báo, phân loại và điều khiển, mạng neural đều có thể ứng dụng được. Mạng neural dựa trên việc mô phỏng cấp thấp hệ thống neural sinh học. Trong tương lai với sự phát triển mô phỏng neural sinh học, chúng ta có thể có loại máy tính thông minh thật sự. Trong phạm vi bài báo này, chúng tôi vận dụng lý thuyết mạng neural để thiết kế chương trình nhận dạng ký tự quang học. 1 Thạc sĩ, Trường Đại học Trà Vinh 2. Phương pháp huấn luyện mạng neural2 2.1. Phương pháp học Mạng neural nhân tạo phỏng theo việc xử lý thông tin của bộ não người. Do vậy, đặc trưng cơ bản của mạng là có khả năng học, khả năng tái tạo các hình ảnh và dữ liệu khi đã học. Trong trạng thái học, thông tin được lan truyền theo hai chiều nhiều lần để học các trọng số. Có 3 kiểu học chính, mỗi kiểu học tương ứng với một nhiệm vụ học trừu tượng. Đó là học có giám sát (có mẫu), học không giám sát và học tăng cường. Thông thường, loại kiến trúc mạng nào cũng có thể dùng được cho các nhiệm vụ. 2.2. Học có giám sát Một thành phần không thể thiếu của phương pháp này là sự có mặt của một người thầy (ở bên ngoài hệ thống). Người thầy này có kiến thức về môi trường thể hiện qua một tập hợp các cặp đầu vào - đầu ra đã được biết trước. Hệ thống học (ở đây là mạng neural) sẽ phải tìm cách thay đổi các tham số bên trong của mình (các trọng số và các 2 Trần, Hùng Cường. 2013. Nhận dạng ký tự quang học. Trường Đại học Công nghiệp Hà Nội. Số 14, tháng 6/2014 30 Khoa hoïc Coâng ngheä ngưỡng) để tạo nên một ánh xạ có khả năng ánh xạ các đầu vào thành các đầu ra mong muốn. Sự thay đổi này được tiến hành nhờ việc so sánh giữa đầu ra thực sự và đầu ra mong muốn. 2.3. Học không giám sát Trong học không có giám sát, ta được cho trước một số dữ liệu x và hàm chi phí cần được cực tiểu hóa có thể là một hàm bất kỳ của dữ liệu x và đầu ra của mạng, f – hàm chi phí được quyết định bởi phát biểu của bài toán. Phần lớn các ứng dụng nằm trong vùng của các bài toán ước lượng như mô hình hóa thống kê, nén, lọc, phân cụm. 2.4. Học tăng cường Dữ liệu x thường không được tạo trước mà được tạo ra trong quá trình một agent tương tác với môi trường. Tại mỗi thời điểm t, agent thực hiện hành động yt và môi trường tạo một quan sát xt với một chi phí tức thời Ct, theo một quy trình động nào đó (thường là không được biết). Mục tiêu là một sách lược lựa chọn hành động để cực tiểu hóa một chi phí dài hạn nào đó, nghĩa là chi phí tích lũy mong đợi. Quy trình hoạt động của môi trường và chi phí dài hạn cho mỗi sách lược thường không được biết, nhưng có thể ước lượng được. Mạng neural nhân tạo thường được dùng trong học tăng cường như một phần của thuật toán toàn cục. Các bài toán thường được giải quyết bằng học tăng cường là các bài toán điều khiển, trò chơi và các nhiệm vụ quyết định tuần tự (sequential decision making) khác. 3. Phương pháp và thuật toán nhận dạng ký tự Ở đây, chúng tôi sử dụng mạng feed-forward và thuật toán lan truyền ngược sai số Back Propagation để xử lý bài toán. 3.1. Cơ sở dữ liệu Cơ sở dữ liệu cho bài toán nhận dạng ký tự quang gồm 90 ký tự theo chữ cái Latin với hai loại font: Times New Roman và Arial, trong bảng mã Unicode tương ứng. 31 − Thu nhận ảnh − Tiến hành phân tích ảnh để tìm ký tự − Tiền xử lý ký tự − Mạng Neural nhận dạng ký tự − Hậu xử lý dữ liệu 3.2.1. Thu nhận ảnh Input văn bản, tài liệu có thể được thu nhận bằng máy quét scanner, webcam, hoặc các thiết bị thu nhận ảnh thông dụng khác. 3.2.2. Tiến hành phân tích ảnh để tìm ký tự Việc phân tích ảnh để tìm ký tự bao gồm các bước sau: − Đầu tiên, tiến hành tách dòng ký tự ra khỏi ảnh ký tự − Thứ h ...
Tìm kiếm theo từ khóa liên quan:
Nhận dạng ký tự quang học Mạng neural nhân tạo Mạng truyền thẳng Mạng hồi qui Mạng tự tổ chức Quá trình nhận dạng kí tự Huấn luyện mạng neuralTài liệu có liên quan:
-
Điều khiển cánh tay robot học vẽ
7 trang 41 0 0 -
Bài tập lớn môn Trí tuệ nhân tạo: Nhận dạng ký tự viết tay tiếng Việt
20 trang 39 0 0 -
Bài tập lớn môn học Kĩ thuật đồ họa: Nghiên cứu ứng dụng nhận dạng chữ viết tay
17 trang 38 0 0 -
Đồ án Tốt nghiệp Cử nhân CNTT: Nhận dạng ký tự viết tay
73 trang 30 0 0 -
Đồ án Tốt nghiệp cử nhân Công nghệ thông tin: Nhận dạng biển số xe
70 trang 30 0 0 -
Báo cáo Luận văn Tốt nghiệp: Tìm hiểu công nghệ nhận dạng hình ảnh
30 trang 29 0 0 -
Ứng dụng công nghệ nhận dạng ký tự quang học cho số hóa tài liệu tại Học viện Ngân hàng
10 trang 29 0 0 -
Tiểu luận: Ứng dụng mạng neural trong nhận dạng ký tự quang học
21 trang 28 0 0 -
Về xử lý tiếng Việt trong công nghệ thông tin
15 trang 26 0 0 -
Ứng dụng thuật toán mạng neural tích chập để nhận dạng bìa sách
8 trang 25 0 0