Danh mục tài liệu

Phát hiện và nhận dạng trái thanh long tại Bình Thuận bằng Faster R-CNN

Số trang: 9      Loại file: pdf      Dung lượng: 531.39 KB      Lượt xem: 28      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết sử dụng mô hình học sâu Faster R-CNN để giải quyết vấn đề này, tập trung vào việc phát hiện và nhận dạng trái thanh long chín và chưa chín tại Bình Thuận. Chúng tôi thu thập bộ dữ liệu từ thực tế, bao gồm hình ảnh về trái thanh long trong các điều kiện ánh sáng và che khuất khác nhau. Mô hình Faster R-CNN được huấn luyện trên bộ dữ liệu này để phát triển một hệ thống phát hiện trái cây.
Nội dung trích xuất từ tài liệu:
Phát hiện và nhận dạng trái thanh long tại Bình Thuận bằng Faster R-CNNPHÁT HIỆN VÀ NHẬN DẠNG TRÁI THANH LONG TẠI BÌNH THUẬN BẰNG FASTER R-CNN Nguyễn Văn Trọng 1,, Phan Văn Bảo An1, Huỳnh Nguyễn Thành Luân2 1. Lớp CH22HT01, Trường Đại học Thủ Dầu Một; 2. Trường Đại học Thủ Dầu Một. Liên hệ email: 228480104007@student.tdmu.edu.vnTÓM TẮT Việc phát hiện và nhận dạng trái thanh long chín có vai trò quan trọng trong tối ưu hóasản xuất nông nghiệp, giúp nông dân có thể xác định được trái có thể thu hoạch. Tuy nhiên,thách thức đối với các hệ thống nhận dạng là khả năng phát hiện các trái thanh long bị chekhuất bởi lá hoặc các trái cây lân cận. Trong nghiên cứu này, chúng tôi sử dụng mô hình họcsâu Faster R-CNN để giải quyết vấn đề này, tập trung vào việc phát hiện và nhận dạng tráithanh long chín và chưa chín tại Bình Thuận. Chúng tôi thu thập bộ dữ liệu từ thực tế, bao gồmhình ảnh về trái thanh long trong các điều kiện ánh sáng và che khuất khác nhau. Mô hìnhFaster R-CNN được huấn luyện trên bộ dữ liệu này để phát triển một hệ thống phát hiện tráicây. Kết quả cho thấy rằng Faster R-CNN có khả năng phát hiện và nhận dạng trái chín, chưachín của thanh long trong vườn với độ chính xác cao. Kết quả này mở ra triển vọng cho việcứng dụng học sâu trong quản lý vườn cây ăn trái, giúp tối ưu hóa sản xuất nông nghiệp và tăngcường hiệu suất kinh tế cho ngành nông sản tại Việt Nam. Từ khóa: Faster R-CNN, học sâu, trí tuệ nhân tạo, , thị giác máy tính, phát hiện trái cây.1. GIỚI THIỆU Nhận dạng hình ảnh, còn được gọi là thị giác máy tính, là một lĩnh vực quan trọng trongtrí tuệ nhân tạo (AI), cho phép máy nhận biết và mô tả hình ảnh một cách chính xác và hiệuquả. Điều này giúp máy tính nhận dạng các vật thể, hành động trong hình ảnh hoặc video, tươngtự như con người hiểu các cảm nhận của thị giác [1]. Với sự phát triển của điện thoại thông minh và mạng xã hội, mọi người thường xuyênchia sẻ nhiều loại hình ảnh khác nhau mà họ gặp phải đã tạo một lượng lớn dữ liệu, đưa ra cơhội lớn cho việc phát triển các mô hình trí tuệ nhân tạo. Trong lĩnh vực nông nghiệp, việc nhậndạng trái cây, như trái thanh long, thông qua kỹ thuật AI và học sâu, có thể giúp tăng cườnghiệu suất và chính xác trong sản xuất nông nghiệp. Hệ thống nhận dạng trái thanh long chín tự động sử dụng thị giác máy tính là một nhiệmvụ đầy thách thức do sự giống nhau về hình dạng giữa dây và trái. Nghiên cứu về nhận dạngtrái thanh long giữa các lớp, phân loại các loại trái chín, chưa chín bằng cách sử dụng học sâu,rất quan trọng đối với nông nghiệp chính xác. Mô hình R-CNN đã được sử dụng để phát hiện các đối tượng như dứa chín, được giớithiệu bởi nhóm nghiên cứu do Nguyễn Hà Huy Cường và cộng sự [2]. Để tăng cường chính xáctrong việc phát hiện và xác định các đối tượng từ các vùng được đề xuất, R-CNN được kết hợpvới kỹ thuật tìm kiếm có chọn lọc, tạo cơ sở cho mô hình Fast R-CNN [3]. Tuy nhiên, mặc dùcó hiệu suất cao, kỹ thuật phát hiện đối tượng dựa trên mạng thần kinh này thường có thời gianxử lý lâu. Để đơn giản hóa việc phát hiện đối tượng khi sử dụng mô hình Fast R-CNN, các 792nghiên cứu trước đây đã đề xuất kỹ thuật gán nhãn cho các bounding box trong hình ảnh (cònđược gọi là vùng quan tâm) và lặp lại quy trình khi phát hiện được vùng được đề xuất [4] [5].Trong bài viết này, nhóm đề xuất sử dụng một phương pháp khác, cải thiện được nhược điểmcủa R-CNN, Fast R-CNN để phát hiện và nhận dạng hình ảnh là Faster R-CNN.2. MÔ HÌNH FASTER R-CNN Mô hình Faster R-CNN thêm một mạng CNN mới gọi là Region Proposal Network (RPN)để tạo các đề xuất đối tượng và một mạng riêng để nhận dạng các đối tượng trong các đề xuất đó. Hình 1. Kiến trúc mới Faster R-CNN [6] Để bắt đầu, cả bức ảnh được cho qua mô hình đào tạo trước để lấy đặc trưng. Sau đó, cácđặc trưng được dùng cho mạng đề xuất vùng để thu thập các vùng đề xuất. Sau khi xác định vịtrí các vùng đề xuất thì thực hiện giống như Fast R-CNN. Kiến trúc Faster R-CNN được thểhiện ở Hình 1.3. XÂY DỰNG BỘ DỮ LIỆU Nghiên cứu này nhằm mục đích thử nghiệm thuật toán học sâu để nhận dạng và phân loạihình ảnh bằng cách sử dụng bộ dữ liệu giữa các lớp trên quả thanh long. Nguồn dữ liệu được tácgiả chụp bằng điện thoại thông minh có độ phân giải cao. Bộ dữ liệu được sử dụng để triển khainhận dạng hình ảnh bằng mô hình học sâu Faster R-CNN và đánh giá hiệu suất của nó trong nhậndạng hình ảnh. Ngoài ra, kết quả thực hiện của các thuật toán sau đó được phân tích để hiểu ứngdụng của chúng. Phương pháp nghiên cứu bao gồm xây dựng tập dữ liệu, gán nhãn tập dữ liệu,xây dựng mô hình và đánh giá mô hình. Quy trình xây dựng bộ dữ liệu được thể hiện ở Hình 2. Hình 2. Sơ đồ quy trình xây dựng bộ dữ liệu ...

Tài liệu có liên quan: