Danh mục tài liệu

Phát hiện phương tiện giao thông trong không ảnh với nhiều tình huống khác nhau

Số trang: 6      Loại file: pdf      Dung lượng: 2.69 MB      Lượt xem: 8      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết trình bày phân tích và đánh giá hiệu suất của phương pháp D2Det trên bộ dữ liệu không ảnh UAVDT-Benchmark-M cho các tình huống daylight, low-alt, bird-view. Các kết quả ban đầu được báo cáo đầy đủ và là cơ sở cho các nghiên cứu sau này trong việc phát triển thuật toán trên miền dữ liệu không ảnh.
Nội dung trích xuất từ tài liệu:
Phát hiện phương tiện giao thông trong không ảnh với nhiều tình huống khác nhau Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) Phát hiện phương tiện giao thông trong không ảnh với nhiều tình huống khác nhau Phan Thị Hồng Cúc, Võ Duy Nguyên, Nguyễn Thành Hiệp, Nguyễn Tấn Trần Minh Khang Trường Đại Học Công Nghệ Thông Tin, ĐHQG-HCM 18520260@gm.uit.edu.vn, {nguyenvd, hiepnt, khangnttm}@uit.edu.vn Tóm tắt—Phát hiện phương tiện giao thông trong ảnh bài toán. Chẳng hạn như, khi thiết bị bay di chuyển với chụp từ trên không có nhiều ứng dụng cho các hệ thống tốc độ nhanh, hình ảnh thu được sẽ bị mờ, thiết bị bay thông minh trong những năm gần đây. Những thách thức càng cao thì đối tượng trong ảnh sẽ càng nhỏ hay khi mới từ độ cao, tầm nhìn toàn cảnh và góc chụp thẳng cần có sương mù, hoặc vào thời điểm ban đêm, đối tượng được khai thác nhiều hơn. Trong nghiên cứu này, chúng tôi phân tích và đánh giá hiệu suất của phương pháp D2Det trong ảnh sẽ khó nhận biết hơn. trên bộ dữ liệu không ảnh UAVDT-Benchmark-M cho các tình huống daylight, low-alt, bird-view. Các kết quả ban đầu được báo cáo đầy đủ và là cơ sở cho các nghiên cứu sau này trong việc phát triển thuật toán trên miền dữ liệu không ảnh. Từ khóa—Vehicle detection, Convolutional neural net- work, Drone, Aerial image. I. GIỚI THIỆU Với sự phát triển mạnh mẽ của công nghệ, nhiều dự án xây dựng thành phố thông minh đã và đang được nghiên cứu rộng rãi. Một trong những yếu tố góp phần hiện thực điều ấy là việc xây dựng nên hệ thống quản Hình 1: Bài toán hiện phương tiện giao thông trong lý hoạt động giao thông thông minh. Trong đó, việc không ảnh phát hiện phương tiện giao thông trong ảnh là một phần không thể thiếu bởi nó giúp ta giám sát, phân tích hành vi của người tham gia giao thông, tính toán lưu lượng Bài toán phát hiện phương tiện giao thông trong không giao thông phục vụ cho các lĩnh vực liên quan. Song ảnh đang ngày càng phổ biến trong giới nghiên cứu khoa cách thức thu thập dữ liệu bằng hệ thống camera giám học. Nhiều bộ dữ liệu đã được công bố như UAVDT [5], sát cố định bị hạn chế về địa điểm, tầm nhìn, góc quay VisDrone [6] và các cuộc thi như ODAI [7], VisDrone mà chỉ có thể giải quyết bằng cách lắp đặt camera tại Challenge [8] được tổ chức để khuyến khích các nhà nhiều địa điểm khác nhau. Dù vậy, việc lắp đặt lại bị nghiên cứu tìm ra các phương pháp xử lý nhằm nâng ảnh hưởng bởi các công trình xây dựng của khu vực cần cao sự chính xác, độ hiệu quả cho bài toán. Bài toán lắp. Do đó, việc sử dụng không ảnh – hình ảnh thu được nhận đầu vào là ảnh chụp giao thông được trích xuất từ các thiết bị bay không người lái (UAV) đang ngày từ camera của thiết bị bay không người lái và cho ra càng phổ biển. Bởi chỉ với một vài thiết bị bay, ta có các thông tin về vị trí, tên tương ứng với từng phương thể cho camera bay qua nhiều địa điểm, thu thập được tiện giao thông có trong ảnh đầu vào như Hình 1. Nhiều lượng lớn hình ảnh từ các độ cao, góc quay, điều kiện khảo sát về phương pháp phát hiện đối tượng như Faster thời tiết, ánh sáng khác nhau, từ đó giúp giảm chi phí RCNN [9], YOLO [10], SNIPER [11] trong không ảnh cũng như thời gian thực hiện. Không ảnh có nhiều ứng cũng được công bố gần đây [12], [13], [14], [15], [16]. dụng trong các hệ thống giám sát an ninh, nông nghiệp, Phần còn lại của bài báo được tổ chức như sau: vận chuyển hàng hóa [1], [2], [3], [4]. các nghiên cứu liên quan được trình bày ở Chương II, Tuy nhiên, trong thực tế, sự đa dạng về hình dạng Chương III trình bày thông tin thực nghiệm. Chương IV phương tiện cùng các yếu tố như góc quay, độ cao của đánh giá kết quả của mô hình, cuối cùng, chúng tôi đưa camera, thời tiết, ánh sáng cũng chính là thách thức của ra kết luận và hướng nghiên cứu ở Chương V. ISBN 978-604-80-5958-3 339 Hội nghị Quốc gia lần thứ 24 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2021) II. CÁC NGHIÊN CỨU LIÊN QUAN A. Faster R-CNN Faster R-CNN [17] là phương pháp phát hiện đối tượng thuộc họ R-CNN được công bố bởi Ross Girshick cùng các cộng sự. Ý tưởng của Faster R-CNN cũng tương tự với các phương pháp họ R-CNN trước đó: lấy ra các vùng có khả năng chứa đối tượng tại giai đoạn 1 rồi Hình 3: Deformable RoI pooling [18] tiến hành phân loại và xác định vị trí của đối tượng dựa trên vùng đó tại giai đoạn 2. Tuy nhiên, thay vì sử dụng thuật toán Selective search như các phương pháp cùng C. D2Det họ trước đó, Faster R-CNN đề xuất Region proposal D2Det [19] được công bố tại hội nghị CVPR vào network (RPN) để lấy các vùng đề xuất có khả năng năm 2020 bởi Jiale Cao cùng các cộng sự. Đây là một chứa đối tượng. phương pháp phát hiện đối tượng 2 giai đoạn dựa trên Kiến trúc mạng RPN nhận đầu vào là feature map và Faster R-CNN. Giai đoạn 1 của D2Det dùng RPN để cho ra các vùng đề xuất có khả năng chứa đối tượng. thu được các vùng đề xuất có khả năng chứa đối tượng. Vì không sử dụng thuật toán Selective search nên Faster Tại giai đoạn 2, D2Det đề xuất dense local regression R-CNN đưa ra định nghĩa anchor để xác định các anchor và discriminative RoI pooling thay cho bounding box box ban đầu có thể là region proposal. ...

Tài liệu có liên quan: