Danh mục tài liệu

Cải tiến hiệu năng mã hóa video cho các ứng dụng Học máy với chuẩn VVC kết hợp ROI Coding

Số trang: 6      Loại file: pdf      Dung lượng: 1.52 MB      Lượt xem: 37      Lượt tải: 0    
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết "Cải tiến hiệu năng mã hóa video cho các ứng dụng Học máy với chuẩn VVC kết hợp ROI Coding" đề xuất một phương pháp mã hóa video mới, kết hợp hiệu quả giữa thuật toán ROI Coding (Region Of Interest Coding) và mô hình mã hóa VVC. Phương pháp đề xuất xác định các vùng quan tâm trong các khung hình của video thông qua các đặc trưng cơ bản. Trên cơ sở đó, chúng tôi đề xuất điều chỉnh thích nghi phương thức nén cho từng khối hình sao cho vẫn đảm bảo được hiệu năng thực thi các ứng dụng học máy nhưng yêu cầu lượng dữ liệu mã hóa là ít nhất. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Cải tiến hiệu năng mã hóa video cho các ứng dụng Học máy với chuẩn VVC kết hợp ROI Coding Hội nghị Quốc gia lần thứ 26 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2023) Cải tiến hiệu năng mã hóa video cho các ứng dụng Học máy với chuẩn VVC kết hợp ROI Coding Đỗ Ngọc Minh, Nguyễn Phương Anh, Hoàng Văn Xiêm∗ Khoa Điện tử Viễn thông Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội ∗ Tác giả liên hệ: (dongocminh, xiemhoang)@vnu.edu.vn Tóm tắt—Các chuẩn mã hóa video HEVC (High Effi-ciency Video Coding) và gần đây nhất là VVC (VersatileVideo Coding) ra đời, mang lại nhiều đột phá cho các ứngdụng truyền thông đa phương tiện như truyền hình hộinghị, truyền hình quảng bá và đặc biệt là E-learning. Tuynhiên, sự phát triển của trí tuệ nhân tạo (AI) và dữ liệulớn gần đây đặt ra một nhu cầu bức thiết về một mô hìnhmã hóa video chuyên biệt, được thiết kế riêng cho các ứngdụng phân tích hình ảnh, video sử dụng học máy (VCM- Video Coding for Machines). Do vậy, trong bài báo này,chúng tôi đề xuất một phương pháp mã hóa video mới, Hình 1: Sơ đồ tổng quát hệ thống mã hóa video thôngkết hợp hiệu quả giữa thuật toán ROI Coding (Region Of thường (a) và VCM (b).Interest Coding) và mô hình mã hóa VVC. Phương phápđề xuất xác định các vùng quan tâm trong các khung hìnhcủa video thông qua các đặc trưng cơ bản. Trên cơ sở đó,chúng tôi đề xuất điều chỉnh thích nghi phương thức nén đề quan trọng trong giới học thuật nói chung và côngcho từng khối hình sao cho vẫn đảm bảo được hiệu năng nghiệp nói riêng.thực thi các ứng dụng học máy nhưng yêu cầu lượng dữliệu mã hóa là ít nhất. Do đó, nghiên cứu khảo sát hướng A. Mã hóa VCM và mô hình Standard-VCMtiếp cận để trích xuất đặc trưng từ thông tin gốc tại phíamã hóa EROI-VCM (Encoding based on Region Of Interest Các chuẩn mã hóa video truyền thống như High-for VCM). Kết quả cho thấy thuật toán EROI-VCM có thể efficiency Video Coding (HEVC) [1] và mới nhất làgiúp tăng độ chính xác MOTA lên tới 9.69% và cùng một Versatile Video Coding (VVC) [2] đã được tối ưu hóagiá trị MOTA thì EROI-VCM tiết kiệm được 54.81% về rất nhiều để cung cấp chất lượng tốt nhất có thể ở tỷ lệBD-Rate. bit cụ thể, trong đó người dùng cuối được xem xét làm Từ khóa—Mã hóa VCM, Chuẩn VVC, Mã hóa vùng tham chiếu để đánh giá chất lượng. Do đó, nó đặt ra mộtquan tâm (ROI Coding) vấn đề rằng liệu những tối ưu hóa được thực hiện cho người dùng được mô tả trong hình 1a, có phù hợp khi I. GIỚI THIỆU những dữ liệu này được phân tích và xử lý bởi một thuật Ngày nay, video chiếm hơn 80 phần trăm lưu lượng toán thay vì một con người, như hình 1b. Câu hỏi đó đãdữ liệu trên internet và trở thành một trong những định mở ra một lĩnh vực nghiên cứu về mã hóa video cho cácdạng dữ liệu chính. Dung lượng video được khai thác tác vụ được xử lý bởi máy tính (VCM - Video Codingbởi máy tính đã vượt qua dung lượng video được khai for Machines). Từ đó, MPEG [3] đã thành lập một nhómthác bởi con người. Các nhiệm vụ thị giác máy kết hơp các chuyên gia về lĩnh vực này vào năm 2019 với mụchọc máy bao gồm phát hiện đối tượng, phân đoạn, và tiêu nghiên cứu và phát triển chuẩn mã hóa video VCMtheo dõi khá khác biệt so với những nhiệm vụ dành cho [4].con người. Ngược lại, do dung lượng dữ liệu video lớn, Sau đó, các nghiên cứu về VCM trên video ngày càngviệc nén video một cách hiệu quả cho máy tính (VCM được quan tâm. Trong nghiên cứu của A. D. Bagdanov- Video Coding for Machines) đã trở thành một chủ và công sự [5], họ đã đề xuất mô hình VCM dựa trên ISBN 978-604-80-8932-0 264 Hội nghị Quốc gia lần thứ 26 về Điện tử, Truyền thông và Công nghệ Thông tin (REV-ECIT2023)chuẩn mã hóa video H.264/AVC [6] mà giúp bảo tồnchất lượng các khu vực quan trọng, trong khi vùng nềnđược nén mạnh hơn. Kết quả cho thấy rằng kỹ thuật nàycó hiệu quả vượt trội so với việc mã hóa chuẩn H.264với tỷ lệ bit tương tự và bảo tồn các đặc trưng quantrọng cho việc phát hiện và nhận dạng ở các bước tiếptheo. Ngoài ra, Choi và Bajic [7] đã đề xuất một chiếnlược phân bổ bit và kiểm soát tốc độ được điều chỉnhđể phục vụ bài toán phát hiện đối tượng. Bằng cách Hình 2: Ứng dụng theo dõi đối tượng.sử dụng các lớp tích chập ban đầu của bộ phát hiện đốitượng YOLO9000 [8], họ đã tạo ra một bản đồ biểu diễntầm quan trọng của cá ...