Tăng cường dữ liệu ảnh cho bộ dữ liệu X quang phổi sử dụng mạng sinh đối nghịch
Số trang: 8
Loại file: pdf
Dung lượng: 939.43 KB
Lượt xem: 11
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Tăng cường dữ liệu để cải thiện hiệu suất mô hình phân lớp trong trường hợp một số lớp có rất ít mẫu là một thử thách trong các bài toán phân loại ảnh, đặc biệt là trong lĩnh vực y khoa đối với một số bệnh lý hiếm gặp hoặc đột biến. Sử dụng Generative Adversarial Networks (GANs) để tăng cường dữ liệu trong trường hợp này thường không đạt hiệu suất cao ở những lớp thiểu số.
Nội dung trích xuất từ tài liệu:
Tăng cường dữ liệu ảnh cho bộ dữ liệu X quang phổi sử dụng mạng sinh đối nghịchKỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020DOI: 10.15625/vap.2020.00212 TĂNG CƯỜNG DỮ LIỆU ẢNH CHO BỘ DỮ LIỆU X-QUANG PHỔI SỬ DỤNG MẠNG SINH ĐỐI NGHỊCH Trần Hoàng Phát1, Phạm Mạnh Cường1, Trần Đình Toàn2, Hoàng Tùng3, Lê Minh Hưng1 1 Trường Đại học Công nghệ thông tin - Đại học Quốc gia TP.HCM 2 Trường Đại học Công nghiệp Thực phẩm TP.HCM 3 Trung tâm CNTT, Trường Đại học Nguyễn Tất Thành 16520918@gm.uit.edu.vn, 16520156@gm.uit.edu.vn, toantd@hufi.edu.vn, htung@ntt.edu.vn, hunglm@uit.edu.vn TÓM TẮT: Tăng cường dữ liệu để cải thiện hiệu suất mô hình phân lớp trong trường hợp một số lớp có rất ít mẫu là mộtthử thách trong các bài toán phân loại ảnh, đặc biệt là trong lĩnh vực y khoa đối với một số bệnh lý hiếm gặp hoặc đột biến. Sửdụng Generative Adversarial Networks (GANs) để tăng cường dữ liệu trong trường hợp này thường không đạt hiệu suất cao ởnhững lớp thiểu số. Xem xét bài toán phân loại ảnh X-quang lồng ngực, chúng tôi xây dựng mô hình feature based X-ray GAN (FX-GAN) để tổng hợp dữ liệu ảnh X-quang với hướng tiếp cận học từ phân phối đặc trưng. Mô hình học cách sử dụng những đặc trưngđược cung cấp để tạo ra ảnh mới mang đặc trưng tương tự. Trong đó, đặc trưng được trích xuất từ một mô hình độ đo đã được huấnluyện có thể trích xuất những đặc trưng phân biệt giữa các lớp. Khi mô hình độ đo khái quát được những lớp không được quan sát, môhình của nghiên cứu này có thể tạo dữ liệu cho những lớp đó mà không cần thực hiện tinh chỉnh. Tiến hành thực nghiệm FX-GAN trênbộ dữ liệu ảnh X-quang lồng ngực và đánh giá khả năng tăng cường dữ liệu cho những lớp thiểu số nằm ngoài tập quan sát chỉ dựa vàomột vài mẫu dữ liệu có sẵn, đồng thời cải thiện hiệu suất của mô hình phân loại bệnh lý qua ảnh X-quang lồng ngực. Từ khóa: One-shot image generation, Generative adversarial network, Chest X-ray classification, Data augmentation. I. GIỚI THIỆU Phân loại ảnh X-quang lồng ngực để phát hiện các bệnh lý là một trong những bài toán quan trọng trong lĩnhvực y khoa. Trong khi đó số lượng các bác sĩ X-quang trong lĩnh vực này thường hạn chế. Một hệ thống chẩn đoán tíchhợp máy tính với khả năng đưa ra dự đoán trong vài giây có thể giảm đáng kể khối lượng công việc của các bác sĩ X-quang. Hướng tiếp cận phổ biến là sử dụng các mô hình học sâu đã đạt được nhiều kết quả đáng kể. Hầu hết mô hìnhhọc sâu đòi hỏi phải có một bộ dữ liệu đủ lớn để mô hình đạt được sự khái quát. Trong thực tế, dữ liệu ảnh y khoa nóichung thường có xu hướng bị mất cân bằng và khan hiếm dẫn đến việc mô hình quan tâm những lớp có nhiều mẫu dữliệu hơn để tối ưu hàm mục tiêu, dẫn đến hiệu suất kém khi dự đoán những mẫu thuộc lớp thiểu số (ít mẫu hơn). Hình 1. Mô tả trực quan t-SNE hàm ánh xạ từ phân phối đặc trưng sang phân phối dữ liệu. Bên trái là phân phối đặc trưng được trích xuất từ ảnh điều kiện thông qua mô hình độ đo F. Bên phải là phân phối dữ liệu (đại diện bởi đặc trưng trích xuất từ ảnh được tạo bởi generator thông qua F) Tăng cường dữ liệu [10] là phương pháp được sử dụng rộng rãi để giải quyết bài toán dạng như trên. Tuy nhiên,ảnh được tạo từ các phép biến đổi có sự đa dạng còn nhiều hạn chế. Các nhà nghiên cứu đã sử dụng các mô hìnhGenerative Adversarial Networks (GANs) để tăng cường dữ liệu nhằm cải thiện hiệu suất của các bài toán phân lớp,[11]. Trong đó, mô hình Balancing GAN (BAGAN) [11] đã cho thấy khả năng vượt trội để cải thiện hiệu suất của cácmô hình phân lớp trên bộ dữ liệu bị mất cân bằng thông qua việc huấn luyện cùng lúc các lớp đa số và thiểu số cùngvới sự kết hợp giữa mô hình GAN và autoencoder. Tuy nhiên, khi một số lớp chỉ có vài mẫu dữ liệu, BAGAN gặp khókhăn để sinh dữ liệu cho các lớp này do không đủ dữ liệu để huấn luyện. Khi đó, hướng tiếp cận sinh ảnh one-shot làlựa chọn hiệu quả hơn. Ví dụ điển hình là mô hình state-of-the-art DAGAN, mô hình sử dụng kiến trúc encoder-decoder kết hợp với véctơ ngẫu nhiên để học phép biến đổi lên ảnh điều kiện một cách tự động, sau đó tạo ra ảnh mới550 TĂNG CƯỜNG DỮ LIỆU ẢNH CHO BỘ DỮ LIỆU X-QUANG PHỔI SỬ DỤNG MẠNG SINH ĐỐI NGHỊCHvới sự biến đổi so với ảnh ban đầu. Tuy nhiên, sự đa dạng của ảnh được tạo bởi DAGAN bằng cách thêm véctơ ngẫunhiên còn khá hạn chế. Từ vấn đề phân loại ảnh X-quang lồng ngực được xem xét, nghiên cứu này đề xuất mô hình Feature based X-ray GAN (FX-GAN), mô hình sử dụng đặc trưng đại diện trích xuất từ một ảnh điều kiện để sinh ra ảnh mới ma ...
Nội dung trích xuất từ tài liệu:
Tăng cường dữ liệu ảnh cho bộ dữ liệu X quang phổi sử dụng mạng sinh đối nghịchKỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020DOI: 10.15625/vap.2020.00212 TĂNG CƯỜNG DỮ LIỆU ẢNH CHO BỘ DỮ LIỆU X-QUANG PHỔI SỬ DỤNG MẠNG SINH ĐỐI NGHỊCH Trần Hoàng Phát1, Phạm Mạnh Cường1, Trần Đình Toàn2, Hoàng Tùng3, Lê Minh Hưng1 1 Trường Đại học Công nghệ thông tin - Đại học Quốc gia TP.HCM 2 Trường Đại học Công nghiệp Thực phẩm TP.HCM 3 Trung tâm CNTT, Trường Đại học Nguyễn Tất Thành 16520918@gm.uit.edu.vn, 16520156@gm.uit.edu.vn, toantd@hufi.edu.vn, htung@ntt.edu.vn, hunglm@uit.edu.vn TÓM TẮT: Tăng cường dữ liệu để cải thiện hiệu suất mô hình phân lớp trong trường hợp một số lớp có rất ít mẫu là mộtthử thách trong các bài toán phân loại ảnh, đặc biệt là trong lĩnh vực y khoa đối với một số bệnh lý hiếm gặp hoặc đột biến. Sửdụng Generative Adversarial Networks (GANs) để tăng cường dữ liệu trong trường hợp này thường không đạt hiệu suất cao ởnhững lớp thiểu số. Xem xét bài toán phân loại ảnh X-quang lồng ngực, chúng tôi xây dựng mô hình feature based X-ray GAN (FX-GAN) để tổng hợp dữ liệu ảnh X-quang với hướng tiếp cận học từ phân phối đặc trưng. Mô hình học cách sử dụng những đặc trưngđược cung cấp để tạo ra ảnh mới mang đặc trưng tương tự. Trong đó, đặc trưng được trích xuất từ một mô hình độ đo đã được huấnluyện có thể trích xuất những đặc trưng phân biệt giữa các lớp. Khi mô hình độ đo khái quát được những lớp không được quan sát, môhình của nghiên cứu này có thể tạo dữ liệu cho những lớp đó mà không cần thực hiện tinh chỉnh. Tiến hành thực nghiệm FX-GAN trênbộ dữ liệu ảnh X-quang lồng ngực và đánh giá khả năng tăng cường dữ liệu cho những lớp thiểu số nằm ngoài tập quan sát chỉ dựa vàomột vài mẫu dữ liệu có sẵn, đồng thời cải thiện hiệu suất của mô hình phân loại bệnh lý qua ảnh X-quang lồng ngực. Từ khóa: One-shot image generation, Generative adversarial network, Chest X-ray classification, Data augmentation. I. GIỚI THIỆU Phân loại ảnh X-quang lồng ngực để phát hiện các bệnh lý là một trong những bài toán quan trọng trong lĩnhvực y khoa. Trong khi đó số lượng các bác sĩ X-quang trong lĩnh vực này thường hạn chế. Một hệ thống chẩn đoán tíchhợp máy tính với khả năng đưa ra dự đoán trong vài giây có thể giảm đáng kể khối lượng công việc của các bác sĩ X-quang. Hướng tiếp cận phổ biến là sử dụng các mô hình học sâu đã đạt được nhiều kết quả đáng kể. Hầu hết mô hìnhhọc sâu đòi hỏi phải có một bộ dữ liệu đủ lớn để mô hình đạt được sự khái quát. Trong thực tế, dữ liệu ảnh y khoa nóichung thường có xu hướng bị mất cân bằng và khan hiếm dẫn đến việc mô hình quan tâm những lớp có nhiều mẫu dữliệu hơn để tối ưu hàm mục tiêu, dẫn đến hiệu suất kém khi dự đoán những mẫu thuộc lớp thiểu số (ít mẫu hơn). Hình 1. Mô tả trực quan t-SNE hàm ánh xạ từ phân phối đặc trưng sang phân phối dữ liệu. Bên trái là phân phối đặc trưng được trích xuất từ ảnh điều kiện thông qua mô hình độ đo F. Bên phải là phân phối dữ liệu (đại diện bởi đặc trưng trích xuất từ ảnh được tạo bởi generator thông qua F) Tăng cường dữ liệu [10] là phương pháp được sử dụng rộng rãi để giải quyết bài toán dạng như trên. Tuy nhiên,ảnh được tạo từ các phép biến đổi có sự đa dạng còn nhiều hạn chế. Các nhà nghiên cứu đã sử dụng các mô hìnhGenerative Adversarial Networks (GANs) để tăng cường dữ liệu nhằm cải thiện hiệu suất của các bài toán phân lớp,[11]. Trong đó, mô hình Balancing GAN (BAGAN) [11] đã cho thấy khả năng vượt trội để cải thiện hiệu suất của cácmô hình phân lớp trên bộ dữ liệu bị mất cân bằng thông qua việc huấn luyện cùng lúc các lớp đa số và thiểu số cùngvới sự kết hợp giữa mô hình GAN và autoencoder. Tuy nhiên, khi một số lớp chỉ có vài mẫu dữ liệu, BAGAN gặp khókhăn để sinh dữ liệu cho các lớp này do không đủ dữ liệu để huấn luyện. Khi đó, hướng tiếp cận sinh ảnh one-shot làlựa chọn hiệu quả hơn. Ví dụ điển hình là mô hình state-of-the-art DAGAN, mô hình sử dụng kiến trúc encoder-decoder kết hợp với véctơ ngẫu nhiên để học phép biến đổi lên ảnh điều kiện một cách tự động, sau đó tạo ra ảnh mới550 TĂNG CƯỜNG DỮ LIỆU ẢNH CHO BỘ DỮ LIỆU X-QUANG PHỔI SỬ DỤNG MẠNG SINH ĐỐI NGHỊCHvới sự biến đổi so với ảnh ban đầu. Tuy nhiên, sự đa dạng của ảnh được tạo bởi DAGAN bằng cách thêm véctơ ngẫunhiên còn khá hạn chế. Từ vấn đề phân loại ảnh X-quang lồng ngực được xem xét, nghiên cứu này đề xuất mô hình Feature based X-ray GAN (FX-GAN), mô hình sử dụng đặc trưng đại diện trích xuất từ một ảnh điều kiện để sinh ra ảnh mới ma ...
Tìm kiếm theo từ khóa liên quan:
Phân loại ảnh X-quang lồng ngực X quang phổi Mạng sinh đối nghịch Mô hình feature based X-ray GAN Sinh ảnh one-shot Bài toán phân loại bệnh lýTài liệu có liên quan:
-
206 trang 29 0 0
-
Hướng dẫn thực hành viêm phổi tụ cầu (S.aureus) cộng đồng
5 trang 24 0 0 -
9 trang 23 0 0
-
85 trang 23 0 0
-
7 trang 22 0 0
-
Bài giảng X quang phổi - Bùi Hoàng Tú
194 trang 18 0 0 -
Nghiên cứu ảnh hưởng của chiến lược thở máy đến tỷ lệ tử vong bệnh nhân suy hô hấp cấp tiến triển
4 trang 17 0 0 -
Bài giảng U phổi - BS. Lê Văn Dũng
82 trang 16 0 0 -
Giá trị của phim X quang phổi trong phản ánh mức độ rối loạn chức năng tim ở bệnh cơ tim giãn
7 trang 15 0 0 -
3 trang 14 0 0