
Giới thiệu Luận án tiến sĩ Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
Tên đề tài: MỘT SỐ CÁCH TIẾP CẬN DỰA TRÊN MÔ HÌNH TRANFORMER VÀ TÍNH TOÁN CẬN BIÊN CHO CÁC BÀI TOÁN TRONG INTERNET VẠN VẬT
[Luận án tiến sĩ Khoa học máy tính]
Tác giả: Thái Huy Tân
Tóm tắt:
Sự kết hợp giữa vạn vật kết nối (IoT) và trí tuệ nhân tạo (AI), hay còn gọi là AIoT, đã và đang tạo nên những bước phát triển vượt bậc, được ứng dụng trong nhiều khía cạnh khác nhau của đời sống, bao gồm lĩnh vực nông nghiệp với các bài toán như: ước lượng năng suất cây trồng [1] hay phát hiện bệnh trên lá cây [2]. Ví dụ như trong việc phát hiện sâu bệnh hằng ngày, người nông dân phải đi khắp cánh đồng và nhận diện các loại sâu bệnh bằng mắt thường, dẫn đến việc tiêu tốn nhiều thời gian và công sức. Thêm nữa, đối với một số loại cây cao, khó quan sát được các bệnh trên lá như: dừa, chuối, việc kịp thời phát hiện bệnh bằng phương pháp truyền thống này là rất khó, dẫn đến những thiệt hại lớn cho người nông dân [3]. Từ những thực trạng đó, đã có nhiều nhóm nghiên cứu tập trung phát triển các hệ thống dựa trên máy học và học sâu nhằm hỗ trợ người nông dân phát hiện kịp thời bệnh trên lá ở những giai đoạn khác nhau.
Hiện nay, tùy vào loại bệnh cũng như kích thước cánh đồng, loại cây trồng và địa hình nơi người nông dân canh tác, bài toán này được chia thành hai hướng chính. 1) Phát hiện bệnh của lá cây dựa trên ảnh chụp gần từ các máy ảnh hoặc điện thoại thông minh; 2) Phát hiện bệnh của lá cây dựa trên ảnh chụp xa từ các thiết bị bay không người lái. Ở hướng thứ nhất, các công trình thường tập trung vào những vườn có diện tích vừa và nhỏ, địa hình đơn giản và cây trồng thấp. Từ đó, việc thu thập mẫu lá sẽ dễ dàng và tiêu tốn ít thời gian. Ban đầu, các nghiên cứu ở hướng này thường ứng dụng các kỹ thuật máy học truyền thống vào nhận diện bệnh trên lá. Hướng tiếp cận này có ưu điểm là nhanh, nhưng lại thường đạt hiệu quả phân loại thấp ở các tập dữ liệu phức tạp với số chiều lớn. Sau đó, đã có nhiều nghiên cứu ứng dụng học sâu để cải thiện độ hiệu suất, đạt được độ chính xác tốt khi phân loại nhưng lại yêu cầu tài nguyên tính toán cao, chưa phù hợp với ngữ cảnh nông nghiệp thông minh.
Ở hướng thứ hai, các công trình nghiên cứu hiện đang phát hiện bệnh dựa trên chỉ số thực vật (VI) hoặc dựa trên đặc điểm hình ảnh của lá cây. Phương pháp này có hai hạn chế chính là: các đặc trưng VI là các đặc trưng được thiết kế thủ công, dẫn đến sự thiếu tính tổng quát; các đặc trưng này có được từ những ảnh đa/siêu phổ, thu thập được từ những cảm biến đa/siêu phổ đắt tiền, chưa phù hợp với các quốc gia dang phát triển với nguồn
lực kinh tế hạn chế. Do vậy, đã có nhiều nhóm nghiên cứu ứng dụng các mô hình học sâu nhằm tự động rút trích đặc trưng trên ảnh màu thay vì ảnh đa/siêu phổ, đạt được độ chính xác cao. Tuy nhiên, các công trình này đa phần vẫn chưa hướng đến việc thiết kế một mô hình gọn nhẹ, có khả năng triển khai xuống các thiết bị biên. Thêm nữa, số lượng tập dữ liệu được công bố và truy cập được ở hướng nghiên cứu này rất hạn chế. Qua thống kê trong khoảng 50 công trình gần đây thì chỉ có một tập dữ liệu được công bố và truy cập được.
Mục tiêu của luận án:
Từ những vấn đề đã nêu ở phần Giới thiệu bài toán, luận án tập trung vào giải quyết thách thức ở hai bài toán (1) Phát hiện
bệnh của lá cây dựa trên ảnh chụp từ các máy ảnh hoặc điện thoại thông minh; (2) Phát hiện bệnh của lá cây dựa trên ảnh chụp từ thiết bị bay không người lái.
Trong quá trình nghiên cứu nhằm giải quyết các thách thức liên quan, luận án có những đóng góp sau:
Nội dung 1:
Đối với bài toán phát hiện bệnh trên lá dựa trên ảnh chụp cận cảnh, luận án đề xuất giải thuật LeIAP nhằm tìm ra các thành phần quan trọng trong mô hình dựa trên kiến trúc thuần Transformer. Bên cạnh đó, luận án còn đề xuất ứng dụng phép nhân ma trận thưa SPMM nhằm giảm thời gian huấn luyện mô hình, được trình bày ở Chương 3 và được công bố ở công trình 1 [TC1, HN1]. Tiếp theo đó, luận án còn ứng dụng LeIAP trên mô hình lai giữa Transformer và CNN nhằm đề xuất được một mô hình gọn nhẹ Tiny-LeViT đạt được hiệu suất phát hiện bệnh tương đương với các nghiên cứu hiện tại và có khả năng hoạt động tốt trên các thiết bị biên, được trình bày ở Chương 4 và được công bố ở công trình 2 [TC2].
Nội dung 2:
Đối với bài toán phát hiện bệnh trên lá dựa trên ảnh chụp từ thiết bị bay không người lái, luận án đề xuất mô hình EF-CenterNet, có số lượng tham số thấp với khả năng phát hiện vùng bệnh hiệu quả trên ảnh có mức phân giải cao. Đồng thời, mô hình cũng được triển khai xuống thiết bị biên nhằm chứng minh tính hiệu quả của mình. Bên cạnh đó, luận án còn xây dựng và công bố tập dữ liệu liên quan đến bệnh trên cây chuối, được thu thập từ máy bay không người lái và được gán nhãn với 14,728 vùng bệnh từ 3,633 ảnh. Các nội dung cụ thể được trình bày ở Chương 5 và được công bố ở công trình 3 [TC3].
Biểu ghi tài liệu: https://opac.vnulib.edu.vn/record=b1436304~S1*vie
Bạn đọc có quan tâm vui lòng đến Thư viện để đọc bản giấy hoặc truy cập xem toàn văn tại địa chỉ sau: https://ir.vnulib.edu.vn/handle/VNUHCM/40296
Mọi thắc mắc cần hỗ trợ về tài khoản truy cập, vui lòng liên hệ thông qua mail: thuvien@uit.edu.vn


