Thư viện - Trường Đại học Công nghệ Thông tin
Thư viện UIT

Thư viện UIT - June 10, 2025

Giới thiệu sách.gif[GÓC GIỚI THIỆU LUẬN ÁN CHUẨN BỊ BẢO VỆ]

Thư viện trân trọng giới thiệu đến quý bạn đọc bản Luận án và tóm tắt luận án được trưng bày ở thư viện từ ngày 05/6/2025 đến khi được bảo vệ. Quý bạn đọc có quan tâm đến đề tài này vui lòng đến tham khảo.

Tên luận án: NGHIÊN CỨU CÁC KỸ THUẬT PHÂN TÍCH Ý KIẾN TRÊN BÌNH LUẬN PHẢN HỒI CỦA NGƯỜI DÙNG

Tác giả: Đặng Văn Thìn

Người hướng dẫn: PGS.TS. Nguyễn Lưu Thùy Ngân

TÓM TẮT LUẬN ÁN

Phân tích ý kiến, hay còn gọi là phân tích cảm xúc hoặc phân tích quan điểm, là một lĩnh vực nghiên cứu không chỉ thu hút sự quan tâm của cộng đồng học thuật mà còn của các tổ chức và doanh nghiệp, bởi tính ứng dụng thực tiễn cao trong việc khai thác thông tin từ bình luận phản hồi của người dùng. Luận án này tập trung vào việc nghiên cứu các phương pháp và mô hình cho bài toán phân tích ý kiến trên bình luận phản hồi của người dùng. Trọng tâm của các nghiên cứu là nâng cao hiệu suất dự đoán trên các bộ dữ liệu tiếng Việt, đồng thời thử nghiệm một số phương pháp trên các ngôn ngữ ít tài nguyên khác. Các đóng góp chính của luận án được trình bày như sau:

- Đóng góp 1: Đề xuất các phương pháp nâng cao độ chính xác cho bài toán phân tích ý kiến theo mức độ dữ liệu. Trong nội dung này, luận án đã nghiên cứu ba phương pháp nhằm giải quyết bài toán phân loại ý kiến theo các mức độ dữ liệu, bao gồm: (1) phương pháp học chuyển tiếp dựa trên mô hình ngôn ngữ theo hướng phân loại; (2) phương pháp học chuyển tiếp dựa trên mô hình ngôn ngữ theo hướng tạo sinh văn bản; và (3) phương pháp tổ hợp dựa trên mô hình ngôn ngữ. Ngoài các thử nghiệm được thực hiện chính trên ngôn ngữ tiếng Việt, luận án còn áp dụng các kỹ thuật và phương pháp này trên một số ngôn ngữ ít tài nguyên và thu được kết quả khả quan. Các kết quả nghiên cứu đã được công bố trong các công trình CT.01, CT.04, CT.06, và CT.08 Mục 6.2.

- Đóng góp 2: Xây dựng các mô hình nâng cao độ chính xác cho bài toán phân tích ý kiến theo hai quan điểm: thông thường và so sánh. Trong nội dung này, nghiên cứu sinh đã đề xuất hai mô hình để giải quyết hai bài toán thách thức liên quan đến quan điểm ý kiến thông thường và quan điểm so sánh. Cụ thể, luận án giới thiệu mô hình ngôn ngữ tạo sinh kết hợp lời nhắc theo hướng đa tác vụ nhằm giải quyết bài toán trích xuất bộ bốn thuộc tính trong các quan điểm ý kiến thông thưởng. Đối với bình luận so sánh, luận án đề xuất một kiến trúc hai giai đoạn đế xác định bình luận so sánh và trích xuất bộ năm thuộc tính của ý kiến so sánh. Các kết quả nghiên cứu này đã được công bố tại các tạp chí quốc tế và trong nước uy tín qua các công trình CT.05 và CT.07. 

- Đóng góp 3: Đề xuất các phương pháp cho vấn đề dữ liệu hạn chế dữ liệu huấn luyện trọng bài toán phân tích ý kiến. Vấn đề hạn chế dữ liệu hoặc không có dữ liệu huấn luyện trong một số lĩnh vực hoặc ngôn ngữ ít tài nguyên là một thách thức lớn trong nghiên cứu và ứng dụng thực tế. Để giải quyết vấn đề này, luận án đã nghiên cứu hai phương pháp cụ thể. Thứ nhất, luận án trình bày phương pháp tận dụng sức mạnh của các mô hình đa ngôn ngữ, kết hợp với dữ liệu từ các ngôn ngữ giàu tài nguyên, trong hai tình huống: không có dữ liệu ở ngôn ngữ thử nghiệm và bổ sung dữ liệu từ ngôn ngữ giàu tài nguyên để nâng cao tập mẫu huấn luyện. Thứ hai, luận án nghiên cứu cách thiết kế lời nhắc (prompt) dựa trên sức mạnh của các mô hình ngôn ngữ lớn nhằm hỗ trợ phân tích ý kiến ở các cấp độ khác nhau và trên nhiều miền dữ liệu đa dạng. Kết quả nghiên cứu đã được công bố tại một tạp chí và một hội nghị quốc tế trong các công trình CT.03 và CT.09.

505511785_1271479188311694_265419464320923499_n.jpg