Đề tài hướng nghiên cứu: Tìm hiểu về Domain Adaptation và một số ứng dụng
Mô tả
Bài toán thích ứng môi trường mới của các hệ thống máy học không mới, đó là vấn đề một hệ thống được huấn luyện trên một loại dữ liệu nhưng lại được kiểm chứng trên một dữ liệu có phân bố không giống hoặc hoàn toàn khác với phân bố của dữ liệu huấn luyện. Mục tiêu của đề tài là tìm hiểu các phương pháp thích ứng môi trường hiện có và đưa ra một số ứng dụng minh họa.
keywords: domain adaptation, transfer learning, multi-task learning, Learning under sample selection bias, covariate Shift, unsupervised learning
+ Ngôn ngữ lập trình chính là matlab và C.
+ Kiến thức nền tảng cần thiết là machine learning, statistics và convex optimization.
+ Giai đoạn 1: tìm hiểu tổng quan về các phương pháp đã được nghiên cứu (xem danh sách bài báo đình kèm và tìm thêm từ mục tham khảo các bài liên quan khác).
+ Giai đoạn 2: Chọn một lĩnh vực cụ thể để nghiên cứu các thuật toán chuyên sâu. Có thể chọn làm về lĩnh vực nhận dạng tiếng nói vì dữ liệu huấn luyện có thể kế thừa từ những nhóm trước đó.
+ Giai đoạn 3: Chọn ứng dụng cu thể trong lĩnh vực đó (ví dụ: ứng dụng nhận dạng số từ 0 đến 9, không phụ thuộc người nói, qua điện thoại).
+ Giai đoạn 4: viết luận văn và báo cáo.
+ Dành thời gian trên AILab ít nhất 3 buổi (sáng hoặc chiều) báo cáo tiến độ 2 tuần 1 lần.
TS. Vũ Hải Quân, HCMUS, VNU-HCM
NCS Nguyễn Đức Hoàng Hạ, NTU, SINGAPORE
Danh sách bài báo cần đọc
(1) http://www.ailab.hcmus.edu.vn/images/stories/content/2000_journal_paper.pdf
(2) http://www.ailab.hcmus.edu.vn/images/stories/content/2001_ reviewpaper.pdf
(3) http://www.ailab.hcmus.edu.vn/images/stories/content/2010_DASVM.pdf
(4) http://www.ailab.hcmus.edu.vn/images/stories/content/2010_Survey.pdf
Đề tài hướng ứng dụng
Tìm hiểu về Asterisk và xây dựng hệ thống IVR
Mô tả
Asterisk là hệ thống mã nguồn mở cung cấp dịch vụ kểt nối giữa máy tính với các thiết bị điện thoại (di động / cố định). Mục tiêu của đề tài này là tìm hiểu về hệ phần mềm mã nguồn mở Asterisk để tích hợp công nghệ nhận dạng và tổng hộ tiếng nói tiếng Việt vào phần mềm hỗ trợ ương tác thông tin qua mạng điện thoại, ứng dụng trong các Callcenter.
Về kỹ năng yêu cầu:
+ Ngôn ngữ lập trình chính là matlab và C.
+ Kiến thức nền tảng cần thiết là machine learning, statistics và convex optimization.
Về kế hoạch thực hiên
+ Giai đoạn 1: tìm hiểu tổng quan về các phương pháp đã được nghiên cứu.
+ Giai đoạn 2: nghiên cứu về hệ thống mã nguồn mở Asterisk.
+ Giai đoạn 3: nghiên cứu tích hợp công nghệ nhận dạng tiếng nói vào Asterisk
+ Giai đoạn 4: thực nghiệm, hiệu chỉnh lỗi
+ Giai đoạn 5: hoàn chỉnh phần mềm, viết báo cáo
Về cách thức làm việc
+ Dành thời gian trên AILab ít nhất 3 buổi (sáng hoặc chiều) báo cáo tiến độ 2 tuần 1 lần.
GV hướng dẫn: TS. Vũ Hải Quân, HCMUS, VNU-HCM
Hệ thống Asterick: http://www.asterisk.org/
Các học viên cao học, sinh viên đại học quan tâm gửi tóm tắt thông tin về bản thân và thành tích học tập tới địa chỉ email:vhquan@fit.hcmus.edu.vn trước ngày 06/12/2010.