AILab: Open Internship Positions

Đề tài hướng nghiên cứu: Tìm hiểu về Domain Adaptation và một số ứng dụng

Mô tả

Bài toán thích ứng môi trường mới của các hệ thống máy học không mới, đó là vấn đề một hệ thống được huấn luyện trên một loại dữ liệu nhưng lại được kiểm chứng trên một dữ liệu có phân bố không giống hoặc hoàn toàn khác với phân bố của dữ liệu huấn luyện. Mục tiêu của đề tài là tìm hiểu các phương pháp thích ứng môi trường hiện có và đưa ra một số ứng dụng minh họa.

keywords: domain adaptation, transfer learning, multi-task learning, Learning under sample selection bias, covariate Shift, unsupervised learning 

  1. Về kỹ năng yêu cầu:

 + Ngôn ngữ lập trình chính là matlab và C.

+ Kiến thức nền tảng cần thiết là machine learning,  statistics và convex optimization.

  1. Về kế hoạch thực hiên

+ Giai đoạn 1: tìm hiểu tổng quan về các phương pháp đã được nghiên cứu (xem danh sách bài báo đình kèm và tìm thêm từ mục tham khảo các bài liên quan khác). 

+ Giai đoạn 2: Chọn một lĩnh vực cụ thể để nghiên cứu các thuật toán chuyên sâu. Có thể chọn làm về lĩnh vực nhận dạng tiếng nói vì dữ liệu huấn luyện có thể kế thừa từ những nhóm trước đó.

+ Giai đoạn 3: Chọn ứng dụng cu thể trong lĩnh vực đó (ví dụ: ứng dụng nhận dạng số từ 0 đến 9, không phụ thuộc người nói, qua điện thoại).

+ Giai đoạn 4: viết luận văn và báo cáo.

  1. Về cách thức làm việc

+ Dành thời gian trên AILab ít nhất 3 buổi (sáng hoặc chiều) báo cáo tiến độ 2 tuần 1 lần.

  1. GV hướng dẫn:

TS. Vũ Hải Quân, HCMUS, VNU-HCM

NCS Nguyễn Đức Hoàng Hạ, NTU, SINGAPORE

   Danh sách bài báo cần đọc

(1)     http://www.ailab.hcmus.edu.vn/images/stories/content/2000_journal_paper.pdf

(2)     http://www.ailab.hcmus.edu.vn/images/stories/content/2001_ reviewpaper.pdf

(3)     http://www.ailab.hcmus.edu.vn/images/stories/content/2010_DASVM.pdf

(4)     http://www.ailab.hcmus.edu.vn/images/stories/content/2010_Survey.pdf


Đề tài hướng ứng dụng

 Tìm hiểu về Asterisk và xây dựng hệ thống IVR

 Mô tả

Asterisk là hệ thống mã nguồn mở cung cấp dịch vụ kểt nối giữa máy tính với các thiết bị điện thoại (di động / cố định). Mục tiêu của đề tài này là tìm hiểu về hệ phần mềm mã nguồn mở Asterisk để tích hợp công nghệ nhận dạng và tổng hộ tiếng nói tiếng Việt vào phần mềm hỗ trợ ương tác thông tin qua mạng điện thoại, ứng dụng trong các Callcenter.


Về kỹ năng yêu cầu:

 + Ngôn ngữ lập trình chính là matlab và C.

+ Kiến thức nền tảng cần thiết là machine learning,  statistics và convex optimization.

 Về kế hoạch thực hiên

+ Giai đoạn 1: tìm hiểu tổng quan về các phương pháp đã được nghiên cứu. 

+ Giai đoạn 2: nghiên cứu về hệ thống mã nguồn mở Asterisk.

+ Giai đoạn 3: nghiên cứu tích hợp công nghệ nhận dạng tiếng nói vào Asterisk

+ Giai đoạn 4: thực nghiệm, hiệu chỉnh lỗi

+ Giai đoạn 5: hoàn chỉnh phần mềm, viết báo cáo

 Về cách thức làm việc

 + Dành thời gian trên AILab ít nhất 3 buổi (sáng hoặc chiều) báo cáo tiến độ 2 tuần 1 lần.

GV hướng dẫn: TS. Vũ Hải Quân, HCMUS, VNU-HCM

Hệ thống Asterick: http://www.asterisk.org/

 


 

Các học viên cao học, sinh viên đại học quan tâm gửi tóm tắt thông tin về bản thân và thành tích học tập tới địa chỉ email:vhquan@fit.hcmus.edu.vn trước ngày 06/12/2010.

 

Education - This is a contributing Drupal Theme
Design by WeebPal.