Vượt qua ông lớn Viettel, Sun* đứng thứ ba trong cuộc thi Text To Speech VLSP 2019

Với tổng điểm 3,80, Sun* đã xuất sắc giành được vị trí thứ 3 trong cuộc thi về Tổng hợp tiếng nói do Ban tổ chức Hội nghị thường niên lần thứ 6 về Xử lý ngôn ngữ tự nhiên và tiếng nói cho tiếng Việt tổ chức (VLSP 2019).

Text to Speech là một trong 4 hạng mục mà ban tổ chức VLSP 2019 đưa ra nhằm tháo gỡ một số bài toán hóc búa trong xử lý ngôn ngữ tự nhiên tiếng Việt. 

Ở thời điểm phát động, cuộc thi thu hút gần 40 đội đăng ký tham gia, trong đó có nhiều đội đến từ các công ty công nghệ lớn của Việt Nam như VNG, Zalo, Viettel...

Cái khó của phần thi này là dữ liệu trainning mà ban tổ chức cung cấp rất nhiễu. Để có dữ liệu trainning tốt nhất cho mô hình, các team phải lọc sạch rồi mới đưa cho máy học. Nhưng với lượng dữ liệu 1000 đoạn audio (tổng thời gian 45 phút) cho giọng miền Nam và 15.000 đoạn audio (tổng thời gian 23 giờ) cho giọng miền Bắc, xử lý trong thời gian 2 tuần là rất gấp rút. Đây là lý do nhiều đội thi 'bỏ cuộc'. 

Dù là lần đầu tiên tham gia VLSP 2019 nhưng Sun* không hề kém cạnh, mà vươn lên như một ứng viên xuất sắc cho những vị trí đầu bảng.

Chung cuộc, vượt qua ông lớn Viettel, Sun* đứng thứ 3 với tổng điểm 3,80/5, chịu thua với điểm số sít sao trước 2 đối thủ 'sừng sỏ' là Zalo (3,94/5 điểm) và VNG (3,85/5 điểm). 

Chia sẻ về cuộc thi này, anh Hữu Quang - R&D Unit cho biết: "Với nhiều năm kinh nghiệm trong lĩnh vực xử lý giọng nói, việc VNG có thể về nhất trong cuộc thi này không có gì bất ngờ. Sau cuộc thi này chúng tôi cũng rút ra nhiều kinh nghiệm để khắc phục trong những lần dữ liệu tiếp. ".

Điều anh Quang tiếc nuối nhất là không có đủ thời gian để lọc sạch dữ liệu trainning. Vì thế, anh buộc phải đưa cả dữ liệu nhiễu cho máy học. 

"Sang năm, Sun* sẽ tiếp tục cải thiện những điểm chưa tốt để cải thiện thứ hạng tại VLSP 2020" - anh Quang nói. 

TS Nguyễn Thị Thu Trang - ĐH Bách Khoa Hà Nội cho biết, điều chị ấn tượng nhất về sản phẩm của Sun là chất lượng giọng nói tổng hợp rất mượt, giống y như giọng nói thật. Ở tiêu chí này,  Sun* đạt được 4,13/5, vượt qua cả Zalo với 4,10/5.

 

Trước đó, Sun* đã giành vị trí thứ Nhất ở hạng mục Hate Speech Detection on Social Networks - 1 trong 4 hạng mục của VLSP 2019. 

Xem thêm: Sun* Bear giành chiến thắng tại cuộc thi online về xử lý ngôn ngữ tự nhiên quy mô toàn quốc

Hãy cập nhật những thông tin mới và hấp dẫn nhất từ Sun* News vào 8h00 và 13h00 hàng ngày!

#Sun*

#Viettel

#VNG

#Zalo