Ngay khi phát minh ra máy tính, con người đã mơ ước máy tính có thể nói chuyện với mình. Yêu cầu đơn giản nhất là máy có thể xác định được từ ngữ mà chúng ta nói với máy. Đó là mục tiêu của ngành nhận dạng tiếng nói.
Đối với con người, việc nghe, nhất là nghe tiếng mẹ đẻ là một vấn đề khá đơn giản. Còn đối với máy tính, xác định một chuỗi tín hiệu âm thanh là sự phát âm của một từ nào hoàn toàn không đơn giản, khó khăn cũng tương tự như việc học nghe ngoại ngữ của chúng ta.
Lĩnh vực nhận dạng tiếng nói đã được nghiên cứu hơn 4 thập kỷ và hiện nay mới chỉ có một số thành công. Có thể kể đến hệ thống nhận dạng tiếng Anh (ví dụ: phần mềm Via Voice của IBM, hệ thống nhận dạng tiếng nói tích hợp của OfficeXP…). Các hệ thống này hoạt động khá tốt (cho độ chính xác khoảng 90 – 95%) nhưng còn khá xa mới đạt đến mức mơ ước của chúng ta là có một hệ thống có thể nghe chính xác và hiểu hoàn toàn những điều chúng ta nói.
Riêng với tiếng Việt, lĩnh vực nhận dạng tiếng nói còn khá mới mẻ. Chưa hề thấy xuất hiện một phần mềm nhận dạng tiếng Việt hoàn chỉnh trên thị trường. Số công trình nghiên cứu về nhận dạng tiếng nói tiếng Việt được công bố không nhiều, và kết quả còn hạn chế về bộ từ vựng, độ chính xác…. Tiếng Việt có nhiều đặc tính khác với các ngôn ngữ đã được nghiên cứu nhận dạng nhiều như tiếng Anh, tiếng Pháp. Do đó việc nghiên cứu nhận dạng tiếng Việt là rất cần thiết.
Vì những lý do trên, sau khi học xong môn “Trí tuệ nhân tạo tiên tiến”, ở mức độ của một tiểu luận môn học, chúng em chọn đề tài “Ứng dụng mạng neuron nhân tạo trong nhận dạng tiếng Việt” nhằm nghiên cứu các phương pháp nhận dạng tiếng nói đối với tiếng Việt và thử nghiệm xây dựng một hệ thống nhận dạng cỡ nhỏ để nhận dạng việc đọc các số từ “không” đến “chín”.
THÊM FULLTEXT MỘT LUẬN VĂN CAO HỌC (Cùng tác giả)
PS: Khi mà giờ đây, ai cũng nói về trí tuệ nhân tạo, mạng neuron nhân tạo như là một cái gì đó hot hot, thì người ta đã code từ đầu cách đây cả 11 năm. Giờ thì MỌI THỨ có anh Python và cộng đồng support ΨΨΨΨΨΨΨ