Luận Văn Chuẩn hóa văn bản nâng cao chất lượng tổng hợp tiếng nói

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    Chuẩn hóa văn bản nâng cao chất lượng tổng hợp tiếng nói



    Ngày nay khoa học kỹ thuật đã đạt tới trình độ tiên tiến, công nghệ thông tin phát triển nhanh chóng khiến cho các ứng dụng công nghệ thông tin ngày một rộng rãi, đáp ứng nhu cầu phong phú của đời sống xã hội. Máy tính đã trở thành một công cụ quan trọng trong các hoạt động nghiên cứu, sản suất và hưởng thụ của con người.Vì thế việc nâng cao khả năng tương tác giữa người và máy tính cũng là một công việc cần thiết. Một trong các lĩnh vực cũng đang được đầu tư nghiên cứu và có tiềm năng ứng dụng to lớn hỗ trợ cho giao tiếp của máy tính với con người là tổng hợp tiếng nói Không chỉ hỗ trợ tăng tính tiện nghi cho người sử dụng bình thường, tổng hợp tiếng nói còn cung cấp cho những người khuyết tật không may mắn một phương án tiếp cận hiệu quả để khai thác và sử dụng máy tính đáp ứng cho nhu cầu học tập, lao động và giải trí của mình.
    Lĩnh vực tổng hợp tiếng nói có một tiềm năng ứng dụng rộng rãi trong cuộc sống và ngày càng được quan tâm nghiên cứu phát triển ở khắp nơi trên thế giới.Các ngôn ngữ khác nhau trên thế giới như tiếng Anh, tiếng Nhật, tiếng Trung đã có những bộ tổng hợp tiếng nói cho riêng mình.Ở Việt Nam cũng có một số nhóm nghiên cứu về tổng hợp tiếng nói và đã có những thành quả bước đầu, hứa hẹn sẽ có nhiều ứng dụng hữu ích trong thực tế.
    Các ứng dụng tổng hợp tiếng nói hướng tới việc sở hữu một bộ tổng hợp tiếng nói hoàn chỉnh có khả năng đọc được văn bản càng giống con người càng được đánh giá cao. Một bộ tổng hợp như vậy sẽ phân tích và nhận biết được ở mức độ nào đó và đọc lên được văn bản, có khả năng xử lý được các văn bản thông thường trong thực tế đời sống, có khả năng hiểu được cấu trúc văn bản, cũng như từng thành phần trong văn bản. Thêm vào đó, bộ tổng hợp tiếng nói cần có khả năng phân tích văn bản để đưa ra nhịp điệu đọc phù hợp, sau cùng nó cần lựa chọn hợp lý các dữ liệu có sẵn của nó để đưa ra được tiếng nói tổng hợp tối ưu.
    Để đạt được các mục tiêu như trên, công đoạn đầu tiên và không thể thiếu để một bộ tổng hợp tiếng nói hoạt động tốt đó là nhận biết được từng thành phần trong văn bản và đưa ra được cách đọc hay phiên âm cho chúng, công đoạn này là tiền xử lý văn bản hay “chuẩn hóa văn bản”. Chuẩn hóa văn bản bản thân nó cũng là một bài toán thú vị với những vấn đề phải xử lý khá phong phú, và tùy theo từng ngôn ngữ bài toán này lại có thêm những đặc thù riêng cho ngôn ngữ đó.
    Đồ ánnày được thực hiện trong quá trình sinh viên tham gia thực tập tại Trung tâm Nghiên cứu Quốc tế MICA, trong nhóm nghiên cứu tổng hợp tiếng nói. Mã nguồn chương trình thực thi giải pháp chuẩn hóa văn bản được viết bằng ngôn ngữ lập trình Java trên IDE netbean. Phần việc đồ án thực hiện là một trong các công đoạn của tổng hợp tiếng nói. Các đồ án liên quan của các thành viên trong nhóm gồm có Phân tích cú pháp tiếng Việt, Nghiên cứu trường độ, Nghiên cứu cao độ và Tổng hợp ghép nối bằng lựa chọn đơn vị không đồng nhất.
    Bố cục đồ án được chia theo 5 chương tương ứng như sau
    - Chương 1. Chuẩn hóa văn bản trong tổng hợp tiếng nói
    - Chương 2 Giải pháp cho bài toán chuẩn hóa văn bản tiếng Việt
    - Chương 3 Phát triển bộ chuẩn hóa văn bản tiếng Việt
    - Chương 4 Đánh giá kết quả thử nghiệm
    - Chương 5 Kết luận
     

    Các file đính kèm:

Đang tải...