Đồ Án Thử nghiệm một phương pháp tổng hợp tiếng nói từ văn bản tiếng Việt

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    Mục lục








    Lời cảm ơn .i Tóm tắt ii Mục lục . iii Danh mục hình ảnh . v Danh mục bảng biểu .vi Chương 1 Tổng quan về hệ thống tổng hợp tiếng nói 1
    1.1 Giới thiệu .1


    1.2 Ý nghĩa của TTS 1


    1.3 Quá trình phát triển của TTS trên thế giới 2


    1.4 TTS ở Việt Nam .2


    1.5 Mục đích của khóa luận 3


    1.6 Cấu trúc của khóa luận .3


    Chương 2 Các phương pháp tổng hợp tiếng nói .4


    2.1 Mô hình chung của một hệ thống TTS 4


    2.1.1 Phân tích văn bản 4


    2.1.2 Phân tích cách đọc .5


    2.1.3 Tạo ra sóng âm thanh 6


    2.2 Phương pháp tổng hợp Formant .6


    2.3 Các phương pháp tổng hợp bằng ghép nối 8


    2.3.1 Phương pháp tổng hợp bằng ghép nối các tiếng .8


    2.3.2 Phương pháp tổng hợp bằng ghép nối các phone .9


    2.3.3 Phương pháp tổng hợp bằng ghép nối diphone 9 2.3.3.1 Điểm pitch . 10 2.3.3.2 Đồng bộ điểm pitch theo miền thời gian TD-PSOLA 11
    2.4 Phương pháp mô phỏng phát âm 12

    2.5 Đặc điểm của tiếng Việt .13


    2.6 Kết luận 14


    Chương 3 Xây dựng TTS tiếng Việt sử dụng phương pháp ghép nối diphone .16


    3.1 Các công cụ thực hiện 16


    3.2 Cài đặt và tạo ra các file khuôn mẫu . 17


    3.3 Định nghĩa tập phone tiếng Việt . 17


    3.4 Xây dựng tập các diphone: .22


    3.4.1 Diphone giữa âm câm và phụ âm: . 23


    3.4.2 Diphone giữa âm câm và nguyên âm .23


    3.4.3 Diphone giữa phụ âm và âm câm 24


    3.4.4 Diphone giữa nguyên âm và âm câm .24


    3.4.5 Diphone giữa phụ âm – nguyên âm . 25


    3.4.6 Diphone giữa nguyên âm – phụ âm . 26


    3.5 Carrier và ý nghĩa của nó 26


    3.6 Ánh xạ các phone tiếng Việt sang tiếng Anh 28


    3.7 Thu âm .29


    3.8 Đánh nhãn các diphone 30


    3.9 Tìm pitchmark 30


    3.9.1 Các bước để lấy pitchmark tốt . 31


    3.10 Kiểm thử . 32


    3.11 Thêm dấu cho tiếng Việt .32


    Chương 4 Tổng kết 34


    4.1 Kết quả thu được 34


    4.2 Các khó khăn thách thức 34


    4.3 Các hướng nghiên cứu phát triển tiếp theo 35


    Tài liệu tham khảo . 36

    Danh mục hình ảnh








    Hình 1 Mô hình một hệ thống tổng hợp tiếng nói .4


    Hình 2 Mô hình 3 formant nối tiếp .7


    Hình 3 Mô hình 5 formant của Klatt 8


    Hình 4 Điểm pitch trong phone 10


    Hình 5 Ghép nối hai diphone . 11


    Hình 6 Thuật toán TD-PSOLA 12


    Hình 7 Sự thay đổi giá trị F0 của các thanh 14


    Hình 8 Sự thay đổi giá trị F0 khi các thanh đi với chữ "chi" .14


    Hình 9 Biểu diễn dạng sóng của một carrier và đánh nhãn diphone 30


    Hình 10 Pitchmark của sóng "taa taa taa" .32
     

    Các file đính kèm:

Đang tải...