Luận Văn Lựa chọn đơn vị âm không đồng nhất trong tổng hợp tiếng nói tiếng việt

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    167
    Điểm thành tích:
    0
    Xu:
    0Xu
    Lựa chọn đơn vị âm không đồng nhất trong tổng hợp tiếng nói tiếng việt

    Máy vi tính là một trong những phát minh ảnh hưởng nhiều nhất tới đời sống con người trong thế kỉ vừa qua. Với máy vi tính, con người có thể làm được nhiều việc mà trước đó người ta không nghĩ tới. Lĩnh vực tương tác người máy ra đời giúp con người dễ dàng tương tác hơn với máy tính. Trước đây, con người có thể tương tác với máy tính bằng mắt, bằng tay thông qua các thiết bị như bàn phím, chuột, màn hình. Càng ngày yêu cầu về tính tiện dụng trong tương tác của con người ngày càng cao. Các hình thức tương tác mới ra đời như tương tác bằng cử chỉ, giọng nói
    Tổng hợp tiếng nói là một lĩnh vực quan trọng trong giao tiếp người máy và được nghiên cứu, phát triển từ khá sớm trên thế giới. Tại Việt Nam đã có nhiều bộ tổng hợp tiếng nói được phát triển như bộ tổng hợp “Sao Mai” của trung tâm Sao Mai, “Hoa Súng” của trung tâm nghiên cứu Mica – ĐH BKHN, “Tiếng nói phương Nam” của ĐHQG-TPHCM. Tuy nhiên, các bộ tổng hợp trên vẫn còn cần cải thiện hoặc về chất lượng tiếng nói, hoặc về kích thước CSDL. Với mong muốn xây dựng một bộ tổng hợp tiếng nói có chất lượng tốt, kích thước CSDL không quá lớn, đồ án này quyết định chọn phương pháp lựa chọn đơn vị không đồng nhất để tìm hiểu và áp dụng vào chương trình tổng hợp tiếng nói. Đồ án được thực hiện tại trung tâm nghiên cứu quốc tế MICA Trong quá trình thực hiện đồ án, tác giả đã được tiếp cận những kiến thức bổ ích từ các cán bộ nghiên cứu của trung tâm phục vụ cho quá trình làm đồ án.
    Trong các bộ tổng hợp, tiếng nói được tổng hợp bằng cách ghép nối các đơn vị âm lại với nhau,các đơn vị âm này là cùng một loại duy nhất, ví dụ cùng là âm vị kép, cùng là bán âm tiết Đây là cách tiếp cận lựa chọn đơn vị đồng nhất – tức là chỉ dùng một loại đơn vị âm. Và kích thước CSDL dùng trong các bộ tổng hợp này thường bị giới hạn.
    Trong vài năm trở lại đây, sự phát triển của khoa học công nghệ đã nâng cao khả năng lưu trữ và xử lý của máy tính. Kích thước CSDL của bộ tổng hợp tiếng nói có thể được tăng lên để cải thiện chất lượng tiếng nói tổng hợp. Phương pháp lựa chọn đơn vị không đồng nhất được thử nghiệm. Nhiều loại đơn vị âm được sử dụng với tư tưởng sử dụng đơn vị âm càng dài thì chất lượng càng cao. Với mỗi ngôn ngữ khác nhau, phương pháp này được áp dụng theo các cách thức khác nhau và đồ án này tập trung áp dụng phương pháp này cho ngôn ngữ tiếng Viêt.
    Đồ án này bao gồm bốn chương:
    -Chương một: giới thiệu về tổng hợp tiếng nói và những vấn đề trong tổng hợp tiếng nói.
    -Chương hai: trình bày chi tiết về bài toán lựa chọn đơn vị trong tổng hợp ghép nối.
    -Chương ba: mô tả chi tiết hệ thống tổng hợp tiếng Việt theo thuật toán lựa chọn đơn vị không đồng nhất.
    -Chương bốn: đánh giá kết quả đạt được và chưa được, đồng thời đưa ra hướng phát triển tiếp theo.
     
Đang tải...