Báo Cáo Nghiên cứu, ứng dụng công nghệ sapi. Xây dựng hệ thống stt, tts trong nhận dạng tiếng nói

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    NGHIÊN CỨU, ỨNG DỤNG CÔNG NGHỆ SAPI.

    XÂY DỰNG HỆ THỐNG STT, TTS TRONG NHẬN DẠNG

    TIẾNG NÓI

    RESEARCH, APPLY SAPI TECHNOLOGY.

    BUILDING STT, TTS SYSTEM IN SPEECH RECOGNITION.




    SVTH: LÊ QUỐC HƯỞNG - TRẦN BỬU DUNG

    PHAN PHẠM THỊ MY LY - 03T4

    Khoa Công nghệ Thông tin, Trường Đại học Bách Khoa

    GVHD: KS. MAI VĂN HÀ

    Khoa Công nghệ Thông tin - Trường Đại học Bách Khoa



    TÓM TẮT:

    Bài báo này giới thiệu công nghệ SAPI của Microsoft trong nhận dạng tiếng nói và một số kết

    quả đạt được khi ứng dụng công nghệ này vào việc chuyển từ giọng nói sang text cũng như

    chuyển từ text sang giọng nói bằng tiếng Anh. Trong thời gian đến, chúng tôi sẽ ứng dụng

    thành công công nghệ này vào việc xây dựng “hệ thống nhập và thông báo điểm thi tuyển sinh

    bằng tiếng Việt“.

    SUMARY:

    This article introduces SAPI technology of Microsoft in speech recognition and some achieved

    results when we apply this technology in speech to text (STT), text to speech(TTS) process by

    English. In the next time, we’ll apply this technology successful to build “inputing and notifying

    university entrance marks system by Vietnamese“.



    1. Giới thiệu

    Hiện nay, trên thế giới việc sử dụng các phần mềm về âm thanh không còn là một vấn

    đề quá mới mẻ. Tuy nhiên, mỗi quốc gia đều có một đặc thù ngôn ngữ khác nhau nên không

    có các quy tắc, các luật chung trong việc xử lý từ. Là một người Việt Nam, chúng tôi luôn tự

    hỏi làm thế nào để nhận dạng tiếng Việt. Xuất phát từ ý tưởng đó, chúng tôi đã lựa chọn và

    nghiên cứu đề tài này.

    Trong quá trình tìm hiểu, chúng tôi nhận thấy rằng một số hãng phần mềm lớn như

    Microsoft, Sun, IBM đã xây dựng sẵn các engine trong việc nhận dạng và xử lý tiếng nói.

    Trong đó chỉ có một số ít các công ty cung cấp các công nghệ với mã nguồn mở để các lập

    trình viên xây dựng nên các ứng dụng phù hợp với mục đích sử dụng của họ. Để giảm thời

    gian xây dựng engine, chúng tôi đã lựa chọn công nghệ SAPI của Microsoft vì hiệu quả xử lý

    cao và window là hệ điều hành đa người dùng.

    Hiện tại, chúng tôi đã đạt được một số kết quả trong việc chuyển từ tiếng nói sang text

    và text sang tiếng nói bằng tiếng anh dựa trên nền tảng công nghệ SAPI của Microsoft. Việc

    nghiên cứu đề tài này đã tạo ra nền tảng bước đầu cho việc xây dựng ứng dụng trong lĩnh vực

    nhận dạng tiếng nói. Hệ thống này mang tính thực tiễn cao vì nó sẽ làm giảm đến mức tối

    thiểu các sai sót trong quá trình nhập điểm.

    ` Trong bài báo này, chúng tôi trình bày những vấn đề cơ bản liên quan đến việc phát

    triển hệ thống này.
     

    Các file đính kèm:

Đang tải...