Báo Cáo Nghiên cứu, ứng dụng công nghệ sapi. Xây dựng hệ thống stt, tts trong nhận dạng tiếng nói

Thúy Viết Bài · 5/12/13

NGHIÊN CỨU, ỨNG DỤNG CÔNG NGHỆ SAPI.

XÂY DỰNG HỆ THỐNG STT, TTS TRONG NHẬN DẠNG

TIẾNG NÓI

RESEARCH, APPLY SAPI TECHNOLOGY.

BUILDING STT, TTS SYSTEM IN SPEECH RECOGNITION.

SVTH: LÊ QUỐC HƯỞNG - TRẦN BỬU DUNG

PHAN PHẠM THỊ MY LY - 03T4

Khoa Công nghệ Thông tin, Trường Đại học Bách Khoa

GVHD: KS. MAI VĂN HÀ

Khoa Công nghệ Thông tin - Trường Đại học Bách Khoa

TÓM TẮT:

Bài báo này giới thiệu công nghệ SAPI của Microsoft trong nhận dạng tiếng nói và một số kết

quả đạt được khi ứng dụng công nghệ này vào việc chuyển từ giọng nói sang text cũng như

chuyển từ text sang giọng nói bằng tiếng Anh. Trong thời gian đến, chúng tôi sẽ ứng dụng

thành công công nghệ này vào việc xây dựng “hệ thống nhập và thông báo điểm thi tuyển sinh

bằng tiếng Việt“.

SUMARY:

This article introduces SAPI technology of Microsoft in speech recognition and some achieved

results when we apply this technology in speech to text (STT), text to speech(TTS) process by

English. In the next time, we’ll apply this technology successful to build “inputing and notifying

university entrance marks system by Vietnamese“.

1. Giới thiệu

Hiện nay, trên thế giới việc sử dụng các phần mềm về âm thanh không còn là một vấn

đề quá mới mẻ. Tuy nhiên, mỗi quốc gia đều có một đặc thù ngôn ngữ khác nhau nên không

có các quy tắc, các luật chung trong việc xử lý từ. Là một người Việt Nam, chúng tôi luôn tự

hỏi làm thế nào để nhận dạng tiếng Việt. Xuất phát từ ý tưởng đó, chúng tôi đã lựa chọn và

nghiên cứu đề tài này.

Trong quá trình tìm hiểu, chúng tôi nhận thấy rằng một số hãng phần mềm lớn như

Microsoft, Sun, IBM đã xây dựng sẵn các engine trong việc nhận dạng và xử lý tiếng nói.

Trong đó chỉ có một số ít các công ty cung cấp các công nghệ với mã nguồn mở để các lập

trình viên xây dựng nên các ứng dụng phù hợp với mục đích sử dụng của họ. Để giảm thời

gian xây dựng engine, chúng tôi đã lựa chọn công nghệ SAPI của Microsoft vì hiệu quả xử lý

cao và window là hệ điều hành đa người dùng.

Hiện tại, chúng tôi đã đạt được một số kết quả trong việc chuyển từ tiếng nói sang text

và text sang tiếng nói bằng tiếng anh dựa trên nền tảng công nghệ SAPI của Microsoft. Việc

nghiên cứu đề tài này đã tạo ra nền tảng bước đầu cho việc xây dựng ứng dụng trong lĩnh vực

nhận dạng tiếng nói. Hệ thống này mang tính thực tiễn cao vì nó sẽ làm giảm đến mức tối

thiểu các sai sót trong quá trình nhập điểm.

` Trong bài báo này, chúng tôi trình bày những vấn đề cơ bản liên quan đến việc phát

triển hệ thống này.

Báo Cáo Nghiên cứu, ứng dụng công nghệ sapi. Xây dựng hệ thống stt, tts trong nhận dạng tiếng nói

Thúy Viết Bài New Member
Thành viên vàng

Các file đính kèm:

3r-dung-huong-my-ly-.pdf

Luận Văn Nghiên cứu về ngôn ngữ WORRDPRESS và các kỹ thuật xây dựng một Website bán hàng trực tuyến

Luận Văn Nghiên cứu một số kỹ thuật tạo cảnh trong game. Ứng dụng xây dựng game Sonic Run

Đồ Án Nghiên cứu lược đồ chữ ký số và xây dựng ứng dụng

Đồ Án Nghiên cứu và xây dựng hệ thống tem thời gian cho PKI dựa trên bộ phần mềm mã mở TSA

Tiểu Luận Nghiên cứu thói quen sử dụng Internet ở ViệtNam.

Tải tài liệu

Diễn đàn

Chứng nhận bảo mật

Theo dõi chúng tôi

Tìm kiếm hữu ích

Báo Cáo Nghiên cứu, ứng dụng công nghệ sapi. Xây dựng hệ thống stt, tts trong nhận dạng tiếng nói

Thúy Viết Bài New Member Thành viên vàng

Các file đính kèm:

3r-dung-huong-my-ly-.pdf

Luận Văn Nghiên cứu về ngôn ngữ WORRDPRESS và các kỹ thuật xây dựng một Website bán hàng trực tuyến

Luận Văn Nghiên cứu một số kỹ thuật tạo cảnh trong game. Ứng dụng xây dựng game Sonic Run

Đồ Án Nghiên cứu lược đồ chữ ký số và xây dựng ứng dụng

Đồ Án Nghiên cứu và xây dựng hệ thống tem thời gian cho PKI dựa trên bộ phần mềm mã mở TSA

Tiểu Luận Nghiên cứu thói quen sử dụng Internet ở ViệtNam.

Thúy Viết Bài New Member
Thành viên vàng