Đồ Án Xây dựng bộ điều khiển và nhận dạng tiếng nói bằng xử lý

Thảo luận trong 'Cơ Khí' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    GIỚI THIỆU



    I. Tổng quan:

    Luận văn này thực hiện việc xây dựng bộ điều khiển và nhận dạng tiếng nói bằng xử lý tín hiệu số DSP56002.

    Một vài thập niên trước đây, việc nhận dạng tiếng nói bằng máy chỉ tồn tại trong suy nghĩ của các nhà khoa học viễn tưởng, tuy nhiên trong một vài năm gần đây, vấn đề tìm hiểu và thực hiện một hệ thống nhận dạng tiếng nói một cách tự động đã được đưa vào nghiên cứu trong các viện nghiên cứu trên khắp thế giới. Những ứng dụng thực tiễn mà hệ thống này sẽ mang lại là vô cùng lớn như các máy tính của chúng ta sẽ không cần bàn phím, các hệ thống điều khiển sẽ không cần các bảng điều khiển phức tạp, máy điện thoại sẽ không còn cần đến các bàn quay số . có thể xem là một bước đột phá trên tất cả các lĩnh vực trong cuộc sống của chúng ta. Do đó vấn đề nghiên cứu các phương pháp nhận dạng tiếng nói là một vấn đề đã và đang thu hút rất nhiều sự đầu tư và nghiên cứu của các nhà khoa học trên khắp thế giới. Tuy nhiên cho đến nay kết quả mang lại còn rất hạn chế vì sự phức tạp của tiếng nói con người.

    Đối với nước ta, vấn đề nhận dạng tiếng nói đang ở trong giai đoạn đầu và các kết quả đạt được cho đến nay vẫn còn khiêm tốn. Luận văn này nghiên cứu thử nghiệm một hướng nhận dạng tiếng nói dựa trên đặc trưng ngữ âm quan trọng của tiếng nói là formant. Công cụ toán học có thể sử dụng là phép phân tích Fourier thời gian ngắn STFT(Short Time Fourier Transform). Nhận dạng tiếng nói là bộ phận nòng cốt trong bộ điều khiển tiếng nói cần thiết kế.





    II . Những nội dung chính của luận văn:

    Các chương 2, 3, 4, 5, 6 giới thiệu về xử lý tín hiệu số DSP56002, bộ giao tiếp âm thanh đa năng Codec 4215, bộ nhớ mở rộng, mạch giao tiếp và điều khiển. Chương 2 giới thiệu tổng quát về bộ xử lý tín hiệu số DSP56002. Tiếp đến Chương 3 mô tả cụ thể các chức năng của DSP56002 bao gồm: cấu trúc và các chế độ định địa chỉ củûa DSP56002; các thanh ghi trong và chế độ hoạt động của các PORT của DSP56002. Chương 4 mô tả tập lệnh xử lý tín hiệu số DSP56002. Chương 5 giới thiệu về CODEC giao tiếp âm thanh đa năng CS4215, bộ đồng bộ giao tiếp nối tiếp (SSI) của bộ xử lí DSP56002 được sử dụng để thích nghi với sự truyền dữ liệu nối tiếp từ hai bộ chuyển đổi A/D của CS4215 đến DSP56002 và từ DSP56002 đến hai bộ chuyển đổi D/A của CS4215. Chương 6 mở rộng bộ nhớ cho DSP56002; chương này sẽ trình bày về sơ đồ mạch của DSP56002EVM, bộ nhớ mở rộng, sơ đồ điều khiển động cơ DC và các linh kiện sử dụng trong mạch. Các chương sau sẽ giới thiệu về các công cụ toán học và phương pháp nhận dạng tiếng nói. Chương 7 giới thiệu về phép biến đổi Fourier với tín hiệu liên tục và rời rạc, và giới thiệu phương pháp biến đổi nhanh Fourier FFT thực hiện trên DSP56002 sử dụng giải thuật phân chia theo thời gian DIT (decimation-in-time). Tiếp theo Chương 8 trình bày phép tổng quát về biến đổi Fourier thời gian ngắn STFT. Cuối cùng là Chương 9 sẽ tập trung vào phép biến đổi Fourier thời gian ngắn để trích formant của tín hiệu, Sau khi trích formant của tín hiệu sẽ sử dụng phương pháp kết hợp mẫu để nhận dạng tiếng nói.



    III. Kết luận sơ bộ:

    Luận văn đã thực hiện được việc :mở rộng bộ nhớ cho DSP56002, nhận dữ liệu âm thanh từ ngoài qua giao tiếp SSI giữa DSP56002 và CS4215, thực hiện trích formant của tín hiệu tiếng nói dùng giải thuật STFT. Cuối cùng là đã thực hiện được việc nhận dạng tiếng nói và ứng dụng để điều khiển.


    MỤC LỤC


    CHƯƠNG I: GIỚI THIỆU . 1
    CHƯƠNG II: GIỚI THIỆU BỘ XỬ LÝ TÍN HIỆU SỐ VÀ KHỐI ĐÁNH GIÁ DSP56002 3
    A. MÔ TẢ TỔNG QUÁT BỘ XỬ LÝ TÍN HIỆU SỐ DSP56002 3
    B. GIỚI THIỆU DSP56002EVM . 5
    C. GIỚI THIỆU TỔNG QUÁT CÁC CHÂN . 6
    CHƯƠNG III: MÔ TẢ CHỨC NĂNG DSP56002 11
    A. CẤU TRÚC DSP56002 . 11
    B. ĐƠN VỊ ALU DỮ LIỆU 13
    C. BỘ ĐIỀU KHIỂN CHƯƠNG TRÌNH 16
    D. ĐƠN VỊ CẤP PHÁT ĐỊA CHỈ 18
    E. CÁC CHẾ ĐỘ ĐỊNH ĐỊA CHỈ . 20
    F. PORT A CỦA DSP56002 22
    G. PORT B CỦA DSP56002 26
    H. PORT C CỦA DSP56002 31
    I. THANH GHI ƯU TIÊN NGẮT (IPR) CỦA DSP56002 43
    J. BỘ DAO ĐỘNG XUNG VÒNG GIỮ PHA (PLL) 45
    K. MÔ PHỎNG TRÊN CHIP (ONCE) . 48
    L. BỘ ĐỊNH THỜI VÀ ĐẾM SỰ KIỆN CỦA DSP56002 . 52
    CHƯƠNG IV: TẬP LỆNH DSP56002 . 57
    A. DẠNG LỆNH 57
    B. CÁC THAO TÁC TRUYỀN DỮ LIỆU SONG SONG . 58
    C. CÁC LOẠI TRUYỀN DỮ LIỆU SONG SONG 58
    D. TẬP LỆNH DSP56002 59
    CHƯƠNG V: CODEC GIAO TIẾP ÂM THANH ĐA NĂNG 67
    I. GIỚITHIỆU 67
    II. MÔ TẢ CHỨC NĂNG CÁC CHÂN . 69
    III. ĐẶC TÍNH TƯƠNG TỰ . 70
    IV. CÁC ĐẶC TÍNH CHUYỂN ĐỔI 74
    V.CHẾ ĐỘ ĐIỀU KHIỂN . 74
    VI.CHẾ ĐỘ DỮ LIỆU . 79
    CHƯƠNG VI: MỞ RỘNG BỘ NHỚ CHO DSP56002 83
    A. CÁC LINH KIỆN SỬ DỤNG 83
    B. SƠ ĐỒ MẠCH . 86
    CHƯƠNG VII: BIẾN ĐỔI FOURIER . 94
    A. BIẾN ĐỔI FOURIER LIÊN TỤC . 94
    B. BIẾN ĐỔI FOURIER RỜI RẠC . 96
    C. PHÂN TÍCH BIẾN ĐỔI NHANH FOURIER . 96
    CHƯƠNG VIII: BIẾN ĐỔI FOURIER THỜI GIAN NGẮN 101
    A. CÔNG THỨC BIẾN ĐỔI 102
    B. TÍNH CHẤT 103
    C. HẠN CHẾ CỦA PHÉP BIẾN ĐỔI FOURIER THỜI GIAN NGẮN . 103
    CHƯƠNG IX : XỬ LÝ TÍN HIỆU TIẾNG NÓI . 104
    I. TRÍCH ĐẶC TRƯNG TIẾNG NÓI DÙNG PHÉP PHÂN TÍCH STFT . 104
    II. NHẬN DẠNG TIẾNG NÓI . 122
    III.CHƯƠNG TRÌNH NHẬN DẠNG TIẾNG NÓI . 126
    KẾT QUẢ 167
    KẾT LUẬN 168
    HƯỚNG PHÁT TRIỂN 169
    PHỤ LỤC A . 170
    PHỤ LỤC B . 176
    TÀI LIỆU THAM KHẢO
     

    Các file đính kèm:

Đang tải...