Đồ Án Nghiên cứu, tìm hiểu mạng Neuron và ứng dụng trong nhận dạng tiếng nói tiếng Việt trên tập từ hữu hạ

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    LỜI NÓI ĐẦU


    Xử lý âm thanh và nhận dạng tiếng nói có một ý nghĩa quan trọng và thiết thực trong nhiều lĩnh vực như: nhận dạng, phát thanh, truyền hình, viễn thông, và nhiều lĩnh vực khác.
    Nhận dạng tiếng nói là một lĩnh vực khó, một vấn đề nghiên cứu trọng điểm được nhiều nhà khoa học quan tâm ở các lĩnh vực khác nhau : Tin học, toán học, điều khiển, điện tử, sinh học .
    Trước sự phát triển mạnh mẽ của công nghệ thông tin, vấn đề nhận dạng càng được quan tâm nhiều hơn nhằm nâng cao hiệu quả giao tiếp giữa người và máy. Chính sự quan trọng đặc biệt này mà em đã chọn âm thanh tiếng Việt là đề tài nghiên cứu.

    1. Mục đích của đồ án
    Nghiên cứu, tìm hiểu mạng Neuron và ứng dụng trong nhận dạng tiếng nói tiếng Việt trên tập từ hữu hạn với hưóng nghiên cứu mới trên quan điểm xem xét từ ngữ tiếng Việt dưới góc độ phân tách thành phụ âm và nguyên âm trên tập các đặc trưng LPC, Cepstral, Cosin.
    2. Ý nghĩa
    Hướng nghiên cứu xem xét từ ngữ trên cơ sở phân tách thành phụ âm và nguyên âm là một hướng mới, đơn giản hơn cả về mặt cấu trúc và thiết kế cơ sở dữ liệu cũng như quá trình nhận dạng sau này,mà vẫn đảm bảo được những yêu cầu cần thiết. Nếu giải quyết tốt sẽ cho phép nhận dạng tất cả các từ trong tiếng Việt.
    3. Nhiệm vụ của đồ án.
    Nghiên cứu tìm hiểu lý thuyết về tiếng nói và mô hình mạng Neuron. Ứng dụng mạng neuron để nhận dạng tiếng Việt theo hướng nhận dạng nguyên âm và phụ âm, xây dựng chương trình mô phỏng nhận dạng nguyên âm và phụ âm tiếng Việt.
    4. Phạm vi nghiên cứu
    Đề tài thực hiện trong phạm vi nghiên cứu nhận dạng âm thanh tiếng Việt phát âm rời rạc trên tập từ hữu hạn theo hướng nhận dạng phụ âm và nguyên âm cấu tạo nên từ, xét trên tập từ 11 chữ số tiếng Việt: không, một, hai mười
    với dữ liệu là các File âm thanh WAVE 8 bit, mono,11025Hz.














    MỤC LỤC
    TOC o "1-3" h z u LỜI NÓI ĐẦU    PAGEREF _Toc201354613 h 1 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600310033000000
    CHƯƠNG I: ÂM THANH VÀ SỐ HOÁ ÂM THANH    PAGEREF _Toc201354614 h 3 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600310034000000
    1. ĐẶC TRƯNG SÓNG ÂM    PAGEREF _Toc201354615 h 3 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600310035000000
    1.1 Các đặc trưng PAGEREF _Toc201354616 h 3 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600310036000000
    1.2 Đơn vị vật lý của âm thanh. PAGEREF _Toc201354617 h 4 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600310037000000
    2. QUÁ TRÌNH SỐ HOÁ ÂM THANH   PAGEREF _Toc201354618 h 6 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600310038000000
    3. CẤU TRÚC FILE WAVE   PAGEREF _Toc201354619 h 8 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600310039000000
    4. XỬ LÝ FILE WAVE   PAGEREF _Toc201354620 h 12 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600320030000000
    CHƯƠNG 2: TIẾNG VIỆT VÀ CÁC ĐẶC TRƯNG    PAGEREF _Toc201354621 h 14 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600320031000000
    1  QUÁ TRÌNH PHÁT ÂM    PAGEREF _Toc201354622 h 14 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600320032000000
    2  NGỮ ÂM TIẾNG VIỆT  PAGEREF _Toc201354623 h 15 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600320033000000
    2.1 Khái niệm âm tiết PAGEREF _Toc201354624 h 15 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600320034000000
    2.2 Cấu trúc âm tiết tiếng Việt. PAGEREF _Toc201354625 h 16 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600320035000000
    3. TIỀN XỬ LÝ TÍN HIỆU TIẾNG NÓI  PAGEREF _Toc201354626 h 21 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600320036000000
    4. CÁC ĐẶC TRƯNG   PAGEREF _Toc201354627 h 28 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600320037000000
    5. MỘT SỐ PHÉP BIẾN ĐỔI TOÁN HỌC   PAGEREF _Toc201354628 h 33 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600320038000000
    5.1 Ý nghĩa các phép biến đổi toán học PAGEREF _Toc201354629 h 33 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600320039000000
    5.2 Phép biến đổi Fourier PAGEREF _Toc201354630 h 33 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600330030000000
    5.3 Phép biến đổi CoSine rời rạc PAGEREF _Toc201354631 h 36 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600330031000000
    5.4 Biến đổi Wavelet Haar PAGEREF _Toc201354632 h 41 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600330032000000
    CHƯƠNG III: MẠNG NEURal VÀ ỨNG DỤNG TRONG    PAGEREF _Toc201354633 h 47 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600330033000000
    NHẬN DẠNG ÂM THANH TIẾNG VIỆT   PAGEREF _Toc201354634 h 47 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600330034000000
    1. CÁC PHƯƠNG PHÁP NHẬN DẠNG   PAGEREF _Toc201354635 h 47 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600330035000000
    2. CẤU TRÚC MẠNG NEURAL NHÂN TẠO   PAGEREF _Toc201354636 h 52 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600330036000000
    2.1 Cấu trúc mạng Neuron PAGEREF _Toc201354637 h 52 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600330037000000
    2.2. Mạng neural với thuật giải lan truyền ngược PAGEREF _Toc201354638 h 55 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600330038000000
    2.3 Những vấn đề quan trọng trong mạng Neural lan truyền ngược PAGEREF _Toc201354639 h 63 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600330039000000
    2.4 THIẾT KẾ MẠNG NEURAL   PAGEREF _Toc201354640 h 70 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600340030000000
    CHƯƠNG IV THIẾT KẾ CHƯƠNG TRÌNH NHẬN DẠNG    PAGEREF _Toc201354644 h 73 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600340034000000
    1.THIẾT KẾ CƠ SỞ DỮ LIỆU   PAGEREF _Toc201354645 h 73 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600340035000000
    2. XÂY DỰNG CHƯƠNG TRÌNH   PAGEREF _Toc201354646 h 75 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600340036000000
    KẾT LUẬN VÀ KIẾN NGHỊ  PAGEREF _Toc201354647 h 81 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003300350034003600340037000000



    bạn nào cần chương trình thì PM: vanlen007

    nguyen van hoat
     

    Các file đính kèm:

Đang tải...