Thạc Sĩ Thực thi thời gian thực mô hình thuật toán MELP trên bộ xử lý tín hiệu số TMS320C5509

Thảo luận trong 'THẠC SĨ - TIẾN SĨ' bắt đầu bởi Quy Ẩn Giang Hồ, 2/9/15.

  1. Quy Ẩn Giang Hồ

    Quy Ẩn Giang Hồ Administrator
    Thành viên BQT

    Bài viết:
    3,084
    Được thích:
    23
    Điểm thành tích:
    38
    Xu:
    0Xu
    #1 Quy Ẩn Giang Hồ, 2/9/15
    Last edited by a moderator: 2/9/15
    MỞ ĐẦU
    1. Lý do chọn đề tài
    Hiện nay, nén dữ liệu âm thanh nói chung và nén dữ liệu tiếng nói nói riêng đã và đang được các nhà khoa học, công nghệ trên thế giới quan tâm nghiên cứu, các kết quả đạt được đã được ứng dụng nhiều trong lĩnh vực truyền thông và giải trí. Đặc biệt, trong điều kiện công nghệ thông tin, truyền thông đang phát triển rất mạnh như hiện nay thì vấn đề xử lý âm thanh, tiếng nói càng được nghiên cứu và ứng dụng rộng rãi.
    Đã có rất nhiều thuật toán và mô hình xử lý tiếng nói được nghiên cứu và sử dụng, trong đó, mô hình dự đoán tuyến tính (LPC) là một phần không thể thiếu của hầu hết tất cả các giải thuật mã hóa thoại hiện đại ngày nay. Ý tưởng cơ bản là một mẫu thoại có thể được xấp xỉ bằng một kết hợp tuyến tính của các mẫu trong quá khứ. Trong một khung tín hiệu, các trọng số dùng để tính toán kết hợp tuyến tính được tìm bằng cách tối thiểu hóa bình phương trung bình sai số dự đoán; các trọng số tổng hợp, hoặc các hệ số dự đoán tuyến tính được dùng đại diện cho một khung cụ thể. Mô hình MELP (dự đoán tuyến tính kích thích hỗn hợp) được thiết kế để vượt qua một số hạn chế của mô hình LPC, sử dụng một mô hình tạo tiếng nói phức tạp hơn, với các thông số bổ xung để cải thiện độ chính xác. MELP bắt đầu được phát triển bởi McCree từ năm 1995, tích hợp nhiều nghiên cứu tiến bộ vào thời điểm đó, bao gồm cả lượng tử hóa vec-tơ,
    tổng hợp tiếng nói và cải tiến từ mô hình LPC cơ bản.
    Hiệu quả của MELP đã được chứng minh thực tế khi được NATO và Mỹ chấp nhận và sử dụng trong nhiều thiết bị quân sự. Tuy nhiên ở Việt Nam thì MELP chưa được chú ý nghiên cứu, phát triển vì tính ứng dụng hẹp: chủ yếu trong lĩnh vực quân sự. Xuất phát từ những lý do trên mà tôi đã chọn đề tài: “Thực thi thời gian thực mô hình thuật toán MELP trên bộ xử lý tín hiệu số TMS320C5509”.
    2. Mục tiêu và nhiệm vụ nghiên cứu
    Mục tiêu của luận văn này là triển khai trong thời gian thực thuật toán nénthoại MELP trên bộ xử lý tín hiệu số TMS320C55xx, với các nội dung như sau:
    - Phân tích tổng quan về nén thoại.
    - Mô hình nén thoại MELP.
    - Phân tích, nghiên cứu bộ xử lý tín hiệu số TMS320C55X .
    - Phân tích, xây dựng, triển khai thực thi thời gian thực mô hình MELP trên bộ xử lý tín hiệu số TMS320C5509, đề xuất cải tiến MELP và đánh giá kết quả thử nghiệm.
    3. Đối tượng và phạm vi nghiên cứu
    + Đối tượng nghiên cứu
    - Tìm hiểu tổng quan về nén thoại và thuật toán MELP,
    - Nghiên cứu bộ xử lý tín hiệu số TMS320C55xx.
    + Phạm vi nghiên cứu
    - Các vấn đề về nén dữ liệu tiếng nói.
    - Ứng dụng thuật toán MELP trên bộ xử lý tín hiệu số TMS320C5509
    4. Phương pháp nghiên cứu
    + Phương pháp nghiên cứu lý thuyết
    - Nghiên cứu tài liệu, ngôn ngữ và công nghệ liên quan.
    - Tổng hợp các tài liệu.
    - Phân tích và thiết kế hệ thống.
    + Phương pháp nghiên cứu thực nghiệm
    - Thiết kế và triển khai thuật toán trên chip TMS320C5509
    - Đánh giá kết quả đạt được, đề xuất phương án mở rộng kết quả nghiên cứu.
    5. Kết quả dự kiến
    Phân tích, thiết kế hệ thống và triển khai hoàn chỉnh thuật toán MELP trên chip TMS320C5509.
    6. Ý nghĩa khoa học và thực tiễn của luận văn
    + Về mặt lý thuyết
    - Tìm hiểu tổng quan về nén thoại và thuật toán MELP.
    - Đề xuất khả năng triển khai thuật toán MELP trên bộ xử lý tín hiệu số
    + Về mặt thực tiễn
    - Ứng dụng các công cụ, ngôn ngữ hỗ trợ để triển khai, cài đặt thuật toán
    MELP trên bộ xử lý tín hiệu số TMS320C5509.
    - Kết quả của luận văn có thể áp dụng cho ứng dụng thực tiễn, đặc biệt
    trong lĩnh vực quân sự.
    7. Đặt tên đề tài
    THỰC THI THỜI GIAN THỰC MÔ HÌNH THUẬT TOÁN MELP TRÊN BỘ XỬ LÝ TÍN HIỆU SỐ TMS320C5509
    8. Bố cục luận văn
    Nội dung chính của luận văn được chia thành 4 chương như sau:
    Chương 1: Tổng quan về nén thoại
    Chương 2: Mô hình nén thoại MELP
    Chương 3: Chip xử lý tín hiệu số TMS320C55x
    Chương 4: Cài đặt và thử nghiệm
    Phụ Lục: Mô hình LPC và Lượng tử hóa véc-tơ nhiều lớp

    MỤC LỤC
    LỜI CAM ĐOAN
    MỤC LỤC
    MỤC LỤC BẢNG BIỂU
    MỤC LỤC HÌNH VẼ
    DANH MỤC VIẾT TẮT
    MỞ ĐẦU . 1
    Chương 1 - TỔNG QUAN NÉN THOẠI 4
    1.1 Cấu trúc của hệ thống nén thoại 4
    1.2 Các thuộc tính lý tưởng của nén thoại 6
    1.3 Trễ nén 7
    1.4 Ứng dụng của các mô hình nén thoại 9
    Chương 2 - MÔ HÌNH NÉN THOẠI MELP . 10
    2.1 Mô hình tạo tiếng nói MELP 10
    2.2 Biên độ Fourier (Fourier Manitudes) 11
    2.3 Bộ lọc định hình 15
    2.4 Pitch period và ước lượng voice strength . 17
    2.5 Hoạt động mã hóa . 24
    2.6 Hoạt động giải mã . 27
    2.7 Kết chương 30
    Chương 3 - CHIP XỬ LÝ TÍN HIỆU SỐ TMS320C55xx 32
    3.1 Giới thiệu . 32
    3.2 Kiến trúc họ TMS32C55xx . 32
    3.3 Công cụ phát triển . 37
    3.4 Các chế độ địa chỉ TMS320C55x . 42
    3.5 Đường ống và cơ chế song song . 44
    3.6 Tập lệnh TMS320C55x . 47
    3.7 Lập trình hỗn hợp C và Assembly 48
    Chương 4 - CÀI ĐẶT VÀ THỬ NGHIỆM . 51
    4.1 Cài đặt MELP thời gian thực trên C5509 và C5510. 51
    4.2 Thực hiện cài đặt . 52
    4.3 Đánh giá kết quả 59
    KẾT LUẬN . 63
    Kết quả đạt được của luận văn 63
    Định hướng nghiên cứu tiếp theo 63
    TÀI LIỆU THAM KHẢO 64
    PHỤ LỤC i
    A. Mô hình mã hóa dự đoán tuyến tính LPC i
    B. Thuật toán Levinson-Durbin iii
    C. Lượng tử hóa véc-tơ nhiều lớp (MSVQ) vii
     
Đang tải...