Đồ Án TỐT NGHIỆP : Speech Enhancement - Xử lý nâng cao chất lượng tiếng nói

Thảo luận trong 'Điện - Điện Tử' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

    Độc lập – Tự do – Hạnh phúc


    LỜI CAM ĐOAN

    Kính gửi: Hội đồng bảo vệ đồ án tốt nghiệp Khoa Điện tử _ Viễn thông _Trường Đại học Bách Khoa Đà Nẵng.

    Em tên là : Nguyễn Thị Ngọc Diệp

    Hiện đang học lớp 04ĐT1 - Khoa: Điện tử - Viễn thông – Trường: Đại học Bách Khoa Đà Nẵng.

    Nhóm em xin cam đoan nội dung của đồ án này không phải là bản sao chép của bất cứ đồ án hoặc công trình đã có từ trước.

    Sinh viên thực hiện

    Nguyễn Thị Ngọc Diệp


    MỤC LỤC




    LỜI CAM ĐOAN 1


    MỤC LỤC 2


    DANH MỤC CÁC TỪ VIẾT TẮT VÀ CÁC THUẬT NGỮ TIẾNG ANH 8


    MỞ ĐẦU 10


    CHƯƠNG 1: TỔNG QUAN VỀ NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI . 13


    1.1 Giới thiệu chương 13


    1.2 Nâng cao chất lượng tiếng nói là gì ? 13


    1.3 Lý thuyết về tín hiệu và nhiễu . 15


    1.3.1 Tín hiệu, hệ thống và xử lý tín hiệu .15


    1.3.1.1 Tín hiệu 15


    1.3.1.2 Nguồn tín hiệu 15


    1.3.1.3 Hệ thống và xử lý tín hiệu 16


    1.3.1.4 Phân loại tín hiệu 16


    1.4 Lý thuyết về nhiễu . 17


    1.4.1 Nguồn nhiễu .17


    1.4.2 Nhiễu và mức tín hiệu tiếng nói trong các môi trường khác nhau .19


    1.5 Tín hiệu rời rạc theo thời gian . 20


    1.5.1 Tín hiệu bước nhảy đơn vị .21


    1.5.2 Tín hiệu xung đơn vị 21


    1.5.3 Tín hiệu hàm mũ 21


    1.5.4 Tín hiệu hàm sin rời rạc .21


    1.6 Phép biến đổi Fourier của tín hiệu rời rạc DTFT 22


    1.6.1 Sự hội tụ của phép biến đổi Fourier .22



    1.6.2 Quan hệ giữa biến đổi Z và biến đổi Fourier .22


    1.6.3 Phép biến đổi Fourier ngược 23


    1.6.4 Các tính chất của phép biến đổi Fourier 23


    1.6.5 Phân tích tần số (phổ) cho tín hiệu rời rạc .24


    1.6.6 Phổ tín hiệu và phổ pha 25


    1.7 Các thuật toán sử dụng nâng cao chất lượng tiếng nói 26


    1.7.1 Trừ phổ .26


    1.7.2 Mô hình thống kê .26


    1.8 Tín hiệu tiếng nói . 26


    1.9 Cơ chế tạo tiếng nói . 28


    1.9.1.1 Bộ máy phát âm của con người 28


    1.9.2 Mô hình kỹ thuật của việc tạo tiếng nói .28


    1.9.3 Phân loại âm .29


    1.9.4 Thuộc tính âm học của tiếng nói 29


    1.10 Kết luận chương 29


    CHƯƠNG 2 : ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI 30


    2.1 Giới thiệu chương 30


    2.2 Phương pháp đánh giá chủ quan 30


    2.2.1 Các phương pháp đánh giá tuyệt đối 31


    2.2.1.1 Phương pháp đánh giá tuyệt đối ACR . 31


    2.2.2 Các phương pháp đánh giá tương đối 31


    2.2.2.1 Đánh giá bằng phương pháp so sánh các mẫu tín hiệu 31


    2.2.2.2 Phương pháp đánh giá theo sự suy giảm chất lượng . 32


    2.3 Phương pháp đánh giá khách quan 33


    2.3.1 Đo tỷ số tín hiệu trên nhiễu trên từng khung .33


    2.3.2 Đo khoảng cách phổ dựa trên LPC 35


    2.3.2.1 Phương pháp đo LLR . 35


    2.3.2.2 Phương pháp đo IS . 36


    2.3.2.3 Phương pháp đo theo khoảng cách cepstrum . 36


    2.3.3 Đánh giá mô phỏng theo cảm nhận nghe của con người .37


    2.3.3.1 Phương pháp đo Weighted Spectral Slope . 37


    2.3.3.2 Phương pháp đo Bark Distortion . 38


    2.3.3.3 Phương pháp đánh giá cảm nhận chất lượng thoại PESQ . 39


    2.4 Kết luận chương 39


    CHƯƠNG 3: THUẬT TOÁN SPECTRAL–SUBTRACTION VÀ WIENER FILTERING . 41


    3.1 Giới thiệu chương 41


    3.2 Sơ đồ khối chung của Spectral Subtraction và Wiener Filtering 41


    3.3 Thuật toán Spectral Subtraction 41


    3.3.1 Giới thiệu chung .41


    3.3.2 Spectral subtraction đối với phổ biên độ .42


    3.3.3 Spectral subtraction đối với phổ công suất 43


    3.4 Thuật toán Wiener Filtering 45


    3.4.1 Giới thiệu chung .45


    3.4.2 Nguyên lý cơ bản của Wiener Filtering .46


    3.5 Overlap và Adding trong quá trình xử lý tín hiệu tiếng nói 48


    3.5.1 Phân tích tín hiệu theo từng frame .48


    3.5.2 Overlap và Adding .49


    3.6 Ước lượng và cập nhật nhiễu . 50


    3.6.1 Voice activity detection .51


    3.6.2 Quá trình ước lượng và cập nhật nhiễu 51


    3.7 Kết luận chương 52


    CHƯƠNG 4: THỰC HIỆN VÀ ĐÁNH GIÁ CÁC THUẬT TOÁN 53


    4.1 Giới thiệu chương 53


    4.2 Quy trình thực hiện và đánh giá thuật toán . 53


    4.3 Lưu đồ thuật toán Spectral Subtraction . 55


    4.4 Lưu đồ thuật toán Wiener Filtering . 56


    4.5 Thực hiện thuật toán 57


    4.6 Đánh giá chất lượng tiếng nói đã được xử lý 59


    4.6.1 Cơ sở dữ liệu cho việc đánh giá .59


    4.6.2 Tổng quan về quy trình đánh giá .59


    4.6.3 Kiểm tra độ tin cậy của các phương pháp đánh giá .60


    4.6.4 Thực hiện đánh giá .62


    4.6.4.1 Đánh giá thuật toán với các hệ số dự đoán ban đầu . 62


    4.6.4.2 Tối ưu hệ số alpha cho thuật toán WF . 65


    4.6.4.3 Hệ số gamma cho thuật toán SS . 67


    4.6.4.4 Đánh giá thuật toán sau khi đã tối ưu . 68


    4.6.4.5 Đánh giá độ ổn định của thuật toán trong môi trường nhiễu khác . 69


    4.6.5 Kết luận chương .71


    TÀI LIỆU THAM KHẢO . 72


    KẾT LUẬN ĐỒ ÁN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI . 75


    PHỤ LỤC . 76





    CHÚ THÍCH : TÀI LIỆU TRÊN GỒM FILE WORD + PDF
     

    Các file đính kèm:

Đang tải...