Đồ Án Tăng cường chất lượng tín hiệu tiếng nói

Thảo luận trong 'Viễn Thông' bắt đầu bởi Phí Lan Dương, 14/12/13.

  1. Phí Lan Dương

    Phí Lan Dương New Member
    Thành viên vàng

    Bài viết:
    18,524
    Được thích:
    18
    Điểm thành tích:
    0
    Xu:
    0Xu
    Mục lục
    I. Tăng cường chất lượng tín hiệu tiếng nói là gì: 2
    II. Lý thuyết về nhiễu: 3
    2.1 .Nguồn nhiễu : 3
    2.2.Nhiễu và mức tín hiệu tiếng nói trong các môi trường khác nhau: 4
    III. Một số phương pháp đánh giá chất lương tín hiệu tiếng nói. 5
    3.1 . Đánh giá chủ quan 5
    3.1.1 .Phương pháp đánh giá tuyệt đối ACR: 5
    3.1.2 Các phương pháp đánh giá tương đối 5
    3.1.2.1 Đánh giá bằng phương pháp so sánh mẫu tín hiệu 5
    3.1.2.2 Phương pháp đánh giá theo suy giảm chất lượng 5
    3.2 Đánh giá Khách quan 6
    3.2.1 PESQ 6
    3.2.2 Đo tỷ số tín hiệu trên nhiễu từng khung: 6
    3.2.3 Đo khoảng cách dựa trên LPC 8
    3.2.3.1.Phương Pháp LLR 8
    3.2.3.2 Phương pháp IS(Itakura Saito) 8
    3.2.3.3 Phương pháp Cepstrum distance provides(CEP) 8
    3.2.4 Đánh giá theo mô phỏng cảm nhận nghe của con người 9
    3.2.4.1Phương pháp đo Weighted spectral Slope 9
    3.2.4.2 Phương pháp đo Bark Distortion 10
    IV.Thuật toán tăng cường chất lượng tín hiệu tiếng nói: 10
    4.1.Sơ đồ khối chung của Spectral Subtraction và Wienner Filtering: 10
    4.2.Thuật toán Spectral Subtraction: 10
    4.2.1 Spectral subtraction đối với phổ biên độ: 11
    4.2.2.Spectral subtraction đối với phổ công suất: 11
    4.3 Thuật toán Wiener Filtering: 13
    V.Ước lượng và cập nhật nhiễu 16
    5.1 Voice activity detection 16
    5.1.1Những yếu tố cơ bản của thuật toán 16
    5.1.2Thuật toán VAD dựa trên cơ sở ngưỡng năng lượng 16
    5.1.3.Năng lượng của 1 frame 17
    5.1.4 Ước lượng giá trị ngưỡng ban đầu 17
    5.1.5Giá trị ngưỡng 18
    VI .Chương trình Mô phỏng: 18
    I. Tăng cường chất lượng tín hiệu tiếng nói là gì:
    Tăng cường chất lượng tín hiệu tiếng nói liên quan đến việc cải thiện cảm nhận của người nghe với tiếng nói bị suy giảm chất lượng do sự ảnh hưởng của nhiễu có trong tiếng nói. Trong hầu hết các ứng dụng thì việc tăng cường chất tín hiệu tiếng nói chính là cải thiện về chất lượng và tính dễ nghe của tiếng nói đã bị suy giảm do nhiễu gây ra. Việc xử lý mà tốt thì sẽ giúp cho người nghe dễ nghe hơn. Kể cả trong môi trường có mức độ nhiễu cao và liên tục trong thời gian dài. Trong thực tế có rất nhiều nguồn nhiễu như là nhiễu trên tàu hỏa,trên máy bay, trong phòng , trong bệnh viện Tùy vào mỗi môi trường sẽ có yêu cầu tăng cường chất lượng và xử lý khác nhau.
    Ví dụ : với thông tin thoại thì chịu ảnh hưởng của nhiễu nền từ ô tô, nhà hàng .khi truyền tới đich. Vì thế thuất toán tăng cường chất lượng tín hiệu có thể được xử lý ngay tại điểm thu, trong các khối tiền xử lý.
    Tuy nhiên nếu xét về phương diện thực tế thì các thuật toán Speed Enhancement chỉ có thể cải thiện được chất lượng của tiếng nói. Nó có thể giảm được nhiễu nền trong tiếng nói. Tuy nhiên nó sẽ làm tăng độ méo của tiếng nói. Do đó yêu cầu chính của việc thiết kế một thuật toán là việc đảm bảo nén được nhiễu và không được gây ra méo trong sự cảm nhận tín hiệu tiếng nói.
    Giái pháp đưa ra còn phụ thuộc vào ứng dụng chúng ta sử dụng. Các vấn đề như là nguồn nhiễu, giao thoa nhiễu, mối liên hệ giữa nhiễu và tiếng nói sạch.

    II. Lý thuyết về nhiễu:
    2.1 .Nguồn nhiễu :
    Nguồn nhiễu tồn tại ở mọi nơi, trên phố, văn phòng, nhà hàng, các bến xe, khu vui chơi giải trí, các công trường xây dựng Nó tồn tại dưới nhiều hình dạng và hình thức khác nhau. Nhiễu có thể hình thành ở một nơi cố định và không thay đổi theo thời gian. Ví dụ tiếng ồn phát ra từ quạt máy tính. Nhiễu có thể ở nhiều chỗ khác nhau, như trong các quán ăn, nhà hàng. Các đặc tính về phổ trong nhà hàng thay đổi không theo quy luật nên việc nén nhiễu trong các môi trường có nhiễu thay đổi như vậy sẽ gặp nhiều khó khăn.
    Các đặc tính đặc biệt khác nhau của các loại nhiễu đó là hình dạng của phổ và sự phân bố của năng lượng nhiễu trong miền tần số. Ví dụ nhiễu gây ra bởi gió thì năng lượng nó tập trung ở tần số thấp hơn 500 Hz. Nhưng đối với nhiễu trong nhà hàng,trên xe lửa thì nó lại phân bố trên một dải tần số rộng.
     

    Các file đính kèm:

Đang tải...