Tiểu Luận Năng lượng, biên độ và tỉ lệ biến thiên qua điểm không dóng trên cùng trục thời gian

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    Đề tài: .







    Contents
    I. LÝ THUYẾT CHUNG 3
    1. Các đặc tính cơ bản về tiếng nói 3
    2. Cấu trúc file Wave: 3
    2.1. RIFF file 4
    2.2. Cấu trúc file Wave 4
    3. Giới thiệu chung về hàm năng lượng thời gian ngắn, biên độ và tỉ lệ biến
    thiên qua điểm không : 7
    3.1. Hàm năng lượng thời gian ngắn và biên độ 7
    3.2. Tỉ lệ biến thiên qua điểm không (Zero-Crossing Rate) 13
    II. CHƯƠNG TRÌNH 19
    1. Phân tích và thiết kế chức năng chương trình: 19
    2. Chương trình: 20
    III. KẾT LUẬN 24
    IV. TÀI LIỆU THAM KHẢO 25
    Xử lý tiếng nói Page 2




    Bài tập lớn nhóm 9 Thầy Trịnh Văn Loan
    I. LÝ THUYẾT CHUNG
    1. Các đặc tính cơ bản về tiếng nói
    Tiếng nói mà con người giao tiếp hằng ngày có bản chất là sóng âm thanh
    lan truyền trong không khí. Sóng âm trong không khí là sóng dọc do sự giản nở
    của không khí.Tín hiệu âm thanh tiếng nói là tín hiệu biến thiên liên tục về thời
    gian. Dải tần mà tai người có thể nghe được khá rộng, từ 20 đến 20.000Hz, là
    do đặc tính sinh lý qui định. Tín hiệu tiếng nói có độ dư thừa lớn do môi trường
    có nhiễu.Thực tế thì trong miền tần số 300 đến 3400Hz tiếng nói nghe được khá
    rõ, đây cũng chính dãi tần được người ta dùng trong điện thoại. Tín hiệu tiếng
    nói được tạo thành từ chuỗi các âm vị liên tiếp. Các âm vị này và các dạng
    chuyển đổi của chúng được xem như các ký hiệu biễu diễn thông tin. Sự sắp
    xếp những âm vị này được chi phối bởi các qui luật ngôn ngữ, cho nên các mô
    hình toán học khi được áp dụng đều phải gắn bó mật thiết với việc nghiên cứu
    các qui luật này.
    Xử lý tiếng nói là một lĩnh vực xử lý thông tin chứa trong các tín hiệu tiếng
    nói với mục đích truyền, lưu trữ, tổng hợp, nhận dạng tiếng nói. Xử lý tiếng nói
    hiện nay đang được nghiên cứu và được vào nhiều ứng dụng.
    Các nghiên cứu được tiến hành để xử lý tiếng nói yêu cầu những hiểu
    biết trên nhiều lĩnh vực và ngày đa dạng: từ ngữ âm, ngôn ngữ học cho đến việc
    xử lý tín hiệu .v.v
    2. Cấu trúc file Wave:
    Tiếng nói là tín hiệu tương tự, để lưu trữ được trong máy tính đặt trưng
    bởi chuỗi số 01 ta phải “lấy mẫu” và “lượng tử hoá” tín hiệu tương tự thành
    tín hiệu số mới lưu trữ được trong máy tính. Phương pháp “lấy mẫu” và “lượng
    tử hoá” âm thanh hiện nay thường là phương pháp PCM. Phương pháp này sẽ
    lấy mẫu âm thanh với tần số khoảng từ 11.025 kHz cho đến 44.1 kHz. Mỗi giá
    trị mẫu được lượng tử hoá bằng 8 bits tương ứng giá trị mẫu từ -128 đến 127
    hoặc lượng tử hoá bằng 16 bits tương ứng giá trị mẫu từ -32768 đến 32767. So
    với lượng tử hoá bằng 8 bits thì lượng tử hoá bằng 16 bits sẽ lưu trữ âm thanh
    trung thực hơn nhưng bù lại số byte lưu tăng gấp đôi.
     

    Các file đính kèm:

Đang tải...