Thạc Sĩ đặc trưng của âm thanh trong cơ sở dữ liệu âm thanh số

Thảo luận trong 'THẠC SĨ - TIẾN SĨ' bắt đầu bởi Phí Lan Dương, 26/11/13.

  1. Phí Lan Dương

    Phí Lan Dương New Member
    Thành viên vàng

    Bài viết:
    18,524
    Được thích:
    18
    Điểm thành tích:
    0
    Xu:
    0Xu
    Luận văn thạc sĩ năm 2011
    Đề tài: ĐẶC TRƯNG CỦA ÂM THANH TRONG CƠ SỞ DỮ LIỆU ÂM THANH SỐ

    MỤC LỤC
    LỜI CẢM ƠN . i
    LỜI CAM ĐOAN ii
    MỤC LỤC .iii
    DANH MỤC KÍ HIỆU VÀ VIẾT TẮT vii
    DANH MỤC HÌNH VÀ BẢNG . ix
    Danh mục các hình . ix
    Danh mục các bảng x
    MỞ ĐẦU 1
    Chương 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ÂM THANH . 3
    1.1 Các dữ liệu đa phương tiện 3
    1.1.1 Khái niệm về dữ liệu đa phương tiện 3
    1.1.2 Phân loại dữ liệu đa phương tiện 5
    1.1.3 Các đặc tính của dữ liệu đa phương tiện . 6
    1.2. Tổng quan về cơ sở dữ liệu đa phương tiện 6
    1.2.1 Khái niệm về cơ sở dữ liệu đa phương tiện . 6
    1.2.2 Nhu cầu về cơ sở dữ liệu đa phương tiện 7
    1.2.3 Phân loại cơ sở dữ liệu đa phương tiện . 7
    1.2.4 Đặc trưng của một cơ sở dữ liệu đa phương tiện . 8
    1.3 Cơ sở dữ liệu âm thanh 9
    1.3.1. Về âm thanh 9
    1.3.2. Về cơ sở dữ liệu âm thanh . 9
    1.4. Một số phần mềm cho phép xử lí âm thanh 10
    1.5. Nhu cầu về âm thanh nhạc cụ . 10
    1.6. Kết luận . 12
    Chương 2. CÁC ĐẶC TRƯNG ÂM THANH 13
    2.1 Số hóa dữ liệu âm thanh 13
    2.1.1 Đặc tính của âm thanh tương tự 13
    2.1.2 Khái niệm tín hiệu 14
    iv
    Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
    2.1.3 Phân loại tín hiệu . 14
    2.1.4 Mô hình hóa tín hiệu âm thanh . 17
    2.1.5 Kiến trúc xử lí tín hiệu âm thanh 18
    2.1.6 Tần số lấy mẫu . 20
    2.1.7 Một số khái niệm toán học trong xử lí âm thanh . 21
    2.1.7.1 Phép biến đổi z 21
    2.1.7.2 Phép biến đổi Fourier . 22
    2.1.7.3 Phép biến đổi Fourier rời rạc . 22
    2.1.8 Số hóa dữ liệu âm thanh . 24
    2.1.8.1 Các mô hình lấy mẫu và mã hóa âm thanh 24
    2.1.8.2 Kiến trúc của hệ thống mã hóa âm thanh 29
    2.2 Đặc trưng của dữ liệu âm thanh 30
    2.2.1 Dữ liệu âm thanh 30
    2.2.2 Các đặc trưng của âm thanh . 32
    2.2.2.1 Bản chất vật lí của âm thanh . 32
    2.2.2.2 Sóng âm 32
    2.2.2.3 Pha . 32
    2.2.2.4 Phổ âm thanh 32
    2.2.2.5 Năng lượng âm thanh 33
    2.2.2.6 Nhịp và phách . 33
    2.2.2.7 Cộng hưởng 33
    2.2.2.8 Formant 33
    2.3 Âm thanh, âm nhạc và tiếng nói 34
    2.3.1 Tương quan âm thanh, âm nhạc và tiếng nói 34
    2.3.2 Ảnh hưởng của biên độ và tần số 35
    2.3.3 Âm sắc nhạc cụ, bồi âm . 36
    2.4 Nhạc cụ . 38
    2.4.1 Họ thân tự vang 39
    2.4.2 Họ màng rung 39
    v
    Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
    2.4.3 Họ hơi 40
    2.4.4 Họ dây . 41
    2.5 Kết luận 42
    Chương 3. CƠ SỞ DỮ LIỆU ÂM THANH 44
    3.1 Phân tích, thiết kế cơ sở dữ liệu đa phương tiện 44
    3.1.1 Cấu trúc của cơ sở dữ liệu đa phương tiện 44
    3.1.1.1 Phân tích dữ liệu . 44
    3.1.1.2 Mô hình hóa dữ liệu 44
    3.1.1.3 Lưu trữ dữ liệu 45
    3.1.1.4 Xác định dữ liệu trả về 45
    3.1.1.5 Truy cập dữ liệu 46
    3.1.1.6 Phương tiện truyền thông 46
    3.1.2 Các bước để tạo ra một cơ sở dữ liệu đa phương tiện . 46
    3.2 Xử lí âm thanh bằng Cool Edit . 47
    3.3 Tổ chức cơ sở dữ liệu âm thanh nhạc cụ . 48
    3.3.1 Tổ chức cơ sở dữ liệu đa phương tiện . 48
    3.3.1.1 Thiết kế và kiến trúc của cơ sở dữ liệu đa phương tiện 48
    3.3.1.2 Tổ chức cơ sở dữ liệu dựa trên nguyên tắc thống nhất 51
    3.3.1.3 Mô tả trừu tượng các đối tượng đa phương tiện 52
    3.3.1.4 Ngôn ngữ hỏi dữ liệu đa phương tiện 52
    3.3.1.5 Kỹ thuật tìm kiếm 53
    3.3.2 Tổ chức cơ sở dữ liệu âm thanh nhạc cụ . 54
    3.3.2.1 Siêu dữ liệu thể hiện nội dung . 54
    3.3.2.2 Nội dung âm thanh dựa trên tín hiệu . 55
    3.4 Cài đặt cơ sở dữ liệu âm thanh nhạc cụ dân tộc Việt Nam 56
    3.4.1 Mô tả bài toán 56
    3.4.2 Phân tích, thiết kế cơ sở dữ liệu âm thanh về nhạc cụ dân tộc . 57
    3.4.2.1 Bảng dữ liệu về âm thanh, âm thanh nhạc cụ dân tộc 57
    3.4.2.2 Bảng dữ liệu về tác giả, người sáng tác bản nhạc . 58
    vi
    Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
    3.4.2.3 Bảng dữ liệu về nghệ sỹ, người trình bày bản nhạc . 59
    3.4.2.4 Lược đồ quan hệ của cơ sở dữ liệu âm thanh 59
    3.4.4 Cài đặt chương trình hỗ trợ việc xây dựng, khai thác cơ sở dữ liệu âm
    thanh nhạc cụ dân tộc Việt Nam . 60
    3.4.4.1 Chức năng cập nhật thông tin của nhạc sỹ, người sáng tác nhạc
    . 61
    3.4.4.2 Chức năng cập nhật thông tin của nghệ sỹ, người biểu diễn nhạc
    . 61
    3.4.4.3 Chức năng cập nhật thông tin bản nhạc 62
    3.4.4.4 Chức năng tìm kiếm và trích xuất nhạc . 63
    3.4.4.5 Chương trình nghe nhạc . 64
    3.5 Kết luận 64
    KÊ ́ T LUÂ ̣ N 66
    Các kết quả đạt được 66
    Hướng tìm hiểu, nghiên cứu và ứng dụng . 66
    TÀI LIỆU THAM KHẢO . 68
    Tài liệu tiếng Việt . 68
    Tài liệu tiếng Anh . 68
    Một số Website . 69

    MỞ ĐẦU
    Ngày nay, công nghệ thông tin truyền thông như là hạ tầng cho nhiều ngành
    kinh tế quốc dân trong thế kỉ XXI, cũng như máy móc có vài trò như vậy trong thế
    kỷ XX. Mọi ngành nghề đều phải tiếp nhận công nghệ thông tin truyền thông như là
    phương tiện chính để đảm bảo hiệu quả, năng suất và tính cạnh tranh. Công nghệ
    thông tin truyền thông được coi là nhân tố chủ chốt để giải phóng tiềm năng của
    mỗi cá nhân, mỗi tổ chức, nó là môi trường sản sinh ra các ý tưởng mới, tạo cơ hội
    thuận lợi để phát triển các ý tưởng sẵn có.
    Ngày nay, mọi người sống, làm việc và giao tiếp thông qua các dữ liệu đa
    phương tiện. Công nghệ thông tin truyền thông, mạng máy tính và các giao thức
    truyền thông phát triển mạnh mẽ, kết hợp với khả năng mô tả, đồ họa phong phú
    của các trình duyệt càng mang lại sự đa dạng về các dữ liệu cho người dùng đầu
    cuối. Do đó, đòi hỏi làm thế nào để tổ chức và cơ cấu một lượng rất lớn các dữ liệu
    đa phương tiện để có thể dễ dàng nhận được thông tin cần thiết một cách nhanh
    chóng tại bất kỳ thời điểm nào. Từ đó, cơ sở dữ liệu đa phương tiện được xây dựng
    để trở thành một công cụ quản lí, lưu trữ và truy cập một lượng rất lớn các đối
    tượng đa phương tiện. Đó chính là cơ hội cũng như là nguyên nhân để các công
    nghệ về cơ sở dữ liệu đa phương tiện phát triển và ứng dụng rộng rãi trong đời sống
    kinh tế xã hội.
    Các dữ liệu đa phương tiện gồm có: văn bản, hình ảnh tĩnh, hình ảnh động, âm
    thanh, âm nhạc, video . Hiệu quả của các ứng dụng đa phương tiện phụ thuộc vào
    sức mạnh của cơ sở dữ liệu đa phương tiện, cụ thể là cấu trúc, cách tổ chức, khả
    năng truy cập nhanh, chính xác . Công nghệ đa phương tiện được ứng dụng trong
    nhiều trường hợp như: e- learning, hội thảo video, thư điện tử, hiện thực ảo, trò chơi
    điện tử, thương mại điện tử .
    Việc tìm hiểu bản chất cũng như là các đặc trưng, các thuộc tính, các kỹ thuật
    số hóa của từng loại dữ liệu đa phương tiện là yêu cầu để triển khai và ứng dụng
    công nghệ đa phương tiện vào đời sống. Trong đó, việc tìm hiểu các đặc trưng,
    phương pháp số hóa, phương pháp trích chọn, tìm kiếm của dữ liệu âm thanh trong
    2
    Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
    cơ sở dữ liệu âm thanh hiện đang được quan tâm đặc biệt bởi các đặc thù của dữ
    liệu âm thanh như: đa dạng, thông dụng với người dùng, thân thiện với mọi đối
    tượng, truyền tải một lượng lớn thông tin trong kh oảng thời gian ngắn, ứng dụng
    nhiều trong đời sống, đó chính là lí do tôi chọn đề tài “Đặc trưng âm thanh trong cơ
    sở dữ liệu âm thanh số”.
    Do nội dung của đề tài rộng và không thể thực hiện đầy đủ trong thời gian
    thực tập tốt nghiệp, tôi xác định những việc đầu tiên, phục vụ trực tiếp cho luận văn
    là (i) kiến trúc và yêu cầu của cơ sở dữ liệu âm thanh số hóa; (ii) chuẩn bị đặc trưng
    dữ liệu cho cơ sở dữ liệu này. Để nêu rõ các đặc trưng âm thanh, đối tượng xem xét
    là dữ liệu âm thanh nhạc cụ, đặc biệt là âm thanh của các nhạc cụ dân tộc.
    Cấu trúc của luận văn : Luận văn bao gồm các chương :
    1. Chương 1: Tìm hiểu về khái niệm tổng quan của cơ sở dữ liệu âm
    thanh.
    2. Chương 2: Nêu các đặc trưng âm thanh.
    3. Chương 3: Đề cập phân tích, thiết kế và xây dựng cơ sở dữ liệu âm
    thanh.
    Cuối cùng là kết luận của luận văn và danh sách các tài liệu tham khảo sử
    dụng trong luận văn.
    3
    Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
    Chương 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU ÂM THANH
    Chương 1 trình bày một số khái niệm tổng quan liên quan đến dữ liệu âm
    thanh nói riêng, dữ liệu đa phương tiện nói chung và cơ sở dữ liệu âm thanh.
    1.1 Các dữ liệu đa phương tiện
    1.1.1 Khái niệm về dữ liệu đa phương tiện
    Dữ liệu đa phương tiện bao gồm: văn bản, đồ họa, hoạt hình, âm thanh,
    video .
     Văn bản (Text): Gồm các kí tự (chữ cái, chữ số, các kí hiệu đặc biệt .). Thể hiện
    chung nhất của kí tự là theo mã ASCII. Người ta dùng 7 bit cho mỗi mã, nhưng
    sử dụng chung là 8 bit, thêm một bit chẵn lẻ. Với các văn bản thể hiện các ngôn
    ngữ khác nhau người ta sử dụng bộ mã khác nhau. Bộ nhớ dành cho văn bản
    được tính theo số kí tự, số trang. Ngày này, người ta thường sử dụng bộ mã
    Unicode gồm 16 bit cho mỗi kí tự để thể hiện kí tự. Với bộ mã 16 bit dễ dàng
    thể hiện văn bản chứa các ngôn ngữ khác nhau, tuy nhiên bộ nhớ để lưu trữ cũng
    tăng lên gấp đôi.
    Hầu hết các tự liệu văn bản có cấu trúc, gồm (i) nhan đề; (ii) đoạn; (iii)
    mục; Cầu trúc của văn bản thể hiện ra khi in. Có nhiều dạng thức và chuẩn mã
    hóa văn bản có cấu trúc, như SGML, ODA, LaTex và PDF. Trong một tệp văn
    bản thông thường, đầu tệp lưu thông tin về dạng thức tư liệu, cấu trúc . sau đó là
    nội dung văn bản. Khi biết dạng thức tệp, thông tin cấu trúc được trích rút dùng
    cho tìm kiếm.
    Trong các ứng dụng đa phương tiện, văn bản hiện được sử dụng rộng rãi.
    Nguyên nhân là do việc thể hiện văn bản trên màn hình rất thuận lợi. Đồng thời
    có nhiều thông tin không thể hiện được bằng các các công cụ đa phương tiện
    khác, khi đó văn bản là hình thức được sử dụng để thể hiện thông tin đó.
     Tiếng nói: Tiếng nói là một dữ liệu có tính liên tục, tiếng nói có thể được sử dụng
    giới thiệu, trình bày, nêu yêu cầu . Tiếng nói được coi như là công cụ giải thích
    bổ sung hữu hiệu cho văn bản.
    4
    Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
     Đồ họa: là một lĩnh vực truyền thông trong đó thông điệp được tiếp nhận qua con
    đường thị giác. Thiết kế đồ họa là tạo ra các giải pháp bằng hình ảnh cho các vấn
    đề truyền thông.
    Có hai loại đồ họa (i) bitmap; (ii) vector. Đồ họa bitmap chia nhỏ thành các
    pixel, mỗi pixel ứng với một chấm trên màn hình. Cường độ của pixel được lưu
    trong tệp đồ họa pixel. Đồ họa vector, phần tử đồ họa được thể hiện theo các mô
    hình xác định trước, hay theo công thức toán học. Việc lưu trữ dữ liệu vector
    đơn giản, là lưu trữ các chỉ dẫn cơ bản cho phép sinh ra đồ họa. Đối với đồ họa
    vector, dễ trích nội dung. Thuộc tính của phần tử như hình dáng, kích thước, lấy
    ra từ tệp đồ họa được sử dụng để chỉ số hóa và tìm kiếm.
    Dữ liệu ảnh bitmap, là ma trận các điểm ảnh để thể hiện hình ảnh. Số lượng
    điểm ảnh lớn sẽ làm hình ảnh mịn hơn. Dữ liệu ảnh vector, không dùng ma trận
    điểm ảnh, mà dùng phường trình toán học thể hiện hình ảnh, sau đó thiết bị hiển
    thị sẽ thể hiện lại hình ảnh dựa trên phương trình của ảnh.
    Đồ họa là một thành phần đa phương tiện rất mạnh được sử dụng để thể hiện
    ngữ cảnh. Đồ họa là một kiểu dữ liệu độc lập, từ hình ảnh đồ họa có thể xác định
    được những khoảnh khắc (không gian) và thời gian. Đồ họa là loại dữ liệu thích
    hợp cho việc nghiên cứu và phân tích các mối quan hệ. Đồ họa có thể kết hợp
    với văn bản để mô tả đầy đủ về đối tượng. Đồ họa thể hiện đối tượng chi tiết hơn
    so với hình ảnh và thể hiện tốt các đối tượng mang tính trừu tượng.
     Hình ảnh: Thể hiện mối quan hệ từ ảnh đại diện đến nội dung cụ thể. Tâm trạng
    của người quan sát có thể quyết định nội dung của hình ảnh, khi đó sự kết hợp
    giữa hình ảnh và âm thanh sẽ cho kết quả đầy đủ về nội dung thực.
     Hoạt hình: là thể hiện nhanh chuỗi các hình ảnh của tác phẩm 2D hay 3D hay các
    vị trí mô hình, để tạo nên ảo ảnh về chuyển động. Hình động được sinh ra do
    làm tinh, biểu diễn tuần tự các khung đồ họa. Nếu đồ họa dùng bitmap, hình
    động như đoạn video. Đối với hình động theo vector, việc chỉ số hóa và tìm
    kiếm được thực hiện như với đồ họa vector, trừ việc xử lí yếu tố thời gian.
     

    Các file đính kèm:

Đang tải...