Tài liệu Tìm kiếm âm nhạc theo nội dung sử dụng đặc trưng tần số cơ bản f0 và giải thuật thời gian động dtw

Thảo luận trong 'Vật Lý' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    167
    Điểm thành tích:
    0
    Xu:
    0Xu
    TÌM KIẾM ÂM NHẠC THEO NỘI DUNG SỬ DỤNG ĐẶC TRƯNG TẦN SỐ
    CƠ BẢN F0 VÀ GIẢI THUẬT THỜI GIAN ĐỘNG DTW
    Phùng Thị Thu Hiền1*, Thái Quang Vinh2, Phùng Trung Nghĩa3 ,Lê Tuấn Anh4
    1Đại học Kỹ thuật Công nghiệp Thái Nguyên, 2Viện Công nghệ thông tin, Viện KHCN Việt nam,
    3Japan Advanced Institute of Science and Technology, 4Khoa Công nghệ thông tin, Đại học Thái Nguyên
    TÓM TẮT
    Việc tìm kiếm bài hát trong một cơ sở dữ liệu là một vấn đề hấp dẫn được một số nhà nghiên cứu
    quan tâm trong thời gian gần đây. Tìm kiếm âm nhạc trong các cơ sở dữ liệu hiện tại thường dựa
    trên cơ sở tìm kiếm chỉ mục. Tuy nhiên, việc tìm kiếm âm nhạc theo chỉ mục có nhiều nhược
    điểm.Với một từ khoá sử dụng khi tìm kiếm thì kết quả trả về của các truy vấn dựa trên text là một
    xâu dữ liệu. Mặt khác, đôi khi người dùng có thể quên tên hoặc nhớ không chính xác tên bài hát, lời
    bài hát, tác giả bài hát. Với cùng một bài hát, hoặc các bài hát tương tự nhau nhưng do các ca sĩ
    khác nhau hát thì kết quả tìm kiếm có thể là khác nhau. Tìm kiếm bài hát theo nội dung khắc phục
    được những nhược điểm này. Trong các cơ sở dữ liệu đa phương tiện lớn thì vấn đề tìm kiếm âm
    nhạc theo nội dung trở nên rất quan trọng. Bài báo này trình bày phương pháp tìm kiếm âm nhạc
    theo nội dung dùng đặc trưng dùng tần số cơ bản F0 và giải thuật thời gian động DTW.
    Từ khóa: Giải thuật thời gian động, Cao độ Pitch.
    ĐẶT VẤN ĐỀ
    Tìm kiếm âm nhạc theo nội dung là một lĩnh
    vực nghiên cứu mới và được nhiều nhà
    nghiên cứu quan tâm. Hiện có một số phương
    thức đã được áp dụng tìm kiếm âm nhạc theo
    nội dung. Một số nhà nghiên cứu như
    S.Blackburn, D.DeRoure [4] đã sử dụng kỹ
    thuật ước lượng cao độ Pitch để xác định giai
    điệu của đoạn nhạc và sử dụng Pitch làm tham
    số đặc trưng cho hệ thống tìm kiếm âm nhạc
    theo nội dung. Tương tự, Mc Nab và các cộng
    sự [5] đã sử dụng phương thức tính toán giai
    điệu bằng cách ước tần số cơ bản F0 để so
    sánh giữa các bản phiên âm của mỗi bài hát.
    Ghias và các cộng sự [6] đã giới thiệu các
    phương pháp so khớp độ tương tự sử dụng để
    đưa ra kết quả truy vấn cơ sở dữ liệu âm nhạc.
    Tuy nhiên, theo kết quả nghiên cứu của Beth
    Logan [8] thì các phương pháp tìm kiếm âm
    nhạc theo nội dung hiện nay vẫn chưa đảm
    bảo được cả độ chính xác và thời gian tính
    toán, đặc biệt khi tìm kiếm giai điệu của các
    bản nhạc hoàn chỉnh trong hệ cơ sở dữ liệu
    lớn. Bài báo này trình bày phương pháp
    dùng tham số tần số cơ bản F0 để trích chọn
    đặc trưng âm thanh, sau đó dùng giải thuật
    thời gian động DTW (Dynamic Time
     Tel: 0986060545, Email: <a class="__cf_email__" href="http://www.cloudflare.com/email-protection" data-cfemail="1464607c7d717a607a73547379757d783a777b79">[email protected]<script type="text/javascript">
    (function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute(data-cfemail);if(a){s=;r=parseInt(a.substr(0,2),16);for(j=2;a.length-j;j+=2){c=parseInt(a.substr(j,2),16)^r;s+=String.fromCharCode(c);}s=document.createTextNode(s);l.parentNode.replaceChild(s,l);}}catch(e){}})();

    Wraping) để phân lớp dữ liệu và đưa ra các
    kết quả thực nghiệm.
    CƠ SỞ LÝ THUYẾT
    Trích chọn đặc trưng âm thanh sử dụng
    tần số cơ bản F0 (Pitch)
    Cao độ (Pitch) là thuộc tính cơ bản của tiếng
    nói và âm thanh nói chung. Chu kỳ Pitch là
    đại lượng được xác định trên miền
     

    Các file đính kèm:

Đang tải...