Tiểu Luận Hiệu quả của việc truy vấn đa phương tiện theo nội dung từ các thiết bị di động

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỤC LỤC:
    1. Giới thiệu. 2
    1.1. Duyệt theo mục tiêu( Targeted browsing). 5
    1.2. Truy vấn dòng. 6
    2. Duyệt mục tiêu. 6
    2.1. Động cơ. 6
    2.2. Yêu cầu để cho phép duyệt mục tiêu. 7
    2.3. Kịch bản thực hiện(Implementation scenario). 7
    3. Multimedia Query Format(MQF). 9
    3.1. Tổng quan thiết kế. 9
    3.1.1. Ký pháp nghịch đảo Ba Lan - Reverse Rolish Notation (RPN). 9
    3.1.2. Khái niệm về các cấp truy vấn. 10
    3.1.3. Khả năng siêu tìm kiếm 10
    3.1.4. Đặc điểm nén BiM . 11
    3.2. Các ví dụ về MQF. 11
    3.3. Hiệu năng MQF. 16
    4. Truy vấn dòng bằng cách sử dụng MQF kết hợp với FRU / FUU 17
    4.1. Sửa đổi để MQF cho phép truy vấn dòng. 17
    4.2. Đơn vị yêu cầu phân mảnh (FRU) và đơn vị cập nhật phân mảnh (FUU). 19
    4.3. Sự kết hợp của MQF và FRU / FUU 21
    5. Kịch bản các ca sử dụng cho duyệt theo mục tiêu - Targeted browsing use case scenario. 22
    5.1. Trả lại truy vấn hình ảnh bằng hình thu nhỏ. 22
    5.2. Truy vấn âm thanh với nén BiM . 24
    6. Cơ sở dữ liệu đa phương tiện và MQF. 28
    7. Kết luận. 28





    1. Giới thiệu
    Vấn đề truy vấn đa phương tiện đã nhận được sự chú ý đáng kể trong thời gian gần đây, do sự bùng nổ trào lưu người dùng tạo ra nội dung đa phương tiện, có thể nhận thấy rõ trong sự phổ biến của các trang web chia sẻ đa phương tiện như Youtube[1] và Flick[2]. Tìm kiếm các thông tin đa phương tiện là nhiệm vụ không dễ dàng, yêu cầu cần có metadata – các siêu dữ liệu (dữ liệu mô tả) được gắn vào các items - mục đa phương tiện (mỗi item có thể là một bản nhạc, video, bức ảnh) trong câu hỏi. Ví dụ như mô tả mức độ thấp của MPEG-7[3] hay mức độ cao hơn là siêu dữ liệu có ngữ nghĩa như Dublin Core[4]. Gắn các mô tả chính xác cho mỗi item đa phương tiện vẫn là vấn đề chính cần giải quyết ngày nay, do khối lượng nguồn dữ liệu cần được mô tả. Việc yêu cầu người dùng xây dựng dữ liệu mô tả cho nội dung đa phương tiện mà họ tạo ra là không tối ưu do tính chất chuyên sâu của nhiệm vụ và tính chủ quan của người dùng VD: youtube, Flick không yêu cầu người upload video/image bắt buộc phải mô tả chi tiết về video/image đó mà chỉ cần khai báo tên. Một số hệ mô tả tự động và bán tự động đã được phát triển (chẳng hạn như IBM’s MARVEL [5]) nhưng vẫn còn ở giai đoạn thử nghiệm.
    Hiện tại việc nghiên cứu cơ sở dữ liệu đa phương tiện và truy vấn đã nhận được sự chú ý đáng kể trong các tài liệu, trọng tâm của nghiên cứu này là đặt vấn đề cụ thể về việc phát triển một ngôn ngữ giao tiếp chuẩn giữa client và các giải pháp cơ sở dữ liệu như MARVEL,Google Image .Vấn đề này đã nhận được nhiều sự quan tâm trong nhiều tài liệu đã có từ trước. Các nghiên cứu liên quan trước đây trong lĩnh vực này bao gồm Định dạng truy vẫn đa phương tiện (MQF)[6] cũng như Ngôn ngữ đánh dấu truy hồi đa phương tiện - Multimedia Retrieval Markup Language (MRML), Ngôn ngữ truy vấn đối tượng đa phương tiện (MOQL) [8], MQL [9], Truy hồi hình ảnh dựa trên nhận thức và ngữ nghĩa (SEMCOG) [10], bao gồm việc thực hiện ngôn ngữ truy vấn dựa trên nhận thức và ngữ nghĩa (CSQL) như là một định dạng truy vấn, SQL Multimedia (SQL/MM) [11] và những ngôn ngữ khác. Đáng chú ý là, rất nhiều trong số các giải pháp này dựa vào các phương pháp không theo chuẩn mô tả dữ liệu và dựa trên việc mở rộng của ngôn ngữ truy vấn cấu trúc-SQL ( ngoại trừ MQF và MRML sử dụng XML) vì được thiết kế trước khi ra đời MPEG-7. SQL là ngôn ngữ truy vấn chuẩn cho cơ sở dữ liệu dựa trên văn bản, và do đó hầu hết các ngôn ngữ truy vấn đa phương tiện phát triển trước khi có tiêu chuẩn hóa MPEG-7 có nguồn gốc từ SQL. Mặc dù SQL là phù hợp cho cơ sở dữ liệu văn bản với cấu trúc đã biết, nhưng không đủ khi sử dụng trong truy vấn đa phương tiện nói chung do bản chất văn bản của SQL, ví dụ thật là khó để thực hiện một truy vấn theo mẫu (query-by-example) sử dụng SQL vì SQL không thể nhúng các dữ liệu đa phương tiện như là một phần của câu truy vấn.
    Một hạn chế khác là mặc dù MPEG-7 là tiêu chuẩn trong sơ đồ mô tả đa phương tiện, nhưng nó không phải là duy nhất( Dublin Core là một ví dụ). Sẽ có các cấu trúc dữ liệu khác nhau được sử dụng để mô tả cùng một thuộc tính (Ví dụ như thông tin tác giả) ở định dạng MPEG-7 so với Dublin Core, ngoài ra còn có các giải pháp dựa trên SQL (Ví dụ như MOQL, MQL, SQL /MM). Do đó, những cách tiếp cận hiện tại không cung cấp một giải pháp tổng quát cho giao tiếp truy vấn đa phương tiện với nhiều phương pháp mô tả khác nhau.

    MPEG-7 là một chuẩn trong họ MPEG nhưng không phải để mã hóa các dữ liệu đa phương tiện để lưu trữ hoặc truyền tải trên mạng như MPEG1,2,4 mà MPEG7 là công cụ để miêu tả nội dung dữ liệu đa phương tiện (Multimedia Content Description Interface). Nhờ đó, chúng ta sẽ có thể tương tác với dự liệu đa phương tiện qua nội dung của chúng.
    XML: đó là ngôn ngữ mà MPEG7 dùng để miêu tả nội dung của dữ liệu đa phương tiện
    Trong các giải pháp hiện tại được mô tả ở trên, MRML và MQF là các giải pháp mà không dựa trên SQL và đặc biệt thiết kế cho truy vấn đa phương tiện. Tuy nhiên không có giải pháp nào xem xét hạn chế của v
     

    Các file đính kèm:

Đang tải...