Tiến Sĩ Nén ảnh trong thông tin số thế hệ sau

Thảo luận trong 'THẠC SĨ - TIẾN SĨ' bắt đầu bởi Nhu Ely, 22/11/13.

  1. Nhu Ely

    Nhu Ely New Member

    Bài viết:
    1,771
    Được thích:
    1
    Điểm thành tích:
    0
    Xu:
    0Xu
    LUẬN ÁN TIẾN SỸ
    NĂM 2013



    MỤC LỤC
    LỜI CAM ĐOAN . i
    LỜI CẢM ƠN ii
    MỤC LỤC . iii
    DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT v
    DANH MỤC CÁC BẢNG . vii
    DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ . viii
    MỞ ĐẦU . 1
    CHƯƠNG 1: TỔNG QUAN VỀ NÉN VIDEO 7
    1.1. Giới thiệu 7
    1.2. Độ dư trong tín hiệu video, nhu cầu cần thiết nén video . 8
    1.2.1. Độ dư trong tín hiệu video . 8
    1.2.2. Nhu cầu cần thiết nén video . 13
    1.3. Khái niệm về nén video . 13
    1.4. Yêu cầu về ứng dụng nén video, một số kỹ thuật nén video . 18
    1.4.1. Yêu cầu về ứng dụng nén video . 18
    1.4.2. Một số kỹ thuật nén video 21
    1.5. Kết luận 33

    CHƯƠNG 2: TỔNG QUAN VỀ ƯỚC LƯỢNG CHUYỂN ĐỘNG CỦA ẢNH 34
    2.1. Giới thiệu 34
    2.2. Ước lượng chuyển động và các phương pháp ước lượng chuyển động 34
    2.2.1. Ước lượng chuyển động . 34
    2.2.2. Các phương pháp ước lượng chuyển động . 39
    2.3. Kết luận 62

    CHƯƠNG 3: ƯỚC LƯỢNG CHUYỂN ĐỘNG BẰNG CÁC GIẢI PHÁP MỚI . 64
    3.1. Giới thiệu 64
    3.2. Ước lượng chuyển động bằng Kalman 65
    3.2.1. Đặt bài toán . 65
    3.2.2. Ước lượng chuyển động của ảnh bằng thuật toán Kalman 66
    3.3. Ước lượng chuyển động tối ưu của ảnh trong video 72
    3.3.1. Đặt bài toán . 72
    3.3.2. Ước lượng chuyển động tối ưu của ảnh trong video 73 iv
    3.4. Ước lượng chuyển động của ảnh bằng phương pháp mù 76
    3.4.1. Đặt bài toán . 76
    3.4.2. Ước lượng chuyển động của ảnh bằng phương pháp mù . 77
    3.5. Kết luận 92

    CHƯƠNG 4: MỘT SỐ KẾT QUẢ TÍNH TOÁN SỐ 94
    4.1. Giới thiệu 94
    4.2. Thiết lập mô phỏng 94
    4.2.1. Phương pháp Bayes 94
    4.2.2. Phương pháp Kalman . 97
    4.3. Kết quả và bàn luận 100
    4.4. Kết luận 109
    KẾT LUẬN VÀ KIẾN NGHỊ . 110
    DANH MỤC CÔNG TRÌNH CÔNG BỐ CỦA TÁC GIẢ 113
    DANH MỤC TÀI LIỆU THAM KHẢO 11

    MỞ ĐẦU
    Giới thiệu
    Nén video là chủ đề đã và đang thu hút sự quan tâm của các nhà nghiên cứu trên thế giới. Việc tìm giải pháp nén video luôn hướng tới mục tiêu làm sao tăng hiệu quả nén trong khi giảm thiểu sự biến dạng hình ảnh mà quá trình nén gây ra. Hai yêu cầu này thường mâu thuẫn với nhau. Vì vậy, tùy ứng dụng cụ thể mà người ta chọn giải pháp nén phù hợp để dung hòa giữa hai yếu tố.
    Hiện nay trên thế giới cũng như ở Việt Nam đã triển khai mạng thông tin thế hệ sau. Một trong các đặc điểm của mạng thông tin thế hệ sau là truyền tải tất cả các thông tin và các dịch vụ trên cơ sở sử dụng công nghệ chuyển mạch mềm, cho phép cung cấp các dịch vụ đa phương tiện đến người sử dụng. Trong đó, các dịch vụ đa phương tiện sử dụng video bao gồm: điện thoại video, hội nghị truyền hình, y tế từ xa, đào tạo từ xa, xem các chương trình video phát quảng bá hoặc theo yêu cầu Các dịch vụ của mạng thông tin thế hệ sau không chỉ trong suốt trên mạng cố định mà với xu thế hội tụ cố định - di động thì chúng cũng phải trong suốt đến tận máy đầu cuối di động. Để đáp ứng yêu cầu đó, cần tìm ra các phương pháp nén video hiệu quả để giải quyết một số bài toán đặt ra ở đây là:
    - Nguồn tài nguyên tần số của môi trường vô tuyến là hữu hạn, vì vậy có giải pháp gì để tăng hiệu suất sử dụng tài nguyên đó.
    - Kênh truyền dẫn vô tuyến có tác động tiềm tàng của nhiễu, vì vậy có thuật toán xử lý tín hiệu mà chống được ảnh hưởng đó không.
    - Thiết bị đầu cuối di động có kích thước bé, nguồn năng lượng pin cung cấp cho nó hạn chế, vì vậy có giải pháp nào để tăng tốc độ xử lý nhằm tiết kiệm nguồn điện.

    Nhiều công trình nghiên cứu đã được công bố tập trung vào giải pháp nén tín hiệu video với mục tiêu là giảm băng tần cần thiết giành cho phổ tần tín hiệu video.
    Trong đó đặc trưng là các công trình mã tốc độ thấp [4], [15], [24], [35], [64], [68] hoặc là giải pháp ước lượng chuyển động của ảnh trong video.
    Trong hệ thống nén video thì bù chuyển động là một bộ phận rất quan trọng, đóng vai trò then chốt, được Netravali và Robbins đưa ra năm 1997. Bù chuyển động là một kỹ thuật dự đoán hướng theo thời gian, nó ước lượng độ dịch chuyển của mục tiêu chuyển động từ khung tham chiếu đến khung hiện tại. Ước lượng chuyển động thu được dự đoán bù chuyển động bằng cách tìm véctơ chuyển động giữa khung tham chiếu và khung hiện tại.
    Giai đoạn đầu người ta sử dụng phương pháp Bayes để ước lượng chuyển động của ảnh. Phương pháp Bayes xét đặc điểm tự nhiên của nội dung ảnh và hiệu giữa các khung liên tiếp, mô tả được bản chất xuất hiện của ảnh nhưng việc tính toán phức tạp, đặc biệt khi phân bố nhiều chiều. Đồng thời, chúng ta cũng biết rằng để sử dụng được công thức Bayes thì điều kiện tiên quyết là dãy ảnh phải là dãy xác suất đầy đủ. Đó là điều kiện tính toán khó vì phải nhận biết được dãy ảnh có thỏa mãn điều kiện “đầy đủ” hay không, nếu không thì quá trình ước lượng sẽ phạm phải sai số đáng kể.
    Trong những năm gần đây, một số tác giả đã mở rộng phương pháp Bayes cho ước lượng ảnh [57]. Rất nhiều nỗ lực đã được thực hiện trong ước lượng IBM thông qua phương pháp học thống kê bằng Bayes. Tuy nhiên, nhược điểm của nó là mặt nạ được ước lượng cho từng đơn vị thời gian - tần số một cách độc lập mà không tính đến mối tương quan giữa chúng. Trong [57], Shan Liang, Wenju Liu và Wei Jiang đã đề cập đến mối tương quan đó bằng thông tin tương quan địa phương. Họ đã sử dụng những biến phụ để chỉ ra mối tương quan. Phương pháp này đã chứng tỏ có độ chính xác cao hơn phương pháp Bayes thông thường. Tuy vậy, phương pháp này đã bỏ qua một số tham số thống kê bậc hai vì vậy làm hạn chế độ chính xác trong ước lượng chuyển động.
    Bên cạnh những ưu điểm của phương pháp Bayes thì bản thân nó bộc lộ những điều kiện ứng dụng mà không phải dãy ảnh chuyển động nào cũng thỏa mãn, 3

    đó là tính độc lập, tính đầy đủ. Vì vậy, những năm gần đây đã xuất hiện ước lượng chuyển động của ảnh bằng lọc Kalman làm tăng tốc độ xử lý. Điển hình năm 2009, Nai-Chung Yang, Chaur Heh Hsieh và Chung Ming Kuo [50] đã công bố công trình ước lượng chuyển động trong mã hóa video bằng lọc Kalman. Trong [50], các tác giả đã sử dụng mô hình ước lượng ba chiều. Tuy nhiên, các tác giả đã không tính trực tiếp ba chiều trong các thuật toán Kalman mà đã giả thiết về tính độc lập để đưa về tính trong không gian một chiều bằng phương pháp hồi qui và lọc Kalman địa phương. Vì vậy, [50] còn có những hạn chế sau:
    - Mô hình địa phương chỉ trợ giúp cho biến đổi không gian và thời gian sau đó phải cải tiến biểu diễn không gian trạng thái. Biểu diễn không gian trạng thái của mô hình địa phương không gian và thời gian một cách riêng biệt.
    - Ước lượng chuyển động có ràng buộc tốc độ bằng lọc Kalman, mới đưa ra hàm mục tiêu bằng cách cực tiểu hàm Lagrange, chưa chỉ ra thuật toán.
    - Mới đưa ra sơ đồ khối thuật toán ước lượng chuyển động nâng cao kết hợp lọc Kalman với thuật toán BMA để nâng cao độ chính xác ước lượng, chưa chỉ ra thuật toán cụ thể.

    Để tăng tốc độ xử lý, cải tiến độ bám chuyển động, người ta đã đưa ra các phương pháp ước lượng chuyển động có tốc độ nhanh hơn, có độ phối hợp tốt giữa các khung ảnh [28], [36], [37], [43], [47], [58], [70]. Tuy vậy, việc ước lượng chuyển động vẫn chủ yếu dựa trên không gian hai chiều còn trong không gian ba chiều thì họ vẫn phải chuyển từ không gian ba chiều sang hai chiều [26].
     

    Các file đính kèm:

Đang tải...