Tiến Sĩ Nén ảnh trong thông tin số thế hệ sau

Thảo luận trong 'THẠC SĨ - TIẾN SĨ' bắt đầu bởi Phí Lan Dương, 16/11/13.

  1. Phí Lan Dương

    Phí Lan Dương New Member
    Thành viên vàng

    Bài viết:
    18,524
    Được thích:
    18
    Điểm thành tích:
    0
    Xu:
    0Xu
    Luận án tiến sĩ năm 2013
    Đề tài: Nén ảnh trong thông tin số thế hệ sau


    MỤC LỤC
    LỜI CAM ĐOAN . i
    LỜI CẢM ƠN ii
    MỤC LỤC . iii
    DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT v
    DANH MỤC CÁC BẢNG . vii
    DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ . viii
    MỞ ĐẦU . 1
    CHƯƠNG 1: TỔNG QUAN VỀ NÉN VIDEO 7
    1.1. Giới thiệu 7
    1.2. Độ dư trong tín hiệu video, nhu cầu cần thiết nén video . 8
    1.2.1. Độ dư trong tín hiệu video . 8
    1.2.2. Nhu cầu cần thiết nén video . 13
    1.3. Khái niệm về nén video . 13
    1.4. Yêu cầu về ứng dụng nén video, một số kỹ thuật nén video . 18
    1.4.1. Yêu cầu về ứng dụng nén video . 18
    1.4.2. Một số kỹ thuật nén video 21
    1.5. Kết luận 33
    CHƯƠNG 2: TỔNG QUAN VỀ ƯỚC LƯỢNG CHUYỂN ĐỘNG CỦA ẢNH 34
    2.1. Giới thiệu 34
    2.2. Ước lượng chuyển động và các phương pháp ước lượng chuyển động 34
    2.2.1. Ước lượng chuyển động . 34
    2.2.2. Các phương pháp ước lượng chuyển động . 39
    2.3. Kết luận 62
    CHƯƠNG 3: ƯỚC LƯỢNG CHUYỂN ĐỘNG BẰNG CÁC GIẢI PHÁP MỚI . 64
    3.1. Giới thiệu 64
    3.2. Ước lượng chuyển động bằng Kalman 65
    3.2.1. Đặt bài toán . 65
    3.2.2. Ước lượng chuyển động của ảnh bằng thuật toán Kalman 66
    3.3. Ước lượng chuyển động tối ưu của ảnh trong video 72
    3.3.1. Đặt bài toán . 72
    3.3.2. Ước lượng chuyển động tối ưu của ảnh trong video 73
    iv
    3.4. Ước lượng chuyển động của ảnh bằng phương pháp mù 76
    3.4.1. Đặt bài toán . 76
    3.4.2. Ước lượng chuyển động của ảnh bằng phương pháp mù . 77
    3.5. Kết luận 92
    CHƯƠNG 4: MỘT SỐ KẾT QUẢ TÍNH TOÁN SỐ 94
    4.1. Giới thiệu 94
    4.2. Thiết lập mô phỏng 94
    4.2.1. Phương pháp Bayes 94
    4.2.2. Phương pháp Kalman . 97
    4.3. Kết quả và bàn luận 100
    4.4. Kết luận 109
    KẾT LUẬN VÀ KIẾN NGHỊ . 110
    DANH MỤC CÔNG TRÌNH CÔNG BỐ CỦA TÁC GIẢ 113
    DANH MỤC TÀI LIỆU THAM KHẢO 114


    MỞ ĐẦU
    Giới thiệu
    Nén video là chủ đề đã và đang thu hút sự quan tâm của các nhà nghiên cứu
    trên thế giới. Việc tìm giải pháp nén video luôn hướng tới mục tiêu làm sao tăng
    hiệu quả nén trong khi giảm thiểu sự biến dạng hình ảnh mà quá trình nén gây ra.
    Hai yêu cầu này thường mâu thuẫn với nhau. Vì vậy, tùy ứng dụng cụ thể mà người
    ta chọn giải pháp nén phù hợp để dung hòa giữa hai yếu tố.
    Hiện nay trên thế giới cũng như ở Việt Nam đã triển khai mạng thông tin thế
    hệ sau. Một trong các đặc điểm của mạng thông tin thế hệ sau là truyền tải tất cả các
    thông tin và các dịch vụ trên cơ sở sử dụng công nghệ chuyển mạch mềm, cho phép
    cung cấp các dịch vụ đa phương tiện đến người sử dụng. Trong đó, các dịch vụ đa
    phương tiện sử dụng video bao gồm: điện thoại video, hội nghị truyền hình, y tế từ
    xa, đào tạo từ xa, xem các chương trình video phát quảng bá hoặc theo yêu cầu
    Các dịch vụ của mạng thông tin thế hệ sau không chỉ trong suốt trên mạng cố định
    mà với xu thế hội tụ cố định - di động thì chúng cũng phải trong suốt đến tận máy
    đầu cuối di động. Để đáp ứng yêu cầu đó, cần tìm ra các phương pháp nén video
    hiệu quả để giải quyết một số bài toán đặt ra ở đây là:
    - Nguồn tài nguyên tần số của môi trường vô tuyến là hữu hạn, vì vậy có giải
    pháp gì để tăng hiệu suất sử dụng tài nguyên đó.
    - Kênh truyền dẫn vô tuyến có tác động tiềm tàng của nhiễu, vì vậy có thuật
    toán xử lý tín hiệu mà chống được ảnh hưởng đó không.
    - Thiết bị đầu cuối di động có kích thước bé, nguồn năng lượng pin cung cấp
    cho nó hạn chế, vì vậy có giải pháp nào để tăng tốc độ xử lý nhằm tiết kiệm
    nguồn điện.
    Nhiều công trình nghiên cứu đã được công bố tập trung vào giải pháp nén tín
    hiệu video với mục tiêu là giảm băng tần cần thiết giành cho phổ tần tín hiệu video.
    2
    Trong đó đặc trưng là các công trình mã tốc độ thấp [4], [15], [24], [35], [64], [68]
    hoặc là giải pháp ước lượng chuyển động của ảnh trong video.
    Trong hệ thống nén video thì bù chuyển động là một bộ phận rất quan trọng,
    đóng vai trò then chốt, được Netravali và Robbins đưa ra năm 1997. Bù chuyển
    động là một kỹ thuật dự đoán hướng theo thời gian, nó ước lượng độ dịch chuyển
    của mục tiêu chuyển động từ khung tham chiếu đến khung hiện tại. Ước lượng
    chuyển động thu được dự đoán bù chuyển động bằng cách tìm véctơ chuyển động
    giữa khung tham chiếu và khung hiện tại.
    Giai đoạn đầu người ta sử dụng phương pháp Bayes để ước lượng chuyển
    động của ảnh. Phương pháp Bayes xét đặc điểm tự nhiên của nội dung ảnh và hiệu
    giữa các khung liên tiếp, mô tả được bản chất xuất hiện của ảnh nhưng việc tính
    toán phức tạp, đặc biệt khi phân bố nhiều chiều. Đồng thời, chúng ta cũng biết rằng
    để sử dụng được công thức Bayes thì điều kiện tiên quyết là dãy ảnh phải là dãy xác
    suất đầy đủ. Đó là điều kiện tính toán khó vì phải nhận biết được dãy ảnh có thỏa
    mãn điều kiện “đầy đủ” hay không, nếu không thì quá trình ước lượng sẽ phạm phải
    sai số đáng kể.
    Trong những năm gần đây, một số tác giả đã mở rộng phương pháp Bayes
    cho ước lượng ảnh [57]. Rất nhiều nỗ lực đã được thực hiện trong ước lượng IBM
    thông qua phương pháp học thống kê bằng Bayes. Tuy nhiên, nhược điểm của nó là
    mặt nạ được ước lượng cho từng đơn vị thời gian - tần số một cách độc lập mà
    không tính đến mối tương quan giữa chúng. Trong [57], Shan Liang, Wenju Liu và
    Wei Jiang đã đề cập đến mối tương quan đó bằng thông tin tương quan địa phương.
    Họ đã sử dụng những biến phụ để chỉ ra mối tương quan. Phương pháp này đã
    chứng tỏ có độ chính xác cao hơn phương pháp Bayes thông thường. Tuy vậy,
    phương pháp này đã bỏ qua một số tham số thống kê bậc hai vì vậy làm hạn chế độ
    chính xác trong ước lượng chuyển động.
    Bên cạnh những ưu điểm của phương pháp Bayes thì bản thân nó bộc lộ
    những điều kiện ứng dụng mà không phải dãy ảnh chuyển động nào cũng thỏa mãn,
    3
    đó là tính độc lập, tính đầy đủ. Vì vậy, những năm gần đây đã xuất hiện ước lượng
    chuyển động của ảnh bằng lọc Kalman làm tăng tốc độ xử lý. Điển hình năm 2009,
    Nai-Chung Yang, Chaur Heh Hsieh và Chung Ming Kuo [50] đã công bố công trình
    ước lượng chuyển động trong mã hóa video bằng lọc Kalman. Trong [50], các tác
    giả đã sử dụng mô hình ước lượng ba chiều. Tuy nhiên, các tác giả đã không tính
    trực tiếp ba chiều trong các thuật toán Kalman mà đã giả thiết về tính độc lập để đưa
    về tính trong không gian một chiều bằng phương pháp hồi qui và lọc Kalman địa
    phương. Vì vậy, [50] còn có những hạn chế sau:
    - Mô hình địa phương chỉ trợ giúp cho biến đổi không gian và thời gian sau đó
    phải cải tiến biểu diễn không gian trạng thái. Biểu diễn không gian trạng thái
    của mô hình địa phương không gian và thời gian một cách riêng biệt.
    - Ước lượng chuyển động có ràng buộc tốc độ bằng lọc Kalman, mới đưa ra
    hàm mục tiêu bằng cách cực tiểu hàm Lagrange, chưa chỉ ra thuật toán.
    - Mới đưa ra sơ đồ khối thuật toán ước lượng chuyển động nâng cao kết hợp
    lọc Kalman với thuật toán BMA để nâng cao độ chính xác ước lượng, chưa
    chỉ ra thuật toán cụ thể.
    Để tăng tốc độ xử lý, cải tiến độ bám chuyển động, người ta đã đưa ra các
    phương pháp ước lượng chuyển động có tốc độ nhanh hơn, có độ phối hợp tốt giữa
    các khung ảnh [28], [36], [37], [43], [47], [58], [70]. Tuy vậy, việc ước lượng
    chuyển động vẫn chủ yếu dựa trên không gian hai chiều còn trong không gian ba
    chiều thì họ vẫn phải chuyển từ không gian ba chiều sang hai chiều [26].
    Trong luận án này, nghiên cứu sinh sẽ tiếp tục nghiên cứu áp dụng lọc
    Kalman để ước lượng chuyển động của ảnh với các giải pháp mở rộng hơn:
    - Ước lượng chuyển động của ảnh bằng Kalman một bước.
    - Ước lượng chuyển động của ảnh bằng Kalman nhiều bước, nhiều chiều.
    - Ước lượng chuyển động tối ưu của ảnh trong video bằng lọc Kalman.
    4
    Để giải quyết bài toán nâng cao hiệu quả sử dụng băng tần hơn nữa, đồng
    thời tăng độ chính xác ước lượng trong môi trường kênh có nhiễu lớn và fading ,
    luận án đã nghiên cứu, đề xuất ứng dụng thuật toán mù.
    Tính cấp thiết của đề tài
    Hiện nay, với việc triển khai mạng thông tin thế hệ sau đã mở đường cho
    nhiều ứng dụng mới ra đời như truyền tín hiệu video trên các phương tiện thông tin
    di động, đa môi trường. Nhưng làm sao để nâng cao hiệu quả sử dụng tài nguyên
    băng tần, hạn chế tối đa tác động tiềm tàng của nhiễu trong môi trường truyền dẫn
    vô tuyến thì bài toán đặt ra là phải nén tín hiệu video sao cho hiệu quả nhất mà vẫn
    đảm bảo chất lượng hình ảnh với sự trợ giúp đắc lực của công nghệ thông tin. Vì
    vậy, đề tài này là một chủ đề cấp thiết cho ứng dụng truyền video trên các mạng
    viễn thông đa môi trường thế hệ mới.
    Mục tiêu nghiên cứu
    Luận án tìm các thuật toán hợp lý để ước lượng chuyển động của ảnh trong
    video sao cho dễ tính toán, đảm bảo độ bám chuyển động của ảnh một cách tốt nhất.
    - Nghiên cứu đề xuất ứng dụng thuật toán ước lượng chuyển động trong không
    gian nhiều chiều với nghiệm ước lượng chuyển động tối ưu, độ bám tốt.
    - Tăng hiệu quả sử dụng băng tần truyền dẫn bằng các thuật toán không cần sử
    dụng tín hiệu đào tạo.
    - Thuật toán ước lượng làm việc ổn định trong điều kiện kênh có nhiễu.
    Đối tượng, phạm vi và phương pháp nghiên cứu
    Luận án nghiên cứu các phương pháp nén video số, ứng dụng truyền video
    trong mạng thông tin di động thế hệ mới. Đây là một phạm vi rộng, bao gồm: lượng
    tử hóa, ước lượng chuyển động của ảnh, mã hóa - giải mã.
    Luận án tập trung vào việc nghiên cứu các thuật toán ước lượng chuyển động
    của ảnh, phân tích các kết quả nghiên cứu chuyển động ảnh đã có trước đây; nghiên
    cứu các thuật toán ước lượng về mặt toán học từ đó tìm ra thuật toán ước lượng hợp
    5
    lý để đạt mục tiêu đề ra. Từ phân tích toán học, luận án dùng công cụ mô phỏng để
    kiểm chứng.
    Ý nghĩa khoa học và thực tiễn
    Ý nghĩa khoa học: Làm phong phú hơn về lý luận ước lượng chuyển động
    của ảnh bằng các thuật toán lặp, đó là:
    - Dùng thuật toán Kalman: Đây là phương pháp lặp, sử dụng trong không gian
    nhiều chiều và chỉ ra nghiệm tối ưu của ước lượng chuyển động.
    - Dùng thuật toán mù: Đây là phương pháp lặp, không cần sử dụng tham chiếu
    trước mà chỉ cần mối tương quan giữa hai khung ảnh là ước lượng được
    chuyển động của ảnh.
    Ý nghĩa thực tiễn: Mở ra khả năng tính toán mới để ước lượng ảnh nhanh
    hơn, có độ bám chuyển động tốt hơn, tránh được những thông tin dư thừa do độ
    bám chuyển động không tốt gây ra; ứng dụng trong môi trường có nhiễu.
    Nội dung luận án
    Nội dung của luận án được bố cục với các phần chính như sau:
    Mở đầu: Giới thiệu bài toán và phương pháp nghiên cứu.
    Chương 1 - Tổng quan về nén video: Giới thiệu vai trò, vị trí, yêu cầu, mô
    hình hệ thống và một số kỹ thuật nén video.
    Chương 2 - Tổng quan về ước lượng chuyển động của ảnh: Đây là chương
    đưa ra những kiến thức cơ bản về ước lượng chuyển động của ảnh, những thuật toán
    hiện có, đánh giá ưu điểm và nhược điểm của những thuật toán hiện có.
    Chương 3 - Ước lượng chuyển động bằng các giải pháp mới: Chương này đề
    xuất áp dụng những thuật toán mới cho việc ước lượng chuyển động của ảnh, đó là
    thuật toán Kalman và thuật toán mù.


    DANH MỤC TÀI LIỆU THAM KHẢO
    [1] Aggarwal J. K. and N. Nandhakumar (1988), “On the Computation of
    Motion from Sequences of Images - a Review”, Proceedings of the IEEE,
    76(8), pp. 917-935.
    [2] Aizawa K. and T. S. Huang (1995), “Model-Based Image Coding: Advanced
    Video Coding Techniques for Very Low Bit Rate Applications”,
    Proceedings of the IEEE, 83(2), pp. 259-271.
    [3] Akram M. and Izquierdo E. (2010), “A Multi-Pattern Search Algorithm for
    Block Motion Estimation in Video Coding”, International Asia-Pacific Web
    Conference, pp. 407-410.
    [4] Al Bovik (2000), Handbook of Image and Video Processing, Academic
    Press, New York.
    [5] A. Hyvarinen, J. Karhunen and E. Oja (2001), Independent Component
    Analysis, John Wiley & Sons, New York.
    [6] A. Murat Telkap (1995), Digital Video Processing, Prentice Hall, Englewood
    Cliffs, NJ.
    [7] Belloulata K., Shiping Zhu, Jun Tian and Xiaodong Shen (2011), “A Novel
    Cross-Hexagon Search Algorithms for Fast Block Motion Estimation”,
    International Workshop on Systems, Signal Processing and their
    Applications, pp. 1-4.
    [8] Biemond J., L. Looijenga, D. E. Boekee and R. H. J. M. Plompen (1987), “A
    Pel Recursive Wiener-Based Displacement Estimation Algorithm”, Signal
    Processing, 13, pp. 399-412.
    [9] Bin Shen, Perry S. and Fraser D. (2010), “Adaptive Motion-Compensated
    Temporal Filtering of Sector Scan Sonar Image Sequences”, OCEANS 2010
    IEEE - Sydney, pp. 1-6.
    115
    [10] Burkhard H. and H. Moll (1979), A Modified Newton-Raphson Search for the
    Model-Adaptive Identification of Delays in Identification and System
    Parameter Identification, Pergamon Press, New York.
    [11] B. Giod (1993), “Motion Compensating Prediction with Fractional Pel
    Accuracy”, IEEE Transactions on Communications, 41(4), pp. 604-612.
    [12] B. G. Haskell (1974), “Frame to Frame Coding of Television Pictures Using
    Two-Dimensional Fourier Transforms”, IEEE Transactions on Information
    Theory, 20, pp. 119-120.
    [13] B. Liu and A. Zaccaring (1993), “New Fast Algorithms for the Estimation of
    Block Motion Vectors”, IEEE Transactions on Circuits and Systems for
    Video Technology, 3, pp. 148-157.
    [14] B. Zeng, R. Li and M. L. Liou (1997), “Optimization of Fast Block Motion
    Estimation Algorithms”, IEEE Transactions Circuits and Systems for Video
    Technology, 7(6), pp. 833-844.
    [15] Cai Zhuoyu and Zhang Licai (2010), “Video Coding Algorithm for Block
    Motion Estimation”, International Conference on E-Product E-Service and
    E-Entertainment, pp. 1-3.
    [16] Callico G. M., Lopez S., Sosa O., Lopez J. F. and Sarmiento R. (2008),
    “Analysis of Fast Block-Matching Motion Estimation Algorithms for Video
    Super-Resolution Systems”, IEEE Transactions on Consumer Electronics,
    54(3), pp. 1430-1438.
    [17] Chatterjee A. K., Mukherji R. and Tripathi S. (2007), “An Improved
    Adaptive Cross Pattern Search (IACPS) Algorithm for Block Motion
    Estimation in Video Compression”, International Conference on
    Computational Intelligence and Multimedia Applications, 3, pp. 89-96.
     

    Các file đính kèm:

Đang tải...