Báo Cáo Sử dụng các phương pháp luận sáng tạo để giải quyết bài toán motion detect

Thảo luận trong 'Chưa Phân Loại' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu

    TỔNG QUAN


    Hiện nay, có rất nhiều phương pháp detect motion trong video. Nhưng hầu hết chúng đều có chung một phương pháp cơ sở là việc so sánh giữa frame hiện tại với một hoặc các frame trước đó. Nói đơn giản hơn là làm việc với các ảnh số, vi vậy chúng ta phải áp dụng một số kỹ thuật của image processing để thực hiện vấn đề này.
    Để tiếp cận dễ dàng hơn vấn đề của bài viết, ta đi vào tìm hiểu một khái niệm có nhiều diểm tương đồng với motion detect, đó là phương pháp nén video.
    Một file video gồm 2 phần chính, đó là hình ảnh và âm thanh. Ở đây chúng ta chỉ cần quan tâm đến yếu tố hình ảnh. Chẳng hạn, với cách lưu trữ video theo chuẩn NTSC: cứ mỗi giây së tương ứng 30 frame. Trong quá trình hiển thị, các frame xếp chồng lên nhau với tốc độ rất nhanh, vì vậy ta sẽ có cảm giác các đối tượng trong frame đang chuyển động. Nói như vậy, ta cần phải quan tâm đến vấn đề lưu trữ frame. Nếu như lưu trữ một cách thông thường theo các frame, ta lấy ví dụ chẳng hạn một frame có dung lượng 10 Kb thì để lưu trữ 1 giây thì ta sẽ mất đến 3 Mb. Dung lượng cần để lưu trữ như vậy là quá lớn, chính vì vậy khái niệm nén video đã được ra đời
    Nhận thấy rằng trong 1 scene sẽ có một số thành phần không thay đổi trong suốt quá trình diễn ra scene đó. Vi vậy dẫn đến ý tưởng ta có thể tách những thành phần không đổi đó ra thành một frame chung, còn được gọi là “background”. Tại những frame còn lại của scene ta chỉ cần lưu trữ các đối tượng còn lại, hay còn gọi là foreground. Thao tác này sẽ giảm bớt việc lưu trữ các “background” lập lại ở mỗi frame. Nhờ đó mà dung lượng lưu trữ sẽ giảm đáng kể.
    Từ ý tưởng của phương pháp nén video, ta đã có ý niệm tổng quát để Xây dựng phương pháp detect motion trong phần còn lại.

    CÁC PHƯƠNG PHÁP SỬ DỤNG
    NGUYÊN TẮC PHÂN NHỎ

    Chia nhỏ đối tượng thành các thành phần độc lập.
    Tăng mức độ phân nhỏ của đối tượng.
    Bài toán detect motion được phân thành nhiều vấn đề nhỏ, với mỗi vấn đề nhỏ có phương pháp riêng để giải quyết chúng. Các phương pháp được dùng như sau đây.
    Một chương trình detect mộtion hiểu hay tiếp cận một cách đơn giản nhất là làm sao để detect được những đối tượng có sự thay đổi giữa các frame. Để thực hiện điều này, ta có thể sử dụng một số phương pháp:
    ã Phương pháp tách background, cập nhật background.
    ã Phương pháp tách đối tượng (foreground) từ các frame đang xét và background.
    ã Phương pháp lấy ngưỡng (threshold) để loại bỏ nhiễu.
    ã Phương pháp erosion và dilatation khử nhiễu.
    ã Và một số phương pháp khác để tối ưu tốc độ xử lí của chương trình.
    Trước tiên ta cần xem xét vấn đề làm sao để cải thiện được tốc độ xử lý của chương trình, đồng thời phải tiếp cận được phương pháp lấy ngưỡng. Một frame hay ảnh có nhiều đặc trưng, chẳng hạn như đặc trưng về không gian giữa các pixel, đặc trưng về màu sắc, về texture hay shape. Để có thể áp dụng phương pháp lấy ngưỡng, ta cần phải thực hiện phép so sánh với ít nhất một trong các đặc trưng trên. Mà màu sắc là một yếu tố cơ bản vô cùng quan trọng. Tuy nhiên, ảnh số được lưu trữ bởi không gian màu RGB với mỗi pixel lưu trữ ba giá trị kênh màu rời rạc gồm 256 mức. Chính vì vậy, chúng ta cần phải biến đổi giá trị màu ấy về một dải màu (hay kênh màu) duy nhất. Không gian màu có thể đáp ứng được yêu cầu trên là grayscale.

    NGUYÊN TẮC TÁCH KHỎI

    Tách phần gây phiền phức (tính chất gây phiền phức) hay ngược lại, tách phần duy nhất cần thiết (tính chất cần thiết) ra khỏi đối tượng.
    Ở đây ta tách bỏ các màu sắc không cần thiết và chỉ lại yếu tố màu cần thiết bằng phương pháp lọc grayscale.
    GRAYSCALE
    Trong hầu hết quá trình xử lí ảnh, chúng ta chủ yếu chỉ quan tâm đến cấu trúc của ảnh và bỏ qua ảnh hưởng của yếu tố màu sắc. Do đó bước chuyển từ ảnh màu thành ảnh xám là một công đoạn phổ biến trong các qua trình xử lí ảnh vì nó làm tăng tốc độ xử lí là giảm mức độ phức tạp của các thuật toán trên ảnh. Chúng ta có công thức chuyển các thông số giá trị màu của một pixel thành mức xám tương ứng
     
Đang tải...