Thạc Sĩ Kết hợp đa đặc trưng trong mô hình CRFs cho bài toán phân đoạn ảnh theo đối tượng

Thảo luận trong 'Khoa Học Công Nghệ' bắt đầu bởi Bích Tuyền Dương, 13/10/12.

  1. Bích Tuyền Dương

    Bài viết:
    2,590
    Được thích:
    0
    Điểm thành tích:
    0
    Xu:
    0Xu
    TÓM TẮT LUẬN VĂN

    Một trong những ưu điểm lớn nhất về hệ thống thị giác của con người là khả năng nhận ra và hiểu những hình ảnh trong thế giới thực một cách nhanh chóng, chính xác và đầy đủ nhất. Chẳng hạn, khi nhìn vào một bức ảnh chụp trên sân vận động, con người ngay lập tức nhận ra đây là hình ảnh về một trận đấu bóng đá giữa hai đội A và B. Đây cũng chính là một trong những mục tiêu đầu tiên và cũng là quan trọng nhất của ngành thị giác máy tính: khả năng rút trích thông tin từ một đối tượng thị giác đầu vào (ảnh, video, ). Thông tin này có thể bao gồm rất nhiều loại: từ những thông tin ở mức cao (bức ảnh này là bức ảnh gì) đến những thông tin ở mức thấp (những đối tượng có trong ảnh).
    Giải quyết trọn vẹn bài toán trên là một vấn đề khó và đồ sộ, đòi hỏi phải nghiên cứu lâu dài. Do đó, luận văn này sẽ tập trung vào bài toán phân đoạn ảnh theo đối tượng (object segmentation), một trong những bài toán quan trọng nhất của bài toán lớn trên. Phân đoạn ảnh đối tượng có thể được xem là bài toán tổng hợp của hai bài toán kinh điển: phân đoạn ảnh và nhận dạng đối tượng. Bài toán này không chỉ phân đoạn ảnh ban đầu ra thành từng vùng mà còn xác định ngữ nghĩa của từng vùng (vùng này thuộc đối tượng nào).
    Luận văn đã tìm hiểu và áp dụng nhiều loại đặc trưng khác nhau vào mô hình trường ngẫu nhiên có điều kiện. Đây là một trong những mô hình tốt nhất hiện nay cho bài toán phân đoạn ành theo đối tượng. Các đặc trưng được sử dụng gồm:
     Đặc trưng được tính trên từng pixel:
    - Đặc trưng vân-bố cục: đặc trưng dựa vào vân ảnh, có khả năng mã hoá thông tin về ngữ cảnh xung quanh đối tượng và bố cục của đối tượng.
    - Đặc trưng màu sắc: mô hình hoá phân bố màu sắc của các đối tượng.
    - Đặc trưng vị trí: mô hình hoá vị trí tương đối của các đối tượng trong ảnh.
     Đặc trưng giữa các pixel: khuyến khích các pixel gần nhau mang nhãn giống nhau.
     Đặc trưng trên một nhóm các pixel gần nhau (superpixel): superpixel là một nhóm các pixel gần nhau có chung diện mạo. Các superpixel được tạo ra từ các thuật toán học không giám sát. Việc sử dụng superpixel sẽ làm rõ hơn đáng kể đường biên giữa các đối tượng.
    MỤC LỤC
    LỜI CÁM ƠN II
    MỤC LỤC . III
    DANH MỤC HÌNH ẢNH . V
    Danh sách các bảng VIII
    TÓM TẮT LUẬN VĂN IX
    Danh mục chữ viết tắt: . XI
    Chương 1: MỞ ĐẦU . 1
    1.1. Giới thiệu lĩnh vực và ý nghĩa của đề tài . 1
    1.1.1. Dẫn nhập . 1
    1.1.2. Lĩnh vực nghiên cứu của đề tài . 3
    1.1.3. Ý nghĩa lý luận và thực tiễn: . 4
    1.2. Các kết quả nghiên cứu liên quan 6
    1.3. Phương pháp giải quyết đề xuất. . 8
    1.4. Cấu trúc luận văn . 10
    Chương 2: TRưỜNG NGẪU NHIÊN CÓ ĐIỀU KIỆN VÀ CỰC TIỂU HOÁ NĂNG LưỢNG BẰNG GRAPH-CUT 13
    2.1. Trường ngẫu nhiên có điều kiện 13
    2.2. Cực tiểu hoá năng lượng 15
    2.2.1. Tổng quan về cực tiểu hoá năng lượng . 15
    2.2.2. Cực tiểu hoá năng lượng bằng phương pháp graph cut. . 16
    Chương 3: Mô hình CRFs cho bài toán phân đoạn ảnh theo đối tượng. 24
    3.1. Thế năng vân-bố cục 26
    3.1.1. Texton hoá ảnh . 27
    IV
    3.1.2. Bộ lọc vân-bố cục . 30
    3.1.3. Thuật toán Joint Boosting . 33
    3.2. Thế năng màu sắc 36
    3.3. Thế năng vị trí: . 38
    3.4. Mô hình CRF mức cao: . 39
    3.4.1. Phân đoạn ảnh không giám sát . 39
    3.4.2. Thế năng mức cao: 41
    Chương 4: Kết quả thực nghiệm . 43
    4.1. Bộ dữ liệu . 43
    4.2. Độ đo . 44
    4.3. Bố trí thí nghiệm 44
    4.4. Kết quả . 45
    4.4.1. Thí nghiệm với các kích thước từ điển khác nhau 45
    4.4.2. Thí nghiệm với các mức độ kết hợp đặc trưng trong mô hình CRF đôi 46
    4.4.3. Thí nghiệm kết hợp với kết quả phân đoạn ảnh không giám sát trong mô hình CRFs mức cao . 48
    Chương 5: Kết luận và hướng phát triển . 52
    5.1. Kết luận 52
    5.2. Hướng phát triển 53
    Tài liệu tham khảo . 54
     

    Các file đính kèm:

Đang tải...