Thạc Sĩ phân loại ảnh dựa trên hướng tiếp cận kernel

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỤC LỤC
    LỜI CẢM ƠN . . 1
    MỤC LỤC . . 2
    Danh mục các kí hiệu và chữ viết tắt . 5
    Danh mục các bảng . 6
    Danh mục các hình vẽ, đồ thị . 7
    MỞ ĐẦU . . 8
    Chương 1 Giới thiệu . . 9
    1.1 Mục tiêu . 9
    1.2 Đóng góp của luận văn . . 9
    1.2.1 Xây dựng kernel cho thuật toán SVM . . 9
    1.2.2 Áp dụng kernel xây dựng cho bài toán phân loại ảnh . 10
    1.3 Các đóng góp khác liên quan . . 11
    1.4 Cấu trúc của luận văn . . 11
    Chương 2 Thuật toán phân lớp dựa trên SVM . . 13
    2.1 Học với một kernel - Support Vector Machine (SVM) . 13
    2.1.1 Thuật toán phân lớp SVM . 13
    2.1.2 Kernel trong thuật toán phân lớp SVM . . 15
    2.1.2.1 Đo độ tương đồng sử dụng kernel . . 15
    2.1.2.2 Kernel xác định dương (Positive Definite Kernel) . .16
    2.1.2.3 Xây dựng không gian tái sinh kernel Hibert (Reproducting
    Kernel Hibert Space - RKHS) . . 17
    2.2 Học với nhiều kernel - Multiple Kernel Learning (MKL) . .19
    2.2.1 SILP . 20




    3
    2.2.2 SimpleMKL . 22
    Chương 3 Phương pháp kernel . 24
    3.1 Mô hình túi đặc trưng (Bag-of-feature model - BoF) . 25
    3.2 Các cải tiến của mô hình BoF . 26
    3.3 Phương pháp biểu diễn thưa (Sparse Coding) . 28
    Chương 4 Hierarchical Spatial Matching Kernel . 30
    4.1 Kernel tháp không gian (Spatial Pyramid Matching Kernel - SPMK) 30
    4.2 Kernel đề xuất: Hierarchical Spatial Matching Kernel . 31
    Chương 5 Thực nghiệm . 36
    5.1 Phân loại ảnh (Image categorization) . 36
    5.1.1 Giới thiệu bài toán phân loại ảnh . 36
    5.1.2 Ứng dụng của phân loại ảnh . 37
    5.1.3 Những thách thức của bài toán phân loại ảnh . 38
    5.1.4 Các hướng tiếp cận . 38
    5.1.4.1 Hướng tiếp cận dựa trên đặc trưng . 39
    5.1.4.2 Hướng tiếp cận dựa trên phương pháp học . 39
    5.2 Thực nghiệm . 41
    5.2.1 Phân loại đối tượng . 42
    5.2.1.1 Cơ sở dữ liệu Oxford Flowers: . 42
    5.2.1.2 Cơ sở dữ liệu CALTECH: . 44
    5.2.2 Phân loại cảnh (scene categorization) . 48
    5.2.3 Thí nghiệm Sparse Coding cho Hierarchical Spatial Matching
    Kernel (ScHSMK) . . 50
    5.2.3.1 ScHSMK trên cơ sở dữ liệu Oxford Flower . 50




    4
    5.2.3.2 ScHSMK trên cơ sở dữ liệu CALTECH-101 . . 51
    Kết luận và kiến nghị . . 53
    Kết luận . . 53
    Kiến nghị . . 54
    Danh mục công trình của tác giả . . 55
    Tài liệu tham khảo . 56

    MỞ ĐẦU
    Với sự bùng nổ của dữ liệu ảnh, việc phân loại các ảnh ra thành các lớp ngữ
    nghĩa là một trong những nhu cầu cơ bản cho việc quản lý và truy vấn ảnh dựa trên
    nội dung của ảnh. Thêm nữa, phân loại ảnh là một trong những bài toán cơ bản
    trong lĩnh vực thị giác máy tính và ứng dụng máy học và nhận được sự quan tâm
    của nhiều nhà khoa học trên thế giới. Bài toán phân loại ảnh có rất nhiều thách thức
    từ việc ảnh được chụp dưới nhiều góc độ khác nhau, điều kiện chiếu sáng khác nhau,
    sự đa dạng các thể hiện của cùng một lớp ngữ nghĩa cũng như sự phức tạp của
    thông tin nền trong ảnh. Để giải quyết bài toán phân loại ảnh thì có hai hướng tiếp
    cận chính là dựa trên đặc trưng hoặc dựa trên phương pháp học. Trong đó, hướng
    tiếp cận dựa trên phương pháp học mà đặc biệt là nhánh tiếp cận dựa trên phương
    pháp kernel là một trong những phương pháp được áp dụng rất rộng rãi và mang lại
    kết quả cao trong bài toán phân loại ảnh nói riêng và trong lĩnh vực thị giác máy
    tính nói chung, do tính mềm dẻo khi mô tả ảnh trong những điều kiện phức tạp như
    trên. Do vậy, trong luận văn này, tôi đề xuất kernel mới, đặt tên là Hierarchical
    Spatial Matching Kernel (HSMK) và áp dụng cho bài toán phân loại ảnh. HSMK là
    mô hình cải tiến từ mô hình Spatial Pyramid Maching (SPM), nhưng thay vì sử
    dụng mô hình Bag-of-Feature (BoF) để mô hình cho các vùng con (subregions),
    HSMK sử dụng mô hình thô mịn (coarse to fine - C2F) cho các vùng con mà được
    hiện thực hóa bằng phương pháp multiresolution (tạm dịch nhiều loại phân giải),
    tức xem xét vùng con trên một chuỗi các độ phân giải (resolution) khác nhau, do
    vậy, nó có thể miêu tả được thông tin tổng quát của vùng con từ những độ phân giải
    thô, cũng như những thông tin chi tiết của vùng con ở những độ phân giải mịn hơn
    như cách thức xem xét một vùng trên bản đồ, để có thể đạt được độ đo tương đồng
    tốt hơn trên các vùng con này. Từ thí nghiệm cho thấy, kernel đề xuất - HSMK cho
    hiệu quả rất tốt cho bài toán phân loại ảnh và đạt được kết quả tối ưu (state-of-the-
    art) trên nhiều cơ sở dữ liệu chuẩn cho bài toán phân loại ảnh.




    9





    ȔČࠌnƨ곀䏰﹝䃃䷽䐬﹝䅃ݛ
     
Đang tải...