Luận Văn Tìm hiểu phương pháp phân đoạn ảnh

Thảo luận trong 'Kiến Trúc - Xây Dựng' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    TÊN ĐỀ TÀI: Tìm hiểu phương pháp phân đoạn ảnh​

    Information

    MỞ ĐẦU



    Xử lý ảnh (XLA) là một trong những chuyên ngành quan trọng và lâu đời của Công nghệ thông tin. XLA được áp dụng trong nhiều lĩnh khác nhau như y học, vật lý, hoá hoc, tìm kiếm tội phạm, Mục đích chung của việc XLA thường là: (1) xử lý ảnh ban đầu để có được một bức ảnh mới theo một yêu cầu cụ thể; (2) phân tích ảnh để thu được các thông tin đặc trưng trên ảnh nhằm hỗ trợ cho việc phân loại và nhận biết ảnh; (3) phân đoạn ảnh (image segmentation) để nhận diện được các thành phần trong ảnh nhằm hiểu được kết cấu của bức ảnh ở mức độ cao hơn. Để xử lý được một bức ảnh thì phải trải qua nhiều bước, nhưng bước quan trọng và khó khăn nhất đó là phân đoạn ảnh. Nếu bước phân đoạn ảnh không tốt thì dẫn đến việc nhận diện sai lầm về các đối tượng có trong ảnh.


    Trong khoảng 30 năm trở lại đây đã có rất nhiều các thuật toán được đề xuất để giải quyết bài toán phân đoạn ảnh. Các thuật toán hầu hết đều dựa vào hai thuộc tính quan trọng của mỗi điểm ảnh so với các điểm lân cận của nó, đó là: sự khác (dissimilarity) và giống nhau (similarity). Các phương pháp dựa trên sự khác nhau của các điểm ảnh được gọi là các phương pháp biên (boundary-based methods) , còn các phương pháp dựa trên sự giống nhau của các điểm ảnh được gọi là phương pháp miền (region-based methods). Tuy nhiên, cho đến nay các thuật toán theo cả hai hướng này đều vẫn chưa cho kết quả phân đoạn tốt, vì cả hai loại phương pháp này đều chỉ nắm bắt được các thuộc tính cục bộ (local) của ảnh. Do đó, trong thời gian gần đây, việc tìm ra các thuật toán nắm bắt được các thuộc tính toàn cục (global) của bức ảnh đã trở thành một xu hướng.


    Mục đích chính của em là tìm hiểu và hệ thống lại các phương pháp phân đoạn ảnh đã có theo các hướng: như phân đoạn theo ngưỡng, phân đoạn theo đường biên và theo miền đồng nhất. Ngoài ra, trong đồ án này em cũng tìm hiểu và trình bày thêm một phương pháp được đánh giá là hiệu quả hơn các phương pháp trướcđây. Phương pháp này dựa vào việc coi một bức ảnh như một đồ thị, sau đó địnhnghĩa một tính chất để so sánh giữa các cặp miền của ảnh. Thuật toán này tuân theo một chiến lược tham lam, có thời gian chạy gần như tuyến tính, nhưng vẫn đảm bảo được việc phân đoạn chính xác và hiệu quả.


    Ngoài phần mở đầu và kết luận, luận văn được chia làm 4 chương, cụ thể nội dung các chương như sau:



    Chương 1Trình bày sơ lược về XLA, giới thiệu các giai đoạn xử lý trong một hệ thống XLA, trong đó có bước phân đoạn ảnh. Một số khái niệm, thuật ngữ trong XLA, như điểm ảnh, mức xám, biên, được trình bày như là các khái niệm.


    Chương 2 Hệ thống lại một số thuật toán phân đoạn ảnh theo các hướng: phân đoạn theo ngưỡng, phân đoạn theo đường biên và phân đoạn theo miền đồng nhất. Trong mỗi loại phương pháp này chúng tôi trình bày ngắn gọn phương pháp và ưu nhược điểm của chúng.


    Chương 3 Trình bày một thuật toán phân đoạn dựa trên đồ thị :Thuật toán coi mỗi pixel là một đỉnh của đồ thị, sự khác nhau giữa hai điểm ảnh là trọng số của cạnh nối hai đỉnh tương ứng với nhau. Thuật toán dựa theo chiến lược tham lam, nhưng có thể nắm bắt được các thuộc tính non-local của bức ảnh. Một số định lý và hệ quả liên quan đến thuật toán được trình bày và chứng minh ngắn gọn.


    Chương 4 đưa ra các đoạn mã chương trình (code) bằng C++ mã hoá một sốthuật toán được trình bày trong luận văn.



    Khi viết báo cáo này em dã cố gắng hết sức để hoàn thành công việc được giao, song điều kiện thời gian và trình độ còn hạn chế nên không tránh khỏi thiếu sót.Em mong nhận được sự góp ý của thầy giáo hướng dẫn , thầy cô giáo và bạn bè trong khoa Công nghệ thông tin để em có được những kinh nghiệm thực tế và bổích để sau này có thể xây dựng được một chương trình hoàn thiện hơn.


    KẾT LUẬN



    5.1 Nội dung của đồ án



    5.1.1 Các kết quả đạt được


    Trong quá trình nghiên cứu tài liệu và thực hiện đồ án dưới sự định hướng của thầy hướng dẫn em thấy bản thân đã đạt được một số kết quả như sau:

    ƒ Tìm hiểu được một cách tổng quan các vấn đề về XLA và phân đoạn ảnh.


    Em đã có một cách nhìn có hệ thống về các phương pháp phân đoạn ảnh và các thuật toán trong mỗi phương pháp. Đồng thời biết được điểm mạnh/yếu của từng phương pháp và có thể đưa ra cách lựa chọn phương pháp phù hợp với từng loại ảnh

    ƒ Trong chương 3 em đã tìm hiểu và cài đặt được một phương pháp cải tiến phương pháp phân đoạn dựa vào đồ thị. Phương pháp này phân đoạn nhanh và hiệu quả. Nó sử dụng được các thuộc tính local và non-local của bức ảnh để tăng cường khả năng phân đoạn chính xác.

    ƒ Ngoài ra, trong quá trình nghiên cứu em cũng tự tích lũy thêm cho mình các kiến thức về toán học, về kỹ thuật lập trình, Và quan trọng là rèn luyện kỹ năng để thực hiện một nghiên cứu khoa học.


    5.1.2 Một số hạn chế cần khắc phục


    Bên cạnh những kết quả đạt được em tự thấy bản luận văn vẫn còn một số hạn chế.

    ƒ Chưa đưa ra được một phương pháp phân đoạn mới hoàn toàn. Trong khuôn khổ một đồ án tốt nghiệp ,em mới chỉ trình bày lại các kiến thứctìm hiểu được chứ chưa đề xuất được một phương pháp hoàn toàn mới.




    ƒ Do thời gian có hạn, nên vịêc trình bày các thuật toán phân đoạn cũngchưa được hệ thống và khoa học. Có nhiều thụât toán được trình bày sơlược.


    ƒ Đồ án cũng chưa chỉ ra được các ứng dụng thực tế của các thuật toán phân đoạn.


    5.2 Công việc tiếp theo


    Dựa trên những kết quả bước đầu đã đạt được trong đồ án, em có đề xuất một số cải tiến thuật toán phân đoạn để phân đoạn hiệu quả hơn trong tương lai.

    ƒ Xây dựng một ứng dụng xử lý ảnh hoàn chỉnh dựa theo các thuật toán đã trình bày trong luận văn. Ứng dụng này nhằm phân đoạn ảnh để nhận diện được các thành phần có trong ảnh. Trích rút ra các đối tượng có trong ảnh và đặt tên cho chúng.

    ƒ Các thuật toán phân đoạn trình bày trong luận văn áp dụng đối với ảnh tĩnh, trong thời gian tới, em hy vọng có thể tìm hiểu và phát triển các thuậttoán phân đoạn đối với ảnh động hoặc các đoạn video ngắn.
     
Đang tải...