Tài liệu Nhận dạng ảnh pattern recognition

Thảo luận trong 'Thiết Kế Web' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    NHẬN DẠNG ẢNH PATTERN RECOGNITION


    Như chỉ ra trong hình 1.1-a chương Một, nhận dạng ảnh là giai đoạn cuối cùng của các hệ thống xử lý ảnh. Nhận dạng ảnh dựa trên nền tảng lý thuyết nhận dạng (pattern recognition) nói chung và đã được đề cập trong nhiều sách về nhận dạng. Ở đây, ta không nhắc lại mà chỉ trình bày mang tính chất giới thiệu một số khái niệm cơ bản và các phương pháp thường được sử dụng trong kỹ thuật nhận dạng. Và cuối cùng sẽ đề cập đến một trường hợp cụ thể về nhận dạng đó là nhận dạng chữ viết, một vấn đề đã và đang được quan tâm nhiều.
    Trong lý thuyết nhận dạng nói chung và nhận dạng ảnh nói riêng có 3 cách tiếp cận khác nhau:
    - Nhận dạng dựa vào phân hoạch không gian.
    - Nhận dạng cấu trúc.
    - Nhận dạng dựa vào kỹ thuật mạng nơ ron.
    Hai cách tiếp cận đầu là các kỹ thuật kinh điển. Các đối tượng ảnh quan sát và thu nhận được phải trải qua giai đoạn tiền xử lý nhằm tăng cường chất lượng, làm nổi các chi tiết (chương 4), tiếp theo là trích chọn và biểu diễn các đặc trưng (chương 5 và chương 6), và cuối cùng mới qua giai đoạn nhận dạng. Cách tiếp cận thứ ba hoàn toàn khác. Nó dựa vào cơ chế đoán nhận, lưu trũ và phân biệt đối tượng mô phỏng theo hoạt động của hệ thần kinh con người. Do cơ chế đặc biệt, các đối tượng thu nhận bởi thị giác người không cần qua giai đoạn cải thiện mà chuyển ngay sang giai đoạn tổng hợp, đối sánh với các mẫu đã lưu trữ để nhận dạng. Đây là cách tiếp cận có nhiều hứa hẹn. Các cách tiếp cận trên sẽ trình bày chi tiết trong các phần dưới đây.

    7.1 TỔNG QUAN VỀ NHẬN DẠNG

    Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tượng một tên gọi) dựa theo những quy luật và các mẫu chuẩn. Quá trình nhận dạng dựa vào những mẫu học biết trước gọi là nhận dạng có thày hay học có thày (supervised learning); trong trường hợp ngược lại gọi là học không có thày (non supervised learning). Chúng ta sẽ lần lượt giới thiệu các khái niệm này.
    7.1.1 Không gian biểu diễn đối tượng, không gian diễn dịch
    Không gian biểu diễn đối tượng
    Các đối tượng khi quan sát hay thu thập được, thường được biểu diễn bởi tập các đặc trưng hay đặc tính. Như trong trường hợp xử lý ảnh, ảnh sau khi được tăng cường để nâng cao chất lượng, phân vùng và trích chọn đặc tính như đã trình bày trong các chương từ chương Bốn đến chương Sáu, được biểu diễn bởi các đặc trưng như biên, miền đồng nhất, v .,v. Người ta thường phân các đặc trưng này theo các loại như: đặc trưng tô pô, đặc trưng hình học và đặc trưng chức năng. Việc biểu diễn ảnh theo đặc trưng nào là phụ thuộc vào ứng dụng tiếp theo.
    Ở đây ta đưa ra một cách hình thức việc biểu diễn các đối tượng. Giả sử đối tượng X (ảnh, chữ viết, dấu vân tay, v .,v) được biểu diễn bởi n thành phần (n đặc trưng): X = {x[SUB]1[/SUB], x[SUB]2[/SUB], ., x[SUB]n[/SUB]}; mỗi x[SUB]i[/SUB] biểu diễn một đặc tính. Không gian biểu diễn đối tượng thường gọi tắt là không gian đối tượng X được định nghĩa:
    X = {X[SUB]1[/SUB], X[SUB]2[/SUB], ., X[SUB]m[/SUB]}
    trong đó mỗi X[SUB]i[/SUB] biểu diễn một đối tượng. Không gian này có thể là vô hạn. Để tiện xem xét chúng ta chỉ xét tập X là hữu hạn.
    Không gian diễn dịch
    Không gian diễn dịch là tập các tên gọi của đối tượng. Kết thúc quá trình nhận dạng ta xác định được
    tên gọi cho các đối tượng trong tập không gian đối tượng hay nói là đã nhận dạng được đối tượng Một cách hình thức gọi W là tập tên đối tượng:
    W = {w[SUB]1[/SUB], w[SUB]2[/SUB], .,w[SUB]k[/SUB]} với w[SUB]i[/SUB], i = 1, 2, ., k là tên các đối tượng
    Quá trình nhận dạng đối tượng f là một ánh xạ f: X ---> W với f là tập các quy luật để
    định một phần tử trong X ứng với một phần tử trong W. Nếu tập các quy luật và tập tên các đối tượng là biết trước như trong nhận dạng chữ viết (có 26 lớp từ A đến Z), người ta gọi là nhận dạng có thày. Trường hợp thứ hai là nhận dạng không có thày. Đương nhiên trong trường hợp này việc nhận dạng có khó khăn hơn.
     

    Các file đính kèm:

Đang tải...