Luận Văn Nghiên cứu xây dựng hệ thống tự động dò tìm mặt người và nhận dạng ảnh chân dung (TM+chương trình)

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    1. Tên đề tài:
    Nghiên cứu xây dựng hệ thống tự động dò tìm mặt người và nhận dạng ảnh chân dung.
    2. Các số liệu ban đầu:
    3. Nội dung bản thuyết minh

    Chương 1: Mở đầu
    Chương 2: Giới thiệu bài toán nhận dạng mặt người
    Chương 3: Một số vấn đề cơ bản về xử lý ảnh số
    Chương 4: Dò tìm khuôn mặt trong ảnh
    Chương 5: Nhận dạng ảnh khuôn mặt sử dụng phương pháp PCA
    Chương 6: Kết luận
    Tài liệu tham khảo
    4. Số lượng, nội dung các bản vẽ A[SUB]0[/SUB] và các sản phẩm (nếu có)




    MỤC LỤC
    TOC o "1-3" h z u Mở đầu. PAGEREF _Toc201266201 h 3 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200300031000000
    Chương 1. Giới thiệu bài toán nhận dạng mặt người PAGEREF _Toc201266202 h 6 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200300032000000
    Chương 2: Một số vấn đề cơ bản về xử lý ảnh số. PAGEREF _Toc201266203 h 10 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200300033000000
    2.1: Một số khái niệm cơ bản. PAGEREF _Toc201266204 h 10 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200300034000000
    2.2: Biểu diễn ảnh. PAGEREF _Toc201266205 h 10 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200300035000000
    2.3. Phân tích ảnh trên các không gian màu khác nhau. PAGEREF _Toc201266206 h 11 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200300036000000
    Chương 3: Dò tìm khuôn mặt trong ảnh. PAGEREF _Toc201266207 h 16 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200300037000000
    3.1: Một số phương pháp xác định vị trí khuôn mặt PAGEREF _Toc201266208 h 16 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200300038000000
    3.2: Phương pháp dò tìm khuôn mặt dựa trên sắc màu da. PAGEREF _Toc201266209 h 19 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200300039000000
    3.2.1: Mô tả phương pháp. PAGEREF _Toc201266210 h 20 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200310030000000
    3.2.2: Phạm vi vùng màu da. PAGEREF _Toc201266211 h 22 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200310031000000
    3.2.3: Mô hình phân bố màu da không có tham số. PAGEREF _Toc201266212 h 23 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200310032000000
    3.2.4: Mô hình phân bố màu da có tham số. PAGEREF _Toc201266213 h 25 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200310033000000
    3.2.5: Mô hình hỗn hợp. PAGEREF _Toc201266214 h 28 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200310034000000
    3.2.6: Mô hình phân bố màu da động. PAGEREF _Toc201266215 h 29 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200310035000000
    3.3: Phương pháp dò tìm khuôn mặt dựa trên các Haar Feature. PAGEREF _Toc201266216 h 30 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200310036000000
    3.3.1 . Haar-  features. PAGEREF _Toc201266217 h 30 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200310037000000
    2.3.2. Tiếp cận Boosting. PAGEREF _Toc201266218 h 34 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200310038000000
    2.3.3. AdaBoost (Adaptive Boost) PAGEREF _Toc201266219 h 35 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200310039000000
    2.3.4. Các tầng của bộ phân lớp. PAGEREF _Toc201266220 h 39 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200320030000000
    2.3.5. Dò tìm mặt người sử dụng Haar Features và  bộ phân lớp khuôn mặt PAGEREF _Toc201266221 h 42 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200320031000000
    Chương 4. Nhận dạng ảnh khuôn mặt bằng phương pháp PCA PAGEREF _Toc201266222 h 45 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200320032000000
    4.1: Mô tả phương pháp. PAGEREF _Toc201266223 h 45 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200320033000000
    4.2: Giảm số chiều không gian vector sử dụng phương pháp biến đổi tuyến tính  PAGEREF _Toc201266224 h 48 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200320034000000
    4.3:Nhận dạng mặt người theo phương pháp PCA: PAGEREF _Toc201266225 h 53 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200320035000000
    Chương 5. Thiết kế chương trình nhận dạng mặt người PAGEREF _Toc201266226 h 59 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200320036000000
    5.1: Yêu cầu của chương trình. PAGEREF _Toc201266227 h 59 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200320037000000
    5.2: Thiết kế các chức năng của chương trình. PAGEREF _Toc201266228 h 59 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200320038000000
    5.2.1: Các bộ lọc phân tích ảnh trên không gian màu RGB PAGEREF _Toc201266229 h 59 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200320039000000
    5.2.2: Các bộ lọc phân tích ảnh trên không gian màu HSL. PAGEREF _Toc201266230 h 60 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200330030000000
    5.2.3: Các bộ lọc phân tích ảnh trên không gian màu YCbCr PAGEREF _Toc201266231 h 62 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200330031000000
    5.2.4.: Dò tìm và nhận dạng ảnh khuôn mặt trong ảnh màu. PAGEREF _Toc201266232 h 63 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200330032000000
    5.2.5: Dò tìm, nhận dạng ảnh thu được qua camera. PAGEREF _Toc201266233 h 65 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200330033000000
    5.2.6: Dò tìm, nhận dạng ảnh trích từ file *.avi PAGEREF _Toc201266234 h 66 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200330034000000
    Chương 6. Kết luận. PAGEREF _Toc201266235 h 68 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200330035000000
    Tài liệu tham khảo. PAGEREF _Toc201266236 h 71 08D0C9EA79F9BACE118C8200AA004BA90B02000000080000000E0000005F0054006F0063003200300031003200360036003200330036000000

    Mở đầu
    Mọi người có thể dễ dàng nhìn thấy vị trí tất cả các khuôn mặt trong ảnh và phân biệt được mọi người trong ảnh là người mình đã quen biết hay không. Tuy nhiên, trong lĩnh vực thị giác máy tính, kỹ thuật máy tính xác định chính xác vị trí, kích thước khuôn mặt trong một ảnh bất kỳ là một vấn đề vô cùng khó khăn. Hơn một thập kỷ qua có rất nhiều công trình nghiên cứu về bài toán xác định khuôn mặt người từ ảnh đen trắng, xám đến ảnh màu như ngày hôm nay. Các nghiên cứu đi từ bài toán đơn giản, mỗi ảnh chỉ có một khuôn mặt người nhìn thẳng vào thiết bị thu hình và đầu ở tư thế thẳng đứng trong ảnh đen trắng. Cho đến ngày hôm nay bài toán mở rộng cho ảnh màu, có nhiều khuôn mặt trong cùng một ảnh, có nhiều tư thế thay đổi trong ảnh. Không những vậy mà còn mở rộng cả phạm vi từ môi trường xung quanh khá đơn giản (trong phòng thí nghiệm) cho đến môi trường xung quanh rất phức tạp (như trong tự nhiên) nhằm đáp ứng nhu cầu thực tế và rất nhiều của con người.
    Trong thực tế, các ứng dụng của việc dò tìm và nhận dạng khuôn mặt người được triển khai trong nhiều lĩnh vực quan trọng, nhất là trong lĩnh vực an ninh. Tuy nhiên những kết quả đã đạt được hiện nay chỉ có độ chính xác nhất định, chưa đạt được độ chính xác cao. Ảnh thu được phụ thuộc rất lớn vào nhiều điều kiện: độ chiếu sáng, khung cảnh xung quanh, quần áo đang mặc trên người, Việc tìm ra các tập luật chặt chẽ của khuôn mặt để xác định vị trí của nó trong ảnh rất khó khăn. Từ các kết quả nghiên cứu cho thấy nếu tập luật quá chặt chẽ sẽ dò tìm thiếu các khuôn mặt trong ảnh, ngược lại nếu tập luật đơn giản sẽ dò tìm sai một số vị trí không phải là khuôn mặt. Bên cạnh đó, cho đến nay việc mô hình hoá gương mặt một cách tổng quát là một công việc không hề đơn giản. Vẫn chưa có một nghiên cứu nào trả lời chính xác câu hỏi: đâu là đặc trưng thực sự để phân biệt hai gương mặt với nhau?
    Các kỹ thuật dò tìm và nhận dạng ảnh được ứng dụng rất hiệu quả trong thực tế. Tuy nhiên, các kỹ thuật dò tìm và nhận dạng ảnh hiện nay vẫn chưa có kết quả hoàn toàn chính xác. Vì vậy trong đồ án tốt nghiệp của mình em đã chọn đề tài “nghiên cứu và xây dựng chương trình tự động dò tìm mặt người và nhận dạng ảnh chân dung” để có điều kiện tìm hiểu thêm về công nghệ xử lý ảnh và các ứng dụng thực tế của nó.
    Mục tiêu của đồ án là xây dựng ứng dụng có khả năng dò tìm được toàn bộ vị trí các khuôn mặt trong ảnh màu có màu nền phức tạp và nhận dạng ảnh các khuôn mặt dò tìm được tương ứng là ai trong cơ sở dữ liệu. Đồ án được trình bày trong 6 chương với bố cục như sau:
    Chương 1: Giới thiệu bài toán nhận dạng mặt người: nêu lên tầm quan trọng của các ứng dụng nhận dạng mặt người trong thực tế. Đồng thời mô tả phạm vi bài toán mà đồ án giải quyết.
    Chương 2: Một số vấn đề cơ bản về xử lý ảnh số: trình bày cơ sở lý thuyết về biểu diễn ảnh số. Phương pháp biểu diễn và phân tích ảnh trên một số không gian màu cơ bản, là cơ sở cho việc tìm ra các phương pháp giải quyết một số bài toán xử lý ảnh.
    Chương 3: Dò tìm khuôn mặt trong ảnh: trình bày một số phương pháp dò tìm khuôn mặt trong ảnh. Trình bày chi tiết hai phương pháp dò tìm khuôn mặt mà luận án thực hiện: dò tìm khuôn mặt dựa trên sắc màu da và dò tìm khuôn mặt sử dụng mô hình Cascade of Boosted Classifier.
    Chương 4: Nhận dạng mặt người: trình bày chi tiết phương pháp nhận dạng mặt người dựa trên kỹ thuật phân tích thành phần chính (PCA - Principal Components Analysis).
    Chương 5: Thiết kế chương trình nhận dạng mặt người: trình bày các chức năng của chương trình dò tìm, nhận dạng mặt người và một số module tiện ích.
    Chương 6: Kết luận: các kết quả, một số hạn chế, khả năng ứng dụng, hướng phát triển của đề tài.
    Trong phạm vi đề tài đã xây dựng chương trình thực hiện dò tìm vị trí các khuôn mặt trong ảnh có màu nền phức tạp và nhận dạng ảnh khuôn mặt dò tìm được bằng phương pháp phân tích thành phần chính (PCA – Principal Components Analysis). Kết quả nhận dạng chỉ tương đối chính xác trong tập dữ liệu nhỏ (dưới 20 người) và trong điều kiện môi trường ràng buộc (trong văn phòng, nhà ở, ). Vì vậy trong thời gian tới em rất mong được sự đóng góp ý kiến của các thầy, cô giáo và các bạn để đề tài có kết quả cao hơn, có thể triển khai các ứng dụng trong thực tế.
    Trong quá trình thực hiện em xin chân thành cảm ơn thầy giáo Đại tá PGS. TS Nguyễn Đức Hiếu đã tận tình hướng dẫn, chỉ bảo từng nội dung của đề tài, các thầy, cô giáo khoa Công Nghệ Thông Tin - Học Viện Kỹ Thuật Quân Sự đã có nhiều giúp đỡ chuyên sâu về công nghệ xử lý ảnh, để em có thể hoàn thành nội dung của đồ án.

    Hà Nội, Ngày 12 tháng 6 năm 2008
    Học viên





    Phan Viet Anh
     

    Các file đính kèm:

Đang tải...