Đồ Án Ứng dụng nhận dạng danh thiếp tiếng Việt và cập nhật thông tin danh bạ trên android ( full soure cod

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Mai Kul, 25/11/13.

  1. Mai Kul

    Mai Kul New Member

    Bài viết:
    1,299
    Được thích:
    0
    Điểm thành tích:
    0
    Xu:
    0Xu
    đồ án đầy đủ bản word , power point thuyết trình , bản full source code

    MỤC LỤCPHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP. 2
    TÓM TẮT ĐỒ ÁN 4
    MỤC LỤC 5
    DANH MỤC CÁC HÌNH 7
    DANH MỤC CÁC BẢNG 9
    MỞ ĐẦU 10
    CHƯƠNG 1. ĐẶT VẤN ĐỀ VÀ ĐỊNH HƯỚNG GIẢI PHÁP. 11
    1. Mô tả bài toán: 11
    2.Các vấn đề cần giải quyết: 12
    3.Đinh hướng giải pháp: 13
    3.1.Tiền xử lý ảnh với OpenCV: 14
    3.2.Nhận dạng thông tin từ ảnh sử dụng Tesseract OCR Engine: 14
    3.3.Trích rút thông tin liên lạc: 15
    3.4.Quản lý danh bạ: 15
    4.Cơ sở lý thuyết: 15
    4.1.Android: 15
    4.2.RESTful Webservice: 18
    4.3.Công nghệ OCR: 18
    4.4. OpenCV-Thư viện xử lý ảnh mã nguồn mở : [4] 20
    4.5.Sửa lỗi chính tả Tiếng Viết với Hunspell: 21
    CHƯƠNG 2: CÁC KẾT QUẢ ĐẠT ĐƯỢC. 22
    1. Đặc tả yêu cầu: 22
    2.Phân tích usecase: 24
    2.1.Mô hình usecase tổng thể của ứng dụng: 24
    2.2.Đặc tả chi tiết một số usecase: 26
    3.Thiết kế: 32
    3.1.Thiết kê lớp: 32
    3.2.Biểu đồ tuần tự: 37
    3.3.Thiết kế giải thuật: 42
    3.4.Thiết kế dữ liệu: 47
    3.5.Thiết kế giao diện: 49
    4.Cài đặt: 51
    4.1.Môi trường cài đặt: 51
    4.2.Kiến trúc hệ thống: 52
    4.3.Cài đặt mã nguồn: 53
    4.4.Giao diện ứng dụng: 54
    5.Triển khai, kiểm thử: 57
    5.1.Triển khai ứng dụng: 57
    5.2.Kiểm thử ứng dụng: 57
    6.Đánh giá ứng dụng: 64
    6.1.Ưu điểm: 64
    6.2.Nhược điểm: 64
    6.2.Hướng phát triển: 64
    KẾT LUẬN 65
    TÀI LIỆU THAM KHẢO 66


    DANH MỤC CÁC HÌNH
    Hình 1 : Kiến trúc tổng quan ứng dụng. 13
    Hình 2: Kiến trúc hệ điều hành android. 16
    Hình 3: Cấu trúc contact trong android. 16
    Hình 4 . RESTful Webservice. 18
    Hình 5: Kiến trúc Opencv. 20
    Hình 6: Biểu đồ usecase tổng quan. 24
    Hình 7 : Biểu đồ usecase cho chức năng "Nhận dạng thông tin trên danh thiếp". 26
    Hình 8: Sơ đồ hoạt động của usecase “Nhận dạng thông tin danh thiếp”. 28
    Hình 9 : Biểu đồ usecase cho chức năng “Quản lý contact”. 28
    Hình 10: Biểu đồ hoạt động usecase “Quản lý contact”. 30
    Hình 11 : Biểu đồ usecase cho chức năng “Thiết lập ứng dụng”. 31
    Hình 12 .Biểu đồ lớp phía server. 32
    Hình 13: Biểu đồ lớp của ứng dụng. 34
    Hình 14 .Biểu đồ tuần tự “Xử lý yêu cầu nhận dạng trên server”. 37
    Hình 15: Biểu đồ tuần tự “Nhận dạng thông tin trên ảnh”. 38
    Hình 16: Biểu đồ tuần tự “Quản lý contact”. 39
    Hình 17: Biểu đồ tuần tự “Chỉnh sửa thông tin contact”. 40
    Hình 18: Biểu đồ tuần tự “Thiết lập ứng dụng”. 41
    Hình 19: Biểu đồ tiến trình “Xử lý chất lượng ảnh cho OCR”. 42
    Hình 20: Biểu đồ tiến trình “Tách thông tin nhận dạng”. 43
    Hình 21.Lưu đồ thuật toán tách địa chỉ. 44
    Hình 22.Lưu đồ thuật toán tách tên người Việt Nam. 45
    Hình 23 .Lưu đồ thuật toán tách số điện thoại. 46
    Hình 24: Biểu đồ thành phần các họ của người Việt Nam. 47
    Hình 25: Các đầu số điện thoại cố định ở Việt Nam. 48
    Hình 26: Biểu đồ di động ở Việt Nam. 48
    Hình 27:Màn hình chính của ứng dụng. 49
    Hình 28:Màn hình chụp ảnh của ứng dụng. 50
    Hình 29: Màn hình quản lý contact của ứng dụng. 50
    Hình 30 : Màn hình chỉnh sửa contact. 51
    Hình 31: Sơ đồ chuyển giao diện màn hình của ứng dụng. 51
    Hình 32 : Kiến trúc 3 lớp của ứng dụng. 52
    Hình 33 .Giao diện màn hình chính. 54
    Hình 34 Giao diện màn hình chụp ảnh. 55
    Hình 35: Giao diện màn hình chỉnh sửa contact. 55
    Hình 36: Giao diện màn hình quản lý contact. 56
    Hình 37: Giao diện màn hình thông tin chi tiết contact. 56
    Hình 38 .Kiến trúc triển khai ứng dụng mức vật lý. 57
    Hình 39: Kết quả nhận dạng danh thiếp 1. 60
    Hình 40: Kêt quả nhận dạng danh thiếp 2. 61
    Hình 41: Kết quả nhận dạng danh thiếp 3. 62
    DANH MỤC CÁC BẢNGBảng 1. Kịch bản chính usecase "Nhận dạng thông tin trên danh thiếp ". 27
    Bảng 2: Kịch bản chính usecase "Quản lý contact". 29
    Bảng 3: Kịch bản chính usecase "Thiết lập ứng dụng". 31
    Bảng 4: Các lớp chính trên client Android. 35
    Bảng 5: Các màn hình chính của ứng dụng. 49
    Bảng 6. Trường hợp kiểm thử "Nhận dạng danh thiếp". 58
    Bảng 7. Thống kê kết quả nhận dạng danh thiếp. 59
    Bảng 8 . Trường hợp kiểm thử "Quản lý danh bạ". 63
    TÓM TẮT ĐỒ ÁNDanh thiếp là một tấm thẻ nhỏ có chứa thông tin liên lạc của một cá nhân hay của một tổ chức. Danh thiếp được sử dụng để giới thiệu thông tin liên lạc của cá nhân, của tổ chức trong những buổi gặp mặt đầu tiên. Ngày nay, danh thiếp được mọi người sử dụng rộng rãi, từ những tổ chức, công ty, cửa hàng buôn bán cho tới những cá nhân muốn giới thiệu thông tin liên lạc một cách đầy đủ nhanh chóng.
    Thế nhưng, việc quản lý và sử dụng danh thiếp gặp nhiều khó khăn khi mà một người nhận được nhiều danh thiếp. Khi họ muốn tìm thông tin liên lạc trên số danh thiếp này là rất mất thời gian. Việc tìm kiếm sẽ đơn giản hơn nếu các thông tin trên danh thiếp được lưu vào điện thoại. Người dùng có thể dành thời gian để ngồi nhập thông tin trên danh thiếp vào điện thoại, nhưng việc ngồi nhập danh thiếp là một công việc tốn công sức và thời gian. Ngày nay, với sự phát triển của công nghệ xử lý ảnh, và sự phát triển mạnh các thiết bị smartphone, việc lấy thông tin trên danh thiếp có thể được lấy tự động thông qua ảnh chụp danh thiếp.
    Trong khuôn khổ của đồ án tốt nghiệp với đề tài “Ứng dụng nhận dạng danh thiếp Tiếng Việt và cập nhật thông tin danh bạ trên Android” em mong muốn xây dựng một ứng dụng cho người dùng di động Android, ứng dụng nhận dạng danh thiếp từ ảnh, hỗ trợ nhận dạng Tiếng Việt. Ngoài việc nhận dạng, ứng dụng cho phép người dùng quản lý danh bạ trên điện thoại.
    Qua tìm hiểu, em nhận thấy nhận dạng thông tin chữ viết từ ảnh có thể sử dụng công nghệ nhận dạng văn bản OCR, cụ thể là thư viện Tesseract. Quá trình trích rút thông tin liên lạc thông tin dựa trên đặc điểm tên người, địa điểm của Việt Nam. Hai quá trình này đòi hỏi tốn nhiều thời gian xử lý, và trên các máy cấu hình thấp sẽ mất nhiều thời gian. Vì thế, để tăng độ chính xác nhận dạng và hoạt động trên nhiều thiết bị khác nhau, em xây dựng server cho quá trình nhận dạng và trích rút thông tin.
    Cụ thể đề tài nghiên cứu thực hiện những công việc sau:
    - Tìm hiểu công nghệ xử lý ảnh, thư viện OpenCV.
    - Tìm hiểu công nghệ nhận dạng OCR.
    - Tìm hiểu cơ chế trích rút thông tin.
    - Tìm hiểu lý thuyết về Android, cách xây dựng ứng dụng.
    - Thiết kế và xây dựng thử nghiệm ứng dụng VietCardReader dựa trên việc tích hợp các thành phần nói trên.
    Cấu trúc báo cáo đồ án gồm 2 phần:
    Chương 1: Đặt vấn đề và định hướng giải pháp. Chương này nêu ra bài toán cần giải quyết và các giải pháp để giải quyết bài toán. Tiếp đến sẽ trình bày sơ lược về các công nghệ, thuật toán sẽ được áp dụng để giải quyết yêu cầu đặt ra.
    Chương 2: Các kết quả đạt được. Chương này tập trung vào phân tích, thiết kế hệ , tiến hành kiểm thử ứng dụng.
     

    Các file đính kèm:

Đang tải...