Thạc Sĩ Tìm hiểu phương pháp phân tích bằng bên trong tài liệu ảnh

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    Đề tài: TÌM HIỂU PHƯƠNG PHÁP PHÂN TÍCH BẰNG BÊN TRONG TÀI LIỆU ẢNH


    Luận văn dài 74 trang
    CHƯƠNG I: MỞ ĐẦU ---------------------------------------------------------------- 1
    1.1. Cơ sở nghiên cứu và mục đích của luận văn ---------------------------- 3
    1.2. Tổ chức của luận văn: -------------------------------------------------------- 4
    CHƯƠNG II: TỔNG QUAN VỀ HỆ PHÂN TÍCH TÀI LIỆU ẢNH --------- 5
    2.1. Tài liệu ảnh --------------------------------------------------------------------- 5
    2.2. Hệ phân tích trang tài liệu -------------------------------------------------- 5
    2.3. Thu thập dữ liệu ảnh --------------------------------------------------------- 6
    2.4. Tiền xử lý điểm ảnh ----------------------------------------------------------- 9
    2.4.1. Xử lý nhị phân ---------------------------------------------------------- 10
    2.4.2. Giảm nhiễu--------------------------------------------------------------- 11
    2.4.3. Phân đoạn ảnh ----------------------------------------------------------- 12
    2.4.4. Làm mảnh và xác định vùng ----------------------------------------- 12
    2.4.5. Mã hóa CC và véctơ hóa ---------------------------------------------- 13
    2.5. Phân tich đăc trưng cua tai liêu anh ------------------------------------- 15
    2.6. Phân tich đôi tương văn ban trong tai liêu ----------------------------- 15
    2.6.1. Xác định góc nghiêng của văn bản ---------------------------------- 16
    2.6.2. Phân tich bô cuc cua trang ta i liêu anh ------------------------------ 18
    2.7. Nhận dạng ký tự quang học (OCR) --------------------------------------- 19
    2.7.1. Thuât toan OCR ----------------------------------------------------- 20
    2.7.1.1. Trích chọn đặc trưng --------------------------------------- 20
    2.7.1.2. Phân loại ------------------------------------------------------ 21
    2.7.2. Nhận dạng ký tự dựa trên ngữ cảnh ------------------------------ 21
    2.8. Phân tích các đối tượng ảnh trong tài liệu ------------------------------ 22
    CHƯƠNG 3: THUẬT TOÁN TÁCH VĂN BẢN - ẢNH TỪ TRANG TÀI
    LIỆU ẢNH ------------------------------------------------------------------------------ 24
    3.1. Tông quan vê phân tach văn ban – ảnh --------------------------------- 24
    3.2. Những đặc trưng chung của một tệp tài liệu ảnh --------------------- 27
    3.3. Thuật toán phân tách văn bản - ảnh -------------------------------------- 30
    3.3.1. Xoá bỏ các đối tưng tuyến tính --------------------------------- 31
    3.3.2. Phân tích các thành phần liên thông của nét bút --------------- 32
    3.3.3. Kết hợp các nét ký tự tạo thành các chuỗi văn bản ------------ 34
    3.3.4. Thực hiện các phép toán hình thái ------------------------------- 35
    3.3.5. Phân tích các thành phần liên thông mới ----------------------- 35
    3.3.6. Biểu diễn cấu trúc thông tin của các chuỗi văn bản ----------- 36
    CHƯƠNG IV: PHƯƠNG PHÁP PHÂN TÍCH BẢNG T-RECS TRONG
    TRANG TAI LIÊU ANH ------------------------------------------------------------ 39
    4.1. Giới thiệu -------------------------------------------------------------------- 39
    4.2. Thuật toán phân đoạn khởi tạo ---------------------------------------- 41
    4.2.1. Trường hợp thuật toán nhận dạng sai cột ----------------------- 42
    4.2.2. Cải tiến các bước của thuật toán phân đoạn khởi tạo T - Recs++ 44
    4.2.3. Những ưu điểm của thuật toán ----------------------------------- 46
    4.2.4. Những mặt hạn chế của thuật toán khởi tạo -------------------- 47
    4.3. Các bước xử lý khối sau khi phân đoạn ------------------------------ 48
    4.3.1. Trộn các khối phân đoạn sai -------------------------------------- 48
    4.3.2. Phân tách các cột bị trộn vào một khối -------------------------- 49
    4.3.3. Nhóm các từ bị phân tách ----------------------------------------- 52
    4.4. Phân tích khối -------------------------------------------------------------- 53
    4.5. Xác định cấu trúc các cột, hàng ---------------------------------------- 54
    CHƯƠNG 5 CHƯƠNG TRINH THƯ NGHIỆM VA MINH HOA THUÂT
    TOÁN T-RECS++ --------------------------------------------------------------------- 56
    5.1. Mô tả chương trình ------------------------------------------------------- 56
    5.2. Môt sô kêt qua ------------------------------------------------------------- 58
     
Đang tải...