Luận Văn tìm hiểu các thuật toán phát hiện góc nghiêng văn bản

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỤC LỤC
    Trang phụ bìa
    Nhiệm vụ luận văn
    Mục lục
    Tóm tắt luận văn .
    Danh mục các ký hiệu .
    Danh mục các bảng .
    Danh mục các hình vẽ .
    MỞ ĐẦU 1
    Chương 1
    ĐẶT VẤN ĐỀ
    1.1. Bài toán xử lý văn bản và các ứng dụng trong thực tế. 7
    1.2. Vai trò của tiền xử lý trong nhận dạng văn bản. 8
    1.3. Bài toán phát hiện góc nghiêng văn bản. 13
    Chương 2
    CÁC THUẬT TOÁN PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN
    2.1. Phát hiện góc nghiêng dựa vào phương pháp Base-point. 15
    2.1.1. Lựa chọn của một phân vùng và đối tượng. 15
    2.1.2. Tập các điểm cơ sở. 17
    2.1.3. Độ phức tạp. 19
    2.2. Phát hiện góc nghiêng dựa vào biến đổi Fourier 23
    2.2.1. Phép biến đổi Fourier và các đặc trưng hình học. 23
    2.2.2. Biến đổi Fourier trong định dạng văn bản. 25
    2.3. Phát hiện góc nghiêng dựa vào phương pháp Scanline. 26
    2.3.1. Thuật toán Scanline. 27
    2.3.2. Biến đổi Hough. 32
    2.3.3. Độ phức tạp. 36
    Chương 3
    THUẬT TOÁN BIẾN ĐỔI HOUGH VÀ KHẢ NĂNG KHAI THÁC TRONG MÔI TRƯỜNG MATLAB
    3.1. Thuật toán biến đổi Hough và một số đặc điểm tính toán. 37
    3.2. Hàm biến đổi Hough trong Matlab. 39
    3.2.1. Một số hàm biến đổi ảnh. 39
    3.2.1. Hàm biến đổi Hough. 41
    3.3. Bài toán phát hiện đường thẳng và mối quan hệ với góc nghiêng trong văn bản 42
    Chương 4
    ÁP DỤNG THUẬT TOÁN HOUGH TRONG PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN
    4.1. Ứng dụng biến đổi Hough phát hiện góc nghiêng văn bản. 46
    4.2. Chuẩn hóa dữ liệu vào, ra. 47
    4.3. Cài đặt ứng dụng. 48
    4.4. Kết quả, đánh giá, nhận xét 49
    KẾT LUẬN VÀ KIẾN NGHỊ
    1. Kết luận .50
    2. Kiến nghị .51
    TÀI LIỆU THAM KHẢO 52




    MỞ ĐẦUNgày nay, do sự thịnh hành của máy tính cá nhân, phương tiện đã làm cho kỹ thuật chế bản điện tử trở nên vô cùng phổ biến, số lượng những tài liệu lưu trữ trên giấy đã tăng đến một số lượng đáng kể. Hàng tỷ tỷ những trang giấy được tạo ra mỗi năm dưới nhiều hình thức khác nhau như sách, tạp chí, bản tin, báo, thư từ, biểu mẫu, bảng ghi nhớ, trên khắp thế giới. Mặc khác, việc lưu trữ, phân phối, phục hồi những thông tin trên giấy là một công việc đòi hỏi nhiều công sức, thậm chí không thể thực hiện được một cách thủ công.
    Trong khi quét văn bản, bị nghiêng là không tránh khỏi đối với các văn bản in, viết tay, văn bản hình ảnh Phát hiện độ nghiêng là một trong những vấn đề đầu tiên được áp dụng để quét các văn bản khi chuyển đổi dữ liệu sang dạng số. Một hệ thống xử lý ảnh văn bản thường phải giải quyết bài toán phát hiện góc nghiêng như một bước đầu tiên và tất yếu của công đoạn tiền xử lý. Chính vì vậy, cùng với sự phát triển của xử lý ảnh nói chung và xử lý, nhận dạng văn bản nói riêng, bài toán phát hiện góc nghiêng văn bản cũng được quan tâm ngày càng nhiều và dưới nhiều góc độ khác nhau. Có rất nhiều hướng tiếp cận bài toán như: thuật toán dựa vào phân tích hình chiếu, phân tích láng giềng, biến đổi Hough, phương pháp dùng các phép toán hình thái, biến đổi Fourier Sử dụng biến đổi Hough phát hiện góc nghiêng văn bản là một kỹ thuật phân biệt tốt các ký tự chữ cái và những đối tượng không phải chữ cái như nhiễu, đối tượng đồ hoạ, đường thẳng do đó độ chính xác của kỹ thuật này cũng được cải thiện hơn. Xuất phát từ những yêu cầu trên, chúng em chọn đề tài nghiên cứu: “tìm hiểu các thuật toán phát hiện góc nghiêng văn bản”.

    Các thuật toán phát hiện độ nghiêng được thực hiện. Bước đầu tiên là quét dòng cơ bản phát hiện độ nghiêng. Trong phương thức này, hình ảnh ước lượng ở nhiều góc cạnh và phương sai về số lượng các điểm ảnh màu đen ước lượng mỗi dòng được xác định. Các góc mà tại đó phương sai lớn nhất tìm thấy là góc nghiêng.
    Bước thứ 2 là dựa trên biến đổi Hough. Biến đổi Hough là thực hiện trên ảnh văn bản đã quét và phương sai trong các giá trị là tính toán cho mỗi giá trị của . Góc mà cho giá trị phương sai lớn nhất là góc nghiêng.
    Bước thứ 3 là dựa trên phương thức base-point. Sau khi Base-point liên tiếp trong từng dòng văn bản trong khoảng thời gian thích hợp như một vùng đã được chọn làm mẫu cho khớp đường thẳng .Tỷ lệ trung bình của đường cơ bản được tính toán, tương ứng với mức độ nghiêng của toàn bộ văn bản hình ảnh.
     

    Các file đính kèm:

Đang tải...