Luận Văn Nghiên cứu các phương pháp tách văn bản nhúng trong ảnh

Thảo luận trong 'Báo Chí' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    Nghiên cứu các phương pháp tách văn bản nhúng trong ảnh






    Ảnh là phương tiện truyền tải thông tin có ý nghĩa vô cùng lớn trong cuộc sống. Ảnh truyền tải trong môi trường World Wide Web hiện nay được sử dụng khá nhiều, tồn tại ở nhiều dạng khác nhau và vô cùng phong phú. Một yêu cầu đặt ra là tìm kiếm, phân loại, cũng như xác định nội dung ảnh muốn truyền tải điều gì đang là vấn đề cấp thiết hiện nay. Ta có thể kể ra một số ứng dụng như thế như tìm kiếm ảnh theo nội dung trong môi trường World Wide Web hay lọc spam ảnh vv. Ảnh thường được nhúng kèm theo text trong nó và những text này thường quyết định đến nội dung ảnh muốn truyền tải. Tất cả các ứng dụng kể trên như lọc spam ảnh hay tìm kiếm ảnh trên web vv đều sử dụng đến đặc tính text kèm theo ảnh để giải quyết. Và như thế bài toán tách chữ nhúng trong ảnh được quan tâm. Đã có rất nhiều phương pháp được đưa ra, tuy nhiên do dữ liệu ảnh là quá phong phú và text nhúng kèm theo nó cũng rất phức tạp như kích cỡ, màu, chiều của chữ Nên mỗi phương pháp đều có sự hạn chế riêng và đây vẫn là một bài toán mở đang được nhiều người quan tâm.
    Xuất phát từ thực tế đó, mục tiêu của đồ án này là nghiên cứu phương pháp xác định vùng chứa chữ nhúng trong ảnh có độ chính xác cao đồng thời là tiền đề cho việc lọc spam ảnh.
    Với mục tiêu đó, đồ án được thực hiện dựa trên phương pháp nghiên cứu: trước hết là ảnh đầu vào được thực hiện giảm màu (color reduction) bao gồm cả giảm bit (drop bit) gộp màu và phân tích ảnh có nhiều giá trị, sau đó được phân tích thành nhiều ảnh tiền cảnh (foreground image). Những ảnh tiền cảnh được tập hợp để nhận dạng vị trí của text trong ảnh đầu vào . Xác định vùng chứa chữ được thể hiện giống các toạ độ hộp ranh giới của nó.
    Nội dung của đồ án được chia thành 4 phần, ở đó, chương 1 và chương 2 sẽ trình bày các kiến thức cơ bản cho cách tiếp cận ở chương 3 và chương 4.
    Bố cục chi tiết của đồ án như sau :
    Chương 1 : “Tổng quan về xử lý ảnh” : Chương này trình bày tổng quan về một hệ thống xử lý ảnh,và các vấn đề liên quan.
    Chương 2 : “Các phương pháp xác định vùng chứa chữ trong ảnh” : Chương này sẽ trình bày về các phương pháp xác định vùng chứa chữ trong ảnh hiện có, đưa ra phương pháp phân loại mới và phân tích tính chính xác và hiệu năng của mỗi phương pháp.
    Chương 3 : “Xác định vùng chứa chữ trong ảnh thông thường và ảnh video” : Đây là chương quan trọng nhất của đồ án vì nó sẽ nêu lên một phương pháp Xác định vùng chứa chữ trong ảnh dựa trên các đặc trưng về thành phần của ảnh.
    Chương 4 : “Thử nghiệm và kết quả” : Chương 4 sẽ trình bày chi tiết quá trình thực hiện, đưa ra các con số thống kê về độ chính xác của phương pháp.
     

    Các file đính kèm:

Đang tải...