Luận Văn Luận văn nhận dạng chữ viết tay.

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    Tóm tắt các bước nhận dạng chữ viết tay:
    1.1 Thu thập ảnh:
    Điều đầu tiên, việc thu thập ảnh của các loại chữ viết tay được thực hiện. Ảnh được thu thập từ nhiều người khác nhau với cùng ký tự nhưng khác nhau về kích cỡ, hình dạng và thời gian khác nhau cũng ảnh hưởng đến chữ viết khác nhau của cùng một người viết.
    1.2 Tiền xử lý ảnh:
    Ảnh ban đầu được biến đổi sang ảnh xám (grayscales) dựa vào kỹ thuật ngưỡng (threshold), sau đó chuyển đổi sang ảnh nhị phân. Tiếp theo ta thực hiện một số kỹ thuật xử lý ảnh để cải thiện ảnh nhị phân như:
    - Dò biên từng ký tự của ma trận ảnh (phân vùng ảnh)
    - Kéo dãn ảnh
    - Tô ảnh
    - Đánh nhãn cho ảnh ma trận ký tự.
    - Đo các đặc tính của vùng ảnh.
    - Cắt ảnh.
    Chương 1: Giới thiệu
    - Xác định vị trí các ký tự trong một ma trận ảnh để phân loại chính xác từng ký tự.
    1.3 Chuẩn hóa ảnh và trích chọn đặc trưng:
    Kích thước các ảnh riêng biệt này không cố định, với từng loại lớn nhỏ khác nhau và nhiều loại nhiễu bên trong từng ảnh làm ảnh hưởng rất nhiều đến quá trình cắt xén từng ảnh riêng biệt. Điều này tạo ra ảnh ngỏ vào không theo kích thước và tiêu chuẩn quy định, do đó sẽ hạn chế dữ liệu đưa vào mạng huấn luyện. Để giải quyết vấn đề này, các ảnh riêng biệt sẽ được resize đến kích thước (50x70), sau đó lấy giá trị trung bình của mỗi khối kích thước 10x10. Ảnh sau đó được chuyển xuống thành ma trận 5x7 với những giá trị trong khoảng từ 0 đến 1 và trở thành 35 ngõ vào để đưa vào mạng nơron cho việc huấn luyện. Tuy nhiên, trước khi resize các ảnh riêng biệt này, một quá trình xử lý khác cần phải thực hiện để loại bỏ không gian trống của ảnh.
    Cuối cùng, các ma trận kích thước 5x7 được nối vào nhau thành một chuỗi đưa đến ngõ vào cho việc nhận dạng.
    1.4 Nhận dạng:
    Phương pháp dùng mạng nơron để nhận dạng chữ viết tay:
    1.4.1 Xác định các biến vào/ra: ngõ vào là 35 nơron tương ứng với ma trận 5x7, ngõ ra là 36 nơron tương ứng với 24 ký tự chữ từ a đến z và 10 ký tự số từ 0 đến 9.
    1.4.2 Chọn mô hình mạng nơron: Mạng perceptron đa lớp, gồm một lớp ngõ vào, một lớp ẩn và một lớp ngõ ra.
    1.4.3 Thuật toán huấn luyện: Mạng nơron được huấn luyện theo thuật toán lan truyền ngược động lượng suy giảm adient và tỷ lệ học thích nghi (gradient descent momentum and adaptive learning rate backpropagation). Tuy nhiên trong quá trình huấn luyện ta có thể thay thế bằng một số thuật toán huấn luyện khác như thuật toán huấn luyện nhanh (trainlm: Levenberg-Marquardt backpropagation), giải thuật gradient suy giảm với hệ số momentum (hàm learngdm)
    1.4.4 Thử nghiệm mạng.
    1.4.5 Tinh chỉnh để cho kết quả tối ưu.
     

    Các file đính kèm:

Đang tải...