Báo Cáo Nghiên cứu nhận dạng số và chữ số viết tay Tiếng Việt trên bảng điểm thi sử dụng mạng Noron nhân tạo

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Mai Kul, 26/11/13.

  1. Mai Kul

    Mai Kul New Member

    Bài viết:
    1,299
    Được thích:
    0
    Điểm thành tích:
    0
    Xu:
    0Xu
    Đề cương luận văn
    Đề tài: Nghiên cứu nhận dạng số và chữ số viết tay Tiếng Việt trên bảng điểm thi sử dụng mạng Noron nhân tạo
    Định dạng file word

    II. Nội dung:
    Luận văn hướng đến quá trình thu nhận đối chiếu giá trị ảnh của phiếu điểm thi,qua đó thực hiện việc thực hiện nhận dạng chữ viết tay tiếng Việt với những cải tiến mới hiệu quả hơn. Dự kiến luận văn sẽ bao gồm các chương sau:
    Chương 1: TỔNG QUAN
    Dự kiến sẽ trình bày một số nội dung sau:
    § Dẫn nhập, giới thiệu lý do chọn đề tài.
    § Mục đích và phương pháp nghiên cứu của đề tài.
    § Những đóng góp của đề tài.
    § Bố cục luận văn.
    Chương 2: CƠ SỞ LÝ THUYẾT
    Dự kiến sẽ trình bày một số nội dung sau:
    § Giới thiệu tổng quan về điểm ảnh.
    § Giới thiệu mạng Neuron nhân tạo.
    § Giới thiệu tình hình nghiên cứu trong và ngoài nước.
    § Trình bày chi tiết các thuật toán, giải thuật của quá trình nhận diện số và chữ số viết tay Tiếng Việt trên bảng điểm thi.
    Chương 3: THỰC NGHIỆM
    Dự kiến sẽ trình bày một số nội dung sau:
    § Giới thiệu về ứng dụng, phần mềm và phần cứng trong quá trình thực nghiệm.
    § Kết quả của các bước tiến hành thực nghiệm.
    § Xây dựng được ứng dụng nhận dạng số và chữ viết tay Tiếng Việt cho bảng điểm thi.
    § So sánh với kết quả của các nghiên cứu trước đó.
    § Kết luận rút ra từ kết quả thực nghiệm .

    Chương 4: KẾT LUẬN
    Dự kiến sẽ trình bày một số nội dung sau:
    § Kết quả đạt được của luận văn.
    § Đề xuất kiến nghị.
    III. Kết luận:
    Để tài đã giới thiệu tuần tự về nhận dạng số và chữ số viết tay Tiếng Việt.
    Xây dựng được ứng dụng thực hiện việc nhận dạng. Tiến hành thực nghiệm trên mẫu bảng điểm thi cụ thể.
    Đã trình bày các giải thuật tương ứng để thực hiện quá trình nhận dạng. Trong đó có nhiều cải tiến tốt hơn so với các công trình nghiên cứu trước đó.
    Đóng góp thêm một phương pháp mới trong khoa học nhận dạng.

    I. Mở đầu:
    1. Lý do chọn đề tài
    Công nghệ thông tin đang là một trong những ngành then chốt trong quá trình công nghiệp hóa hiện đại hóa đất nước. Việc triển khai nghiên cứu các công trình khoa học và đưa vào thực tế ứng dụng góp phần giải phóng sức lao động con người, tiết kiệm thời gian, nâng cao hiệu suất công việc là một việc làm hết sức có ý nghĩa trong giai đoạn này.
    Bài toán nhận dạng chữ viết tay xuất hiện cách đây khá lâu và vẫn luôn thu hút được nhiều sự quan tâm, nghiên cứu của các nhà khoa học. Đã xuất hiện nhiều ứng dụng thương mại thực hiện nhận dạng chữ tùy theo từng yêu cầu cụ thể, có thể kể ra một số sản phẩm tiêu biểu như: OmniPage, FineReader Ở Việt Nam, việc nghiên cứu xây dựng các hệ nhận dạng chữ tiếng Việt cũng được bắt đầu rất sớm. Hiện tại trong lĩnh vực nhận dạng chữ in đã có một số sản phẩm thương mại với chất lượng tốt như VnDOCR của Viện Công Nghệ Thông Tin, ImageScan của CadPro. Ngoài ra còn có một số đề tài nghiên cứu khoa học về nhận dạng số và chữ viết tay được thực hiện bởi nhiều nhóm tác giả, với nhiều mục đích ứng dụng khác nhau mà ta có thể kể tên một số nhóm tiêu biểu như nhóm nghiên cứu : Huỳnh Hữu Lộc, Lưu Quốc Hải, Nguyễn Thanh Bình và Đinh Đức Anh Vũ, Khoa Khoa Học và Kỹ Thuật Máy Tính, Đại học Bách Khoa Tp.HCM, nhóm nghiên cứu : Phạm Anh Phương, Ngô Quốc Tạo, Lương Chi Mai với đề tài : “Trích chọn đặc trưng wavelet Haar kết hợp với SVM cho việc nhận dạng chữ viết tay Tiếng Việt”, hoặc đề tài “Nhận dạng phiếu trả lời trắc nghiệm và có nhận dạng chữ số viết tay dựa trên mạng Noron “ của nhóm tác giả : Trầm Quốc Thuận, Châu Kiến tài, trường Đại học Mở TpHCM
    Ngày nay, nền giáo dục đào tạo ở nước ta ngày càng phát triển, lượng học sinh- sinh viên ở các trường ngày càng gia tăng, và danh sách thí sinh dự thi trong các kì thi cũng tăng lên theo đó. Do vậy, điểm sau mỗi đợt thi nếu được nhập bằng thủ công vào cơ sở dữ liệu thì sẽ không đảm bảo được tính chính xác, mất rất nhiều nhân công, thời gian. Hiện nay, có một số trường đã nghiên cứu, triển khai hệ thống nhận dạng điểm số một cách tự động trên bảng điểm thi và đạt được một số kết quả khả quan. Ví dụ như trường Đại học Mở TpHCM, Đại Học Kinh Tế, Cao Đẳng Bách Việt, Đại học Tôn Đức Thắng Với phương pháp thực hiện dựa trên việc nhận dạng các ô số được tô và các số viết tay.


    Hình 1 : Phiếu điểm mẫu nhận dạng bằng cách tô ô số và nhận dạng số viết tay
    Tuy nhiên với các ô số được tô thì cũng đòi hỏi nhiều thời gian cho việc tô từng ô số, tiến trình nhận dạng cũng bị ảnh hưởng về mặt thời gian do việc phải quét qua hết các ô số. Còn nếu chỉ nhận dạng số viết tay thôi chưa đủ, người viết có thể viết nhầm trong quá trình chấm điểm. Thêm nữa là hệ thống cũ chưa đáp ứng đầy đủ trường hợp điểm số là lẻ. Với những lý do đã nêu ra, ta thấy cần thiết nghiên cứu kết hợp việc nhận dạng số và chữ số viết tay mà không cần dùng phương pháp tô các ô số, áp dụng cho việc nhận dạng bảng điểm thi trong đó có thêm nhận dạng điểm số lẻ. Giải quyết vấn đề trên sẽ đem lại các lợi ích sau khi đưa vào ứng dụng thực tế:
    - Giảm lượng nhân công nhập điểm.
    - Độ chính xác cao.
    - Tiết kiệm thời gian, công sức.
    - Do có phần thống kê nên giúp người quản trị hệ thống dễ dàng giám sát tiến trình nhập điểm, giúp đưa ra cách giải quyết phù hợp khi có sai sót xảy ra.
    Từ hiện trạng và những đặc điểm nêu trên, chúng tôi xin được đề xuất hướng nghiên cứu luận văn là: Nghiên cứu nhận dạng số và chữ số viết tay Tiếng Việt trên bảng điểm thi sử dụng mạng Noron nhân tạo.

    2. Mục đích nghiên cứu (các kết quả cần đạt được).
    Tìm hiểu và nghiên cứu các cơ sở lý thuyết, cũng như các kỹ thuật nền tảng để giải quyết bài toán nhận dạng tổng quát.
    Đề xuất áp dụng mạng Nơron nhân tạo thực hiện các thuật toán xử lý ảnh và nhận dạng số và chữ số viết tay Tiếng Việt.
    Cải tiến và đề xuất ra các thuật toán mới trong quá trình nghiên cứu.
    Xây dựng được hệ thống nhận dạng số và chữ số viết tay Tiếng Việt trên bảng điểm thi dựa vào mạng Neuron nhân tạo. Hệ thống được thiết kế để hỗ trợ việc nhận dạng số và chữ số viết tay trên bảng điểm thi qua mạng cũng như quản lý dữ liệu sinh viên.
    3. Đối tượng và phạm vi nghiên cứu
    Luận văn tập trung nghiên cứu và ứng dụng mạng Noron nhân tạo để xây dựng một ứng dụng nhận dạng số và chữ viết tay theo đúng qui định bảng điểm thi mẫu. Các qui định về bảng điểm thi mẫu bao gồm: chữ viết tay phải rõ ràng, ảnh bảng điểm thi được scan phải ngay ngắn, đảm bảo độ sáng của ảnh Việc nhận dạng chữ viết tay ở đây tiến hành cụ thể tương ứng với các số từ 0 đến 10 được viết tay, trong đó có nhận dạng các số lẽ như :1.5, 2.5, 3.5 và các chữ số tương ứng như : một, một năm, hai, hai năm .
    4. Phương pháp nghiên cứu
    Để đạt được mục tiêu đề ra, chúng tôi quan tâm đến việc nghiên cứu lý thuyết điểm ảnh, các thuật toán rút trích, xử lý điểm ảnh, mạng Neuron và các phương pháp nhận dạng chữ viết hiện nay. Đồng thời đề xuất một số giải pháp cải tiến phương pháp đang sử dụng.
     

    Các file đính kèm:

Đang tải...