Luận Văn Các kỹ thuật trích chọn ảnh từ video trong nhận dạng chữ nôm

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỤC LỤC
    CHƯƠNG 1. GIỚI THIỆU . . 1
    CHƯƠNG 2.TỔNG QUAN . . 5
    2.1 Một số khái niệm trong xử lý video . 5
    2.1 Hướng giải quyết bài toán . 7
    2.2 Panorama . 10
    CHƯƠNG 3. ĐĂNG KÍ ẢNH . 12
    3.1 Bài toán trích chọn đặc trưng . 12
    3.1 Thuật toán tìm kiếm góc Harris . 15
    3.2 Đối sánh điểm điểm góc Harris . 18
    3.3.1 Tìm tập ứng cử viên . 18
    3.3.2 Tìm các cặp đối sánh tương ứng . 20
    CHƯƠNG 4. TÍNH MA TRẬN HOMOGRAPHY BẰNG RANSAC . 22
    4.2 Homography . 23
    4.3 RANSAC . 26
    4.4 Tính ma trận Homography bằng RANSAC . 30
    4.5 Hòa trộn ảnh . 31
    CHƯƠNG 5. THỰC NGHIỆM . 33
    KẾT LUẬN . 39
    TÀI LIỆU THAM KHẢO . 41
    PHỤ LỤC . 43


    Các kỹ thuật trích chọn ảnh từ video trong nhận dạng chữ nôm
    CHƯƠNG 1
    GIỚI THIỆU
    Chữ Nôm là một loại hình văn tự do người Việt sáng tạo ra, lấy chất liệu là chữ Hán
    làm cơ sở để tạo thành chữ Nôm. Chữ Nôm được bắt đầu hình thành từ những năm đầu
    khi người Trung Hoa chinh phục đất Giao Chỉ, và được phát triển cùng thời gian. Nhưng
    đến đầu thế kỉ XX khi chữ quốc ngữ được phổ biến thì chữ nôm dần dần mai một. Ngày
    nay, số lượng người biết và có thể đọc được các tài liệu lịch sử, văn học bằng chữ Nôm
    còn rất ít.
    Bên cạnh đó, với sự phát triển nhanh chóng của công nghệ thông tin trong các lĩnh
    vực: công nghệ phần cứng, công nghệ phần mềm, công nghệ nhúng, việc ứng dụng công
    nghệ thông tin vào việc bảo tồn di sản văn hóa chữ Nôm và Hán - Nôm là lĩnh vực
    nghiên cứu quan trọng. Lĩnh vực nghiên cứu này bao gồm các vấn đề chính như: đưa chữ
    Nôm vào máy tính, từ điển chữ Nôm, nhận dạng, đoán nhận và khôi phục chữ Nôm lỗi,
    thiếu là lĩnh vực nghiên cứu có ý nghĩa thực tiễn quan trọng. Lĩnh vực nghiên cứu về chữ
    Nôm rất rộng đòi hỏi nhiều thời gian, công sức và cần được tiến hành theo từng giai đoạn
    mỗi giai đoạn cần hoàn thành một nội dung cụ thể. Giai đoạn đầu gồm các công việc
    như: xây dựng các bộ phông Nôm, lưu trữ các văn bản chữ Nôm, các mẫu ảnh Nôm được
    chuyển từ các văn bản trên gỗ, giấy, và xây dựng bộ mã Unicode cho chữ Nôm. Giai
    đoạn hai là xây dựng các bộ tự điển, từ điển cho chữ Nôm có thể ánh xạ ngữ nghĩa Nôm-
    Việt la tinh, Nôm-Anh. Giai đoạn ba là xây dựng ứng dụng nhận dạng chữ Nôm kết hợp
    với các từ điển đa ngôn ngữ trong giai đoạn hai; ban đầu xây dựng ứng dụng nhận dạng
    trên Desktop sau đó có thể tối ưu và đưa lên các thiết bị cầm tay. Việc này có ý nghĩa
    quan trọng khi khách du lịch thể tham quan các đình, chùa có thể chụp hình và nhận dạng
    chữ Nôm từ điện thoại. Giai đoạn bốn là đoán nhận, khôi phục các chữ Nôm thiếu nét,
    mờ do thời gian dựa trên việc học máy từ kho dữ liệu đã tích luỹ trong các giai đoạn
    trước.
    Hiện nay việc nghiên cứu chữ Nôm trong, ngoài nước đã thu được các kết quả chính
    sau:
    Mã hoá: Trong 12 năm từ 1992-2004 chúng ta đã kiên trì theo đuổi các kỳ họp
    quốc tế để yêu cầu đưa chữ Nôm vào bộ ký tự thế giới Unicode và ISO 10646. Chúng ta
    đã đưa vào 5067 chữ trùng hình với chữ Trung Quốc, 4232 chữ thuần Nôm và hiện đang
    đề nghị đưa vào thêm 2200 chữ nữa [3] [4].
    Phông Nôm: Thực tế trong sử dụng hiện nay trên các máy tính, mới chỉ có bộ
    phông Arial Unicode MS chứa khoảng hơn 5,000 chữ Nôm trùng hình chữ Hán [12].
    1




    Viện Mojikyo tại Nhật Bản đã làm ra phông chữ truetype cho 9299 chữ Nôm mà Việt
    Nam đã đề nghị với quốc tế [8]. Công ty DynaLab Đài Loan có trụ sở tại Thượng Hải và
    Hồng Kông đã xây dựng bộ phông DFSongLight_Vietnam2.ttf cũng cho 9299 chữ Nôm
    này[10]. Nhóm Nôm Na đã phát triển bộ phông True Type NomNaTongLight.ttf (trên
    15,000 chữ) [5] [13].
    Phần mềm: Đã phát triển phần mềm từ điển và bộ gõ như: phần mềm Từ điển Hán-
    Nôm trên PDA của Trung tâm công nghệ thông tin Thừa Thiên Huế [1], phần mềm đánh
    văn bản chữ Hán-Nôm của tác gia Trần Uyên Thi và Alexandre Lê, phần mềm từ điển
    Trực tuyến Việt-Hán-Nôm biên soạn dựa trên cuốn Tự điển Hán-Nôm của Thiều Chửu do
    nhóm tác giả Phan Anh Dũng và Nguyễn Thế thực hiện [2].
    Như vậy tình hình nghiên cứu, ứng dụng công nghệ thông tin cho chữ Nôm bước
    đầu đã đạt được những kết quả tiền đề đáng khích lệ. Chúng ta đã tạo được một số phông
    Nôm, đưa được một phần trong bộ ký tự chữ Nôm vào bảng mã Unicode, xây dựng được
    một số từ điển và bộ gõ chữ Nôm. Tuy nhiên việc nghiên cứu bài toán nhận dạng chữ
    Nôm và Hán-Nôm cũng như việc khôi phục chữ thiếu, lỗi ở nước ta còn khá mới.
    Bài toán nhận dạng với các giải thuật khác nhau có thể thay đổi trong chi tiết cài đặt
    nhưng hầu hết đều gồm các bước: học máy, tiền xử lý, chuẩn hoá đầu vào, nhận dạng, tra
     

    Các file đính kèm:

Đang tải...