Luận Văn Ứng dụng mô hình dịch máy thống kê cho bài toán bỏ dấu cho văn bản Tiếng Việt

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    170
    Điểm thành tích:
    0
    Xu:
    0Xu
    DANH MỤC HINH VẼ
    CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN THÊM DẤU CHO VĂN BẢN TIẾNG VIỆT
    1.1.1 Phát biểu bài toán
    1.1.2 Đặc điểm
    1.2 Giới thiệu công trình đã có .
    1.2.1 AMPad
    1.2.2 VietPad
    1.2.3 viAccent
    1.2.4 VietMarker
    1.2.5 Hướng tiếp cận đề tài
    CHƯƠNG 2: GIỚI THIỆU MÔ HÌNH DỊCH MÁY THỐNG KÊ
    2.1 Giới thiệu .
    2.2 Nguyên lý và các thành phần: .
    2.2.1Mô hình ngôn ngữ
    2.3 Mô hình dịch: .
    2.3.1 Sự gióng hàng (alignment):
    2.4 Giải mã (Decode) .
    2.4.1 Translation Options
    2.4.2 Thuật toán cơ bản (Core Algorithm)
    2.4.3 Kết hợp lại các giả thuyết (Recombining Hypotheses)
    2.4.4 Tìm kiếm chùm
    2.4.5 Sinh danh sách N- giá trị tốt nhất
    CHƯƠNG 3: THỰC NGHIỆM
    3.1 Cấu hình và hệ điều hành.
    3.2 Các công cụ sử dụng.
    3.2.1 Bộ công cụ xây dựng mô hình ngôn ngữ - SRILM:
    3.2.2 Bộ công cụ xây dựng mô hình dịch máy thống kê - MOSES:
    3.2.3 Các bước huấn luyện dich và kiểm tra.
    3.2.4 Chuẩn hóa dữ liệu.
    3.2.5 Xây dựng mô hình ngôn ngữ.
    3.2.6 Huấn luyện mô hình:
    3.2.7 Kết quả dịch
    3.2.8 Đánh giá kết quả dịch
    KẾT LUẬN
    TÀI LIỆU THAM KHẢO
     

    Các file đính kèm:

Đang tải...