Thạc Sĩ đề tài luận văn thạc sỹ: canh lề văn bản song ngữ và ứng dụng giải quyết những trường hợp đăch thù c

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    MỤC LỤC
    Phần 1 1
    Giới thiệu. 1
    1.1 Bối cảnh thực hiện luận văn. 1
    1.2 Thực trạng – Vấn đề. 1
    1.3 Hướng giải quyết vấn đề. 2
    1.4 Mục tiêu của luận văn. 2
    1.5 Đóng góp của luận văn. 2
    1.6 Hướng phát triển. 5
    1.7 Cấu trúc của luận văn. 5
    Phần 2. 7
    Các công trình nghiên cứu liên quan. 7
    2.1 Phương pháp canh lề văn bản dựa vào chiều dài câu. 7
    2.1.1 Phương pháp của William A.Gale và Kenneth W.Church [16]: 8
    2.1.2 Phương pháp của Peter F.Brown [17]: 9
    2.2 Phương pháp canh lề dựa vào từ vựng. 10
    2.2.1 Phương pháp của Michel Simard, George F. Foster, P. Isabelle [15]: 10
    2.2.2 Phương pháp của Martin Kay và Martin Roscheisen [11]: 11
    2.2.3 Phương pháp của nhóm tác giả Akshar Bharati, Sriram V, Vamshi Krishna A, Rajev Sangal, Sushma Bendre [9]: 12
    2.2.4 Phương pháp của Seonho Kim, Juntae Yoon, Dong-Yul Ra [6]: 13
    2.2.5 Phương pháp của Antonio Ribeiro, Gabriel Lopes, Joao Mexia:[8] 14
    2.2.6 Phương pháp của Tiago Ildefonso and Gabtiel Pereira Lopes[1]: 16
    2.3 Kết hợp các phương pháp. 16
    2.3.1 Phương pháp của nhóm tác giả Thomas C.Chuang, Jian-Cheng Wu, Tracy Lin, Wen_Chie Shei, and Jason S.Chang:[2] 16
    2.3.2 Phương pháp của Stanley F.Chen:[14] 17
    2.3.3 Phương pháp SIMR và GSA, tác giả I. Dan Melamed: [10] 18
    2.4 Nghiên cứu của các tác giả trong nước. 20
    2.4.1 Nghiên cứu của tác giả Lê Hoài Nhân (2004): 20
    2.4.2 Nghiên cứu của tác giả Trần Giang Sơn (2005) [3]: 21
    Phần 3. 22
    Cơ sở lý thuyết 22
    3.1 Các định nghĩa. 22
    3.1.1 Phép canh lề: 22
    3.1.2 Phép canh lề chéo. 23
    3.2 Đánh giá mức độ chính xác của phép canh lề. 24
    3.3 Hệ số Dice (D) 24
    3.4 Xác suất có điều kiện: 24
    3.5 Phân tích hồi qui tuyến tính: 25
    Phần 4. 28
    Phân tích giải thuật 28
    4.1 Giải thuật Stemming: 28
    4.2 Giải thuật phân đoạn câu: 32
    4.3 Giải thuật canh lề văn bản theo chiều dài câu [16]: 34
    4.3.1 Khung lập trình động (A Dynamic Programming Framework): 34
    4.3.2 Thuật toán lập trình động (A Dynamic Programming Algorithm): 37
    4.4 Phương pháp canh lề sử CBA [8]: 37
    4.5 Phương pháp canh lề sử dụng LSSA [1]: 40
    4.6 So sánh phương pháp LSSA với CBA: 41
    4.7 Những khó khăn gặp phải khi áp dụng SIRM và GSA [10] 46
    4.8 Giải thuật giải quyết canh lề chéo (sử dụng trong luận văn): 50
    Phần 5. 52
    Hiện thực. 52
    5.1 Stemming: Dùng giải thuật Porter. 54
    5.2 Xác định từ ghép tiếng Việt và cụm từ tiếng Anh: 55
    5.3 Phân đoạn câu: 57
    5.4 Canh lề câu theo chiều dài câu: 58
    5.5 Kiểm tra tính hợp lệ của phép canh lề. 62
    5.6 Canh lề chéo: 65
    5.7 Canh lề từ: 66
    5.8 Phân loại văn bản: 68
    Phần 6. 69
    Kết quả thực nghiệm 69
    6.1 Giới thiệu chương trình: 69
    6.2 Kết quả sau bước canh lề câu (Bước 1): 70
    6.3 Kết quả sau bước canh lề chéo (Bước 2): 75
    6.4 Kết quả canh lề từ: 76
    6.5 Các chức năng khác: 80
    6.5.1 Lưu kết quả canh lề: 80
    6.5.2 Mở lại một qui trình canh lề: 80
    6.5.3 Chạy từng bước giải thuật: 80
    Phần 7. 81
    Kết luận. 81
    7.1 Tổng kết: 81
    7.2 Hướng mở rộng và phát triển đề tài: 83
    7.2.1 Hoàn chỉnh luận văn: 83
    7.2.2 Phát triển theo hướng nghiên cứu: 83
    7.2.3 Phát triển theo hướng ứng dụng: 83
    BẢNG ĐỐI CHIẾU CÁC THUẬT NGỮ ANH - VIỆT 85
    BẢNG ĐỐI CHIẾU CÁC THUẬT NGỮ VIỆT - ANH 87
    TÀI LIỆU THAM KHẢO 89
    PHỤ LỤC
     

    Các file đính kèm:

Đang tải...