Báo Cáo Ứng dụng xử lý ngôn ngữ tự nhiên trong dịch máy

Thảo luận trong 'Viễn Thông' bắt đầu bởi Ác Niệm, 23/12/11.

  1. Ác Niệm

    Ác Niệm New Member

    Bài viết:
    3,584
    Được thích:
    2
    Điểm thành tích:
    0
    Xu:
    0Xu
    TÓM TT

    Bài báo này xut mt mô hình nhn bit và rút trích tng cm danh t song
    ng t ng liu song ng Anh-Vit bng các công c ni ting nh GIZA++ -2003 [10]
    và GATE – 2005 [1]. Bài báo cng trình bày phơng pháp ci thin cht lng i sánh
    t trong bc tin x lý bng cách chuyn i cu trúc câu ngun theo trt t ca câu
    ích rút trích cm danh t song ng, xut phơng pháp xây dng bng t và cm
    t song ng t ng liu song ng vi các nét ng ngha, xác sut xut hin và lut
    chuyn i [8]. Ngoài ra, các thành phn cơ bn ca mt h thng dch máy trên cơ s
    cm t cng c trình bày trong bài báo này. Thc nghim ban u cho kt qu kh
    quan.

    ABSTRACT

    This paper proposes the method Extracting English – Vietnamese Noun Phrases
    automatically which is building from Bilingual Corpus by well-known tools as GIZA++ -
    2003 [10], GATE – 2005 [1]. In this method, the paper presents methods to improve the
    quality of word alignment in the pre-processing phase of Machine Translation by
    transferring sentence structures from the source language to target language and then
    using heuristics to extract noun phases. It also proposes the method of building the Phase
    and Word tables from Bilingual Corpus including semantics, probability and transfer
    rules [8]. The other components of the English – Vietnamese machine translation also
    are described in this paper. The result of the experiment was satisfactory.
     

    Các file đính kèm:

Đang tải...