Tài liệu việc cấu trúc hoá tiếng Việt

Thảo luận trong 'Kế Toán - Kiểm Toán' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    ĐỀ TÀI: việc cấu trúc hoá tiếng Việt

    Mục lục
    [TABLE=width: 688]
    [TR]
    [TD]Lời cảm ơn .
    [/TD]
    [TD]5
    [/TD]
    [/TR]
    [TR]
    [TD]Mục lục .
    [/TD]
    [TD]6
    [/TD]
    [/TR]
    [TR]
    [TD]Lời nói đầu . .

    [/TD]
    [TD]8
    [/TD]
    [/TR]
    [TR]
    [TD]Chương I Giới thiệu đề tài
    [/TD]
    [TD]8
    [/TD]
    [/TR]
    [TR]
    [TD]1. Sự cần thiết trong việc cấu trúc hoá tiếng Việt
    [/TD]
    [TD]8
    [/TD]
    [/TR]
    [TR]
    [TD] 2. Thực tế về tổng hợp tiếng nói trên thế giới và ở ViệtNam
    [/TD]
    [TD]9
    [/TD]
    [/TR]
    [TR]
    [TD] 3. Nhiệm vụ và mục tiêu của đề tài
    [/TD]
    [TD]9
    [/TD]
    [/TR]
    [TR]
    [TD]4. Tóm tắt những công việc đă thực hiện

    [/TD]
    [TD]10
    [/TD]
    [/TR]
    [TR]
    [TD]Chương II Cơ sở lư thuyết ngữ ơm tiếng Việt
    [/TD]
    [TD]11
    [/TD]
    [/TR]
    [TR]
    [TD] 1. Ngữ âm học và âm vị học
    [/TD]
    [TD]11
    [/TD]
    [/TR]
    [TR]
    [TD] 1.1. Cơ sở âm học .
    [/TD]
    [TD]11
    [/TD]
    [/TR]
    [TR]
    [TD] 1.2. Cơ sở sinh lí học
    [/TD]
    [TD]11
    [/TD]
    [/TR]
    [TR]
    [TD] 2. Âm tố
    [/TD]
    [TD]11
    [/TD]
    [/TR]
    [TR]
    [TD] 2.1. Định nghĩa
    [/TD]
    [TD]11
    [/TD]
    [/TR]
    [TR]
    [TD] 2.2. Các loại âm tố
    [/TD]
    [TD]11
    [/TD]
    [/TR]
    [TR]
    [TD] 2.2.1. Phân loại âm tố về mặt cấu âm
    [/TD]
    [TD]12
    [/TD]
    [/TR]
    [TR]
    [TD] 2.2.1.1 Âm tố nguyờn ơm
    [/TD]
    [TD]12
    [/TD]
    [/TR]
    [TR]
    [TD] 2.2.1.2 Âm tố phụ ơm
    [/TD]
    [TD]12
    [/TD]
    [/TR]
    [TR]
    [TD] 2.2.1.3. Âm tố bỏn ơm
    [/TD]
    [TD]13
    [/TD]
    [/TR]
    [TR]
    [TD] 2.2.2. Phân loại âm tố về mặt âm học: .
    [/TD]
    [TD]14
    [/TD]
    [/TR]
    [TR]
    [TD] 2.2.3 Ư nghĩa của sự phân loại âm tố về mặt cấu âm và âm học
    [/TD]
    [TD]15
    [/TD]
    [/TR]
    [TR]
    [TD] 3. Âm vị
    [/TD]
    [TD]16
    [/TD]
    [/TR]
    [TR]
    [TD] 3.1. Định nghĩa
    [/TD]
    [TD]16
    [/TD]
    [/TR]
    [TR]
    [TD] 3.2. Biến thể của âm vị
    [/TD]
    [TD]16
    [/TD]
    [/TR]
    [TR]
    [TD]3.3. Cỏc nột khu biệt âm vị và sự đối lập âm vị
    [/TD]
    [TD]17
    [/TD]
    [/TR]
    [TR]
    [TD] 3.3.1. Cỏc nột khu biệt âm vị .
    [/TD]
    [TD]17
    [/TD]
    [/TR]
    [TR]
    [TD] 3.3.2. Sự đối lập âm vị .
    [/TD]
    [TD]17
    [/TD]
    [/TR]
    [TR]
    [TD] 3.4. Phiên âm ngữ âm học .
    [/TD]
    [TD]18
    [/TD]
    [/TR]
    [TR]
    [TD] 4. Âm tiết .
    [/TD]
    [TD]18
    [/TD]
    [/TR]
    [TR]
    [TD][TABLE=width: 100%]
    [TR]
    [TD] 4.1 Định nghĩa
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [/TABLE]

    [/TD]
    [TD]18
    [/TD]
    [/TR]
    [TR]
    [TD] 4.2. Cấu tạo về cách phát âm của âm tiết tiếng Việt . .
    [/TD]
    [TD]18
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3. Đặc điểm của âm tiết tiếng Việt
    [/TD]
    [TD]19
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.1. Các vị trí trong mô h́nh âm tiết
    [/TD]
    [TD]20
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.2. Phân loại âm tiết tiếng Việt
    [/TD]
    [TD]20
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.3. Hệ thống phụ âm đầu
    [/TD]
    [TD]20
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.3.1. Đặc trưng ngữ âm tổng quát của cỏc ơm đầu
    [/TD]
    [TD]21
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.3.2. Các tiêu chí khu biệt phụ âm đầu: .
    [/TD]
    [TD]21
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.4. Hệ thống âm đệm
    [/TD]
    [TD]21
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.4.1. Các đặc trưng ngữ ơm
    [/TD]
    [TD]21
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.4.2 Tính chất nước đôi của âm đệm .
    [/TD]
    [TD]21
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.5. Hệ thống ơm chớnh .
    [/TD]
    [TD]22
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.5.1. Tiêu chí khu biệt các âm vị nguyờn ơm .
    [/TD]
    [TD]22
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.6. Hệ thống âm cuối
    [/TD]
    [TD]22
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.6.1. Các tiêu chí khu biệt
    [/TD]
    [TD]22
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.7. Thanh điệu
    [/TD]
    [TD]24
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.7.1. Định nghĩa:
    [/TD]
    [TD]24
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.7.2. Thanh điệu trong phương ngữ Bắc Bộ
    [/TD]
    [TD]24
    [/TD]
    [/TR]
    [TR]
    [TD] 4.3.7.3. Sự phân bố thanh điệu trong các loại h́nh âm tiết
    [/TD]
    [TD]24
    [/TD]
    [/TR]
    [TR]
    [TD]4.3.8 Ngữ điệu

    [/TD]
    [TD]25
    [/TD]
    [/TR]
    [TR]
    [TD]Chương III Lư thuyết cơ bản về đồng cấu ơm .
    [/TD]
    [TD]26
    [/TD]
    [/TR]
    [TR]
    [TD]1. Giới thiệu chung .
    [/TD]
    [TD]26
    [/TD]
    [/TR]
    [TR]
    [TD] 2. Đồng cấu âm là gỡ
    [/TD]
    [TD]26
    [/TD]
    [/TR]
    [TR]
    [TD] 3. Cơ sở của đồng cấu ơm
    [/TD]
    [TD]27
    [/TD]
    [/TR]
    [TR]
    [TD]3.1. Các âm vị trong tiếng núi [/TD]
    [TD]27
    [/TD]
    [/TR]
    [TR]
    [TD]3.2. Sự chuyển trạng thỏi [/TD]
    [TD]27
    [/TD]
    [/TR]
    [TR]
    [TD]3.3. Cách phát âm tương phản [/TD]
    [TD]28
    [/TD]
    [/TR]
    [TR]
    [TD]3.4. Quán tính của các bộ phận phỏt ơm [/TD]
    [TD]29
    [/TD]
    [/TR]
    [TR]
    [TD]3.5. Nền tảng của đồng cấu ơm .[/TD]
    [TD]29
    [/TD]
    [/TR]
    [TR]
    [TD]3.6. Đồng cấu âm và âm tiết [/TD]
    [TD]29
    [/TD]
    [/TR]
    [TR]
    [TD]Chương IV Phương pháp nghiên cứu và xây dựng phần mềm
    [/TD]
    [TD]32
    [/TD]
    [/TR]
    [TR]
    [TD]1. Hướng nghiên cứu
    [/TD]
    [TD]32
    [/TD]
    [/TR]
    [TR]
    [TD]2. Các khó khăn gặp phải
    2.1 Nghiên cứu với tập CSDL rộng lớn . .
    2.2 Đảm bảo mục tiêu nghiên cứu
    [/TD]
    [TD]32
    32
    34
    [/TD]
    [/TR]
    [TR]
    [TD]3. Mô h́nh nghiên cứu
    3.1. Mô h́nh tổng quỏt
    3.2 Mô h́nh nghiên cứu chi tiết
    [/TD]
    [TD]34
    34
    34
    [/TD]
    [/TR]
    [TR]
    [TD]4. Mô h́nh toán học của vấn đề và lựa chọn giải phỏp
    4.1 Mô h́nh toán học của vấn đề
    4.2 Giải pháp và cơ sở khoa học
    [/TD]
    [TD]35
    35
    36
    [/TD]
    [/TR]
    [TR]
    [TD]5. Thuật toán cho phần mềm
    5.1 Sơ đồ tổng quỏt .
    5.2 Sơ đồ khối của thuật toỏn
    5.3 Giải thuật tớnh cỏc tham số .
    5.4 Minh hoạ bằng ví dụ cụ thể cho giải pháp của bài toán
    5.4.1 Phát biểu bài toán bằng ngôn ngữ tự nhiờn
    5.4.2 Chuyển bài toán sang ngôn ngữ toán học
    [/TD]
    [TD]37
    37
    38
    40
    40
    40
    40

    [/TD]
    [/TR]
    [TR]
    [TD]6. Phân tích và thiết kế
    6.1. Biểu đồ phân cấp chức năng .
    [/TD]
    [TD]40
    44
    [/TD]
    [/TR]
    [TR]
    [TD] 6.2. Biểu đồ luồng dữ liệu mức khung cảnh .
    6.3. Biểu đồ luồng dữ liệu mức đỉnh .
    [/TD]
    [TD]44
    45
    [/TD]
    [/TR]
    [TR]
    [TD]7. Hướng dẫn sử dụng phần mềm .
    7.1 Cài đặt phần mềm: .
    7.2 Hướng dẫn sử dụng phần mềm
    [/TD]
    [TD]45
    45
    46
    [/TD]
    [/TR]
    [TR]
    [TD]
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [TR]
    [TD]Chương V Phân tích sự biến đổi cao độ của âm tiết trong ngữ đoạn .
    [/TD]
    [TD]47
    [/TD]
    [/TR]
    [TR]
    [TD] 1. Sự biến đổi h́nh dáng đường cong F0 của âm tiết.
    [/TD]
    [TD]47
    [/TD]
    [/TR]
    [TR]
    [TD] 1.1 Giới thiệu chung
    [/TD]
    [TD]47
    [/TD]
    [/TR]
    [TR]
    [TD] 1.2. Tóm tắt kết quả phơn tớch .
    [/TD]
    [TD]47
    [/TD]
    [/TR]
    [TR]
    [TD] 1.3. Phân tích cụ thể .
    [/TD]
    [TD]50
    [/TD]
    [/TR]
    [TR]
    [TD]2. Phân tích sự thay đổi giá trị trung b́nh cao độ của âm tiết (mean pitch) trong ngữ đoạn
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [TR]
    [TD]2.1. Giới thiệu chung .
    [/TD]
    [TD]51
    [/TD]
    [/TR]
    [TR]
    [TD] 2.2. Tóm tắt kết quả
    [/TD]
    [TD]51
    [/TD]
    [/TR]
    [TR]
    [TD] 2.3. Phân tích cụ thể

    [/TD]
    [TD]52
    [/TD]
    [/TR]
    [TR]
    [TD]Chương VI Phân tích và tổng hợp đặc tính trường độ của tiếng Việt .
    [/TD]
    [TD]53
    [/TD]
    [/TR]
    [TR]
    [TD]1. Các kết quả nghiên cứu bằng phần mềm Wave Sufer .
    [/TD]
    [TD]53
    [/TD]
    [/TR]
    [TR]
    [TD]1.1. Tóm tắt kết quả
    [/TD]
    [TD]53
    [/TD]
    [/TR]
    [TR]
    [TD]1.2. Dữ liệu và công cụ sử dụng trong nghiên cứu .
    [/TD]
    [TD]53
    [/TD]
    [/TR]
    [TR]
    [TD]1.3. Trường độ của các phần tín hiệu .
    [/TD]
    [TD]54
    [/TD]
    [/TR]
    [TR]
    [TD]1.3.1. Độ dài các âm vị trong âm tiết
    [/TD]
    [TD]54
    [/TD]
    [/TR]
    [TR]
    [TD]1.3.2. Thay đổi độ dài âm tiết
    [/TD]
    [TD]56
    [/TD]
    [/TR]
    [TR]
    [TD]1.3.3. Độ dài âm tiết trong ngữ đoạn
    [/TD]
    [TD]56
    [/TD]
    [/TR]
    [TR]
    [TD]1.3.3.1. Thay đổi độ dài âm tiết do vị trớ
    [/TD]
    [TD]56
    [/TD]
    [/TR]
    [TR]
    [TD]1.3.3.2. Thay đổi độ dài âm tiết do tốc độ đọc. .
    [/TD]
    [TD]57
    [/TD]
    [/TR]
    [TR]
    [TD]1.4. Trường độ các phần nghỉ . .
    1.4.1. Nghỉ ứng với các dấu ngắt đoạn
    [/TD]
    [TD]57
    57
    [/TD]
    [/TR]
    [TR]
    [TD]1.4.2. Nghỉ do chủ ư của người đọc . .
    [/TD]
    [TD]58
    [/TD]
    [/TR]
    [TR]
    [TD]1.4.3. Nghỉ ứng với các dấu cỏch .
    [/TD]
    [TD]58
    [/TD]
    [/TR]
    [TR]
    [TD]2. Ảnh hưởng của vị trí ngữ đoạn đến độ dài âm tiết .
    [/TD]
    [TD]60
    [/TD]
    [/TR]
    [TR]
    [TD]3. Kết luận .

    [/TD]
    [TD]61
    [/TD]
    [/TR]
    [TR]
    [TD]ChươngVII: Kết luận và hướng phát triển tiếp theo
    1. Kết luận .
    [/TD]
    [TD]62
    62
    [/TD]
    [/TR]
    [TR]
    [TD] 2. Hướng phát triển tiếp theo .
    [/TD]
    [TD]62
    [/TD]
    [/TR]
    [TR]
    [TD]
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [TR]
    [TD]Phụ lục A: Sự thay đổi h́nh dáng đường cong F0 của âm tiết trong ngữ đoạn .
    [/TD]
    [TD]64
    [/TD]
    [/TR]
    [TR]
    [TD]1. Thanh không dấu
    [/TD]
    [TD]64
    [/TD]
    [/TR]
    [TR]
    [TD]1.1. Thanh không dấu .
    [/TD]
    [TD]64
    [/TD]
    [/TR]
    [TR]
    [TD]1.2. Thanh huyền
    [/TD]
    [TD]65
    [/TD]
    [/TR]
    [TR]
    [TD]1.3. Thanh sắc .
    [/TD]
    [TD]65
    [/TD]
    [/TR]
    [TR]
    [TD]1.4. Thanh nặng . .
    [/TD]
    [TD]67
    [/TD]
    [/TR]
    [TR]
    [TD]1.5. Thanh hỏi .
    [/TD]
    [TD]68
    [/TD]
    [/TR]
    [TR]
    [TD]1.6. Thanh ngó . .
    [/TD]
    [TD]69
    [/TD]
    [/TR]
    [TR]
    [TD]2. Thanh huyền .
    2.1. Thanh không dấu .
    [/TD]
    [TD]70
    [/TD]
    [/TR]
    [TR]
    [TD]2.2. Thanh huyền
    [/TD]
    [TD]71
    [/TD]
    [/TR]
    [TR]
    [TD]2.3. Thanh sắc
    [/TD]
    [TD]73
    [/TD]
    [/TR]
    [TR]
    [TD]2.4. Thanh nặng . .
    [/TD]
    [TD]74
    [/TD]
    [/TR]
    [TR]
    [TD]2.5. Thanh hỏi .
    [/TD]
    [TD]75
    [/TD]
    [/TR]
    [TR]
    [TD]2.6. Thanh ngó .
    [/TD]
    [TD]77
    [/TD]
    [/TR]
    [TR]
    [TD]3. Thanh sắc
    3.1. Thanh không dấu .
    [/TD]
    [TD]78
    78
    [/TD]
    [/TR]
    [TR]
    [TD]3.2. Thanh huyền
    3.3. Thanh sắc
    3.4. Thanh hỏi
    3.5. Thanh ngó
    [/TD]
    [TD]79
    80
    81
    82
    [/TD]
    [/TR]
    [TR]
    [TD]4. Thanh hỏi .
    4.1. Thanh không dấu .
    4.2. Thanh huyền
    [/TD]
    [TD]83
    83
    84
    [/TD]
    [/TR]
    [TR]
    [TD]4.3. Thanh sắc
    [/TD]
    [TD]85
    [/TD]
    [/TR]
    [TR]
    [TD]5. Thanh nặng .
    5.1. Thanh không dấu .
    [/TD]
    [TD]87
    87
    [/TD]
    [/TR]
    [TR]
    [TD]5.2. Thanh huyền
    [/TD]
    [TD]88
    [/TD]
    [/TR]
    [TR]
    [TD]5.3. Thanh sắc .
    [/TD]
    [TD]90
    [/TD]
    [/TR]
    [TR]
    [TD]Phụ lục B: Sự biến đổi cao độ trung b́nh của âm tiết trong ngữ đoạn .
    [/TD]
    [TD]91
    [/TD]
    [/TR]
    [TR]
    [TD]1. Âm tiết không dấu
    [/TD]
    [TD]91
    [/TD]
    [/TR]
    [TR]
    [TD]2. Âm tiết mang thanh huyền
    [/TD]
    [TD]95
    [/TD]
    [/TR]
    [TR]
    [TD]3. Âm tiết mang thanh nặng .
    [/TD]
    [TD]97
    [/TD]
    [/TR]
    [TR]
    [TD]4. Âm tiết mang thanh sắc .
    5. Âm tiết mang thanh hỏi .
    [/TD]
    [TD]98
    100
    [/TD]
    [/TR]
    [TR]
    [TD]Phụ lục C: Sự biến đổi trường độ âm tiết trong ngữ đoạn .
    [/TD]
    [TD]103
    [/TD]
    [/TR]
    [TR]
    [TD]Phụ lục D: Từ khoá và viết tắt .
    [/TD]
    [TD]104
    [/TD]
    [/TR]
    [TR]
    [TD]Phụ lục E: Tài liệu tham khảo
    [/TD]
    [TD]105
    [/TD]
    [/TR]
    [TR]
    [TD]
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [TR]
    [TD]
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [TR]
    [TD]
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [TR]
    [TD]
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [TR]
    [TD]
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [TR]
    [TD]
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [TR]
    [TD]
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [TR]
    [TD]
    [/TD]
    [TD]
    [/TD]
    [/TR]
    [/TABLE]








    Lời cảm ơn


    Sau một thời gian nỗ lực thực hiện đề tài, em đă hoàn thành đồ án này theo yêu cầu đặt ra. Để đạt được kết quả như ngày hôm nay em xin chân thành cảm ơn sự giúp đỡ, hỗ trợ quư báu của gia đ́nh, nhà trường, thầy cô, và bạn bè.
    Em xin gửi lời cảm ơn sâu sắc tới Thầy giáo, tiến sĩ Trịnh Văn Loan, người đă trực tiếp hướng dẫn, chỉ bảo em trong quá tŕnh em thực hiện đề tài.
    Em xin trân trọng cảm ơn Trung tâm nghiên cứu MICA (Multimedia InF0rmation Communication and Applications) đặc biệt là TS. Eric Castelli, Khoa Công nghệ thông tin đă tạo điều kiện thuận lợi cho em trong quá tŕnh học tập và nghiên cứu tại trường cũng như trong quá tŕnh em thực hiện đề tài này. Em xin trân trọng cảm ơn các Thầy, Cô giáo đă tận t́nh truyền đạt cho em những kiến thức bổ ích về mọi lĩnh vực.
    Em xin gửi lời cảm ơn tới bạn bè, những người đă giúp đỡ em trong quá tŕnh thực hiện đề tài này.


























    Lời nói đầu

    Ngày nay, khi mà khoa học công nghệ phát triển mạnh mẽ và đặc biệt là công nghệ thông tin, th́ con người ngày càng mong muốn các hệ thống hỗ trợ cho cuộc sống phải càng trở nên hoàn thiện hơn. Có thể nói, hiện nay, trong tất cả các lĩnh vực của đời sống, việc sử dụng các phần mềm, các công cụ để trợ giúp sản xuất, tăng năng xuất lao động là điều hết sức b́nh thường và phổ biến. Sự phát triển đú chớnh là những dấu hiệu khả quan cho phép chúng ta tin tưởng và tiếp tục cải tiến theo những hướng đi mà chúng ta đă chọn.

    Sự phát triển của công nghệ thông tin cũng tạo điều kiện cho rất nhiều ngành khoa học khác phát triển. Kết hợp với công nghệ thông tin, các ngành này ngày càng thể hiện vai tṛ to lớn về mặt thực tiễn. Tuy nhiên ở đây chúng ta không có tham vọng liệt kê và nói chi tiết tất cả các ngành công nghệ ấy, mà nội dung chủ yếu chúng ta sẽ đề cập liên quan đến một ngành khoa học đang rất được quan tâm hiện nay, đú chính là khoa học xử lư tiếng nói.

    Khoa học xử lư tiếng nói đă được phát triển tương đối lâu, đây là một ngành khoa học phải có kiến thức chuyờn sơu về xử lư tín hiệu, và những hiểu biết về mặt ngôn ngữ, ngữ âm. Khoa học xử lư tiếng nói bao gồm hai nội dung cơ bản là tổng hợp tiếng nói và nhận dạng tiếng nói. Cả hai nội dung này đều đă được nghiên cứu và được thử nghiệm bởi nhiều nhà khoa học hàng đầu, và cho đến nay đă thu được những kết quả rất đáng khích lệ. Trong khi trên thế giới cả hai nội dung này đă đưa vào ứng dụng rộng răi và đă mang lại nhiều lợi ích to lớn cả cho người sử dụng cũng như người cung cấp dịch vụ, th́ ở Việt Nam nhu cầu ứng dụng các bộ tổng hợp và nhận dạng tiếng nói cũng trở thành một vấn đề hết sức cần thiết.

    Ở nước ta hiện nay, việc xây dựng một mô h́nh tiếng nói hoàn chỉnh, và có chất lượng chấp nhận được c̣n gặp rất nhiều khó khăn bới cấu trúc tiếng Việt là rất phức tạp và chưa được nghiên cứu phổ biến. Tuy nhiên bên cạnh đó chúng ta lại có được nhiều kinh nghiệm thu được từ việc xây dựng các bộ tổng hợp và nhận dạng của các ngôn ngữ khỏc trờn thế giới.

    Nguyên nhân các bộ tổng hợp và nhận dạng tiếng Việt chưa đạt đến chất lượng như mong muốn, là do chưa tích hợp được với các yếu tố cấu trúc tiếng Việt. Đề tài nghiên cứu của em cũng không nằm ngoài phạm vi đó. Quá tŕnh nghiên cứu đă phát hiện ra một số cấu trúc tiếng Việt quan trọng xoay quanh vấn đề đồng cấu ơm. Cỏc kết quả này có thể ứng dụng để viết các modun nhằm cải thiện chất lượng bộ tổng hợp tiếng nói. Do thời gian có hạn, phạm vi đề tài rộng lớn liên quan trực tiếp đến nhiều ngành khoa hoc khác như ngôn ngữ học, ngữ âm học, khoa học xử lư tín hiệu số. Hơn nữa, đối với Việt Nam nội dung của đề tài lại chưa được quan tâm đến nhiều, và em là một trong những người đầu tiên nghiên cứu cấu trúc tiếng Việt dựa vào đồng cấu ơm, nờn chắc chắn không tránh khỏi những sai sót. V́ vậy em rất mong nhận được sự đóng góp ư kiến và chỉ bảo của các thầy cô giáo và các bạn. Em xin chân thành cảm ơn.

    Sinh viên thực hiện
    Lê Văn Sơn


































    Chương I
    Giới thiệu đề tài

    1. Sự cần thiết trong việc cấu trúc hoá tiếng Việt

    Tổng hợp tiếng nói là nội dung được bao hàm trong các khái niệm về xử lư tiếng nói. Vậy xử lư tiếng nói là ǵ? Một cách chung nhất, xử lư tiếng nói có thể hiểu là việc xử lư thông tin chứa trong tín hiệu tiếng nói nhằm truyền, lưu trữ tín hiệu hoặc trong tổng hợp, nhận dạng tiếng nói.

    Xử lư tiếng nói nói chung và tổng hợp tiếng nói nói riêng từ lơu đă là một trong các lĩnh vực nghiên cứu của các nhà khoa học đầu ngành. Thực tế đơy là một lĩnh vực hết sức phức tạp, bởi nó yêu cầu người nghiên cứu phải có kiến thức chuyên sơu trong nhiều lĩnh vực: ngữ ơm học, ngôn ngữ học, xử lư tín hiệu tiếng nói và đặc biệt là khoa học máy tớnh.

    Trong nhiều năm gần đơy, thế giới đă đạt được những thành công và những bước tiến đáng kể trong cả hai lĩnh vực chớnh của tiếng nói: tổng hợp và nhận dạng. Trong đó các ứng dụng sử dụng bộ tổng hợp tiếng nói ngày càng nhiều và chúng thực sự đă đóng góp đáng kể vào sự phát triển của xă hội.

    Tại Việt Nam, với sự phát triển đời sống kinh tế và xă hội, nhu cầu ứng dụng của một bộ tổng hợp tiếng nói có chất lượng đáp ứng được các yêu cầu đề ra là hết sức cần thiết.

    Tuy nhiên do các đặc thù riêng của tiếng Việt, mà việc xơy dựng một bộ tổng hợp có chất lượng chấp nhận được là điều hết sức khó khăn. Một trong những khó khăn lớn nhất là đảm bảo tớnh tự nhiên của tiếng nói tổng hợp. Đơy là bước cản lớn nhất của việc ứng dụng các giải thuật tổng hợp tiếng nói cho tiếng Việt như giải thuật TD-PSOLA. Để đạt được điều này, chúng ta cần phải có những kiến thức chuyên sơu về ngữ ơm tiếng Việt. Nhưng tiếng Việt lại là một ngôn ngữ có nét đặc thù riêng và chưa được nghiên cứu phổ biến, các kết quả nghiên cứu từ trước đến nay chỉ tập chung vào nguyên âm, phụ âm, hay các âm tiết độc lập. Cho nên việc cấu trúc hoá tiếng Việt trong cơu nói liên tục là cần thiết và cũng đầy khó khăn.

    2. Thực tế về tổng hợp tiếng nói trên thế giới và ở Việt Nam

    Như đă đề cập, việc mô phỏng tiếng nói con người từ lơu đă là một trong những hướng nghiên cứu của các nhà khoa học hàng đầu, và một trong những công tŕnh nghiên cứu sớm nhất đă được thực hiện bởi nhà khoa học Wolfgang von Kemplen vào năm 1791. Vào đầu thế kỷ này, năm 1939, một mô h́nh tiếng nói được xơy dựng và đă thu được những kết quả nhất định trong việc mô phỏng tiếng nói của con người. Ngày nay với việc phát triển của khoa học và kỹ thuật, cùng với khả năng hỗ trợ đắc lực của máy tớnh, giọng nói tổng hợp không những được thực hiện dễ dàng mà ngày càng gần với tiếng nói tự nhiên.

    Hiện nay, có nhiều bộ tổng hợp tiếng nói cho các ngôn ngữ khác nhau như: Anh, Pháp, Đức, Nhật, Hàn, .và đặc biệt là hầu hết các bộ tổng hợp này đă đạt được đến chất lượng của tiếng nói tự nhiên. Điều này đă mở ra khả năng ứng dụng trong nhiều lĩnh vực khác nhau của hệ thống văn bản - tiếng nói (TTS).

    Đối với tiếng Việt, hiện nay chưa tồn tại một bộ tổng hợp có thể đạt tới chất lượng như kể trên, mặc dù với sự phát triển của nước ta, nhu cầu ứng dụng một bộ tổng hợp như vậy ngày càng trở nên cần thiết. Việc xơy dựng bộ tổng hợp tiếng Việt có chất lượng chấp nhận được rừ ràng là một trong những thách thức lớn bởi tớnh phức tạp và rắc rối của ngôn ngữ tiếng Việt. Nó đ̣i hỏi phải có kiến thức cơ bản và chuyên sơu trên nhiều lĩnh vực liên quan đặc biệt là ngữ âm tiếng Việt, lĩnh vực chưa được nghiên cứu phổ biến nhưng lại ảnh hưởng sơu sắc, trực tiếp tới đặc tớnh tự nhiên của tiếng nói tổng hợp. Tuy nhiên bên cạnh những khó khăn trên, việc xơy dựng một bộ tổng hợp tiếng Việt có chất lượng chấp nhận được cũng có một số thuận lợi, v́ nó có thể kế thừa những kinh nghiệm từ việc xơy dựng các bộ tổng hợp của ngôn ngữ khác mang lại.

    3. Nhiệm vụ và mục tiêu của đề tài

    Như đă đề cập ở trên, mục tiêu của đề tài là nghiên cứu nhằm nâng cao
    đặc tính tự nhiên của bộ tổng hợp tiếng nói theo phương pháp tiếp cận ngữ
    âm học. Có thể nói, để tạo ra câu nói tổng hợp đạt được chất lượng của tiếng nói tự nhiên th́ cần phải nghiên cứu về các đặc tính sau trong ngữ đoạn:

    · Sự biến đổi cao độ của âm tiết
    · Trường độ của âm tiết và của khoảng lặng cũng như dự đoán được độ dài của các âm vị trong âm tiết
    · Sự biến đổi về năng lượng
    · Ngữ điệu
     
Đang tải...