Thạc Sĩ Phương pháp đại số cho bài toán ước lượng hợp lý cực đại - Áp dụng trên cây sinh loài nhỏ

Thảo luận trong 'Công Nghệ Thông Tin' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    173
    Điểm thành tích:
    0
    Xu:
    0Xu
    TÓM TẮT LUẬN VĂN
    Cây sinh loài mô tả lịch sử tiến hóa của một nhóm các loài với những đặc tính
    khác nhau nhưng cùng có mối quan hệ họ hàng với nhau và cùng hình thành từ một tổ
    tiên chung trong quá khứ. Đặc tính của mỗi loài được chúng ta quan tâm ở đây tương
    ứng với các bộ gen. Gen là các chuỗi DNA được bao gồm từ các kí tự A, G, C và T
    hợp thành. Cây sinh loài là một cây mà các nút lá (taxa) của nó có thể là các vật sống
    hiện tại ngày nay, các nút trong của cây đó là các tổ tiên của các nút lá. Tái cấu trúc
    cây sinh loài chính là tìm những gen phù hợp nhất để đưa vào các nút tổ tiên hoặc là
    đưa ra một cây sinh loài phù hợp nhất để giải thích quá trình tiến hoá.
    Tuy nhiên, việc nghiên cứu cây sinh loài cho nhiều hướng tiếp cận. Mỗi phương
    pháp có những ưu điểm và khuyết điểm của nó. Phương pháp ước lượng hợp lý cực
    đại được chọn ở đây là phương pháp phức tạp nhất nhưng lại là phương pháp cho kết
    quả tin cậy nhất. Công cụ chính sử dụng trong phương pháp này là Đại số thống kê và
    Đại số máy tính. Đó là những lãnh vực phát triển mạnh mẽ trong những năm gần đây.
    Thống kê là ngành khoa học phân tích dữ liệu. Đối với các chuỗi DNA thì
    thống kê sẽ xây dựng những mô hình quá trình phát sinh dữ liệu. Đưa ra những kết
    luận chung về quá trình phát sinh đó. Mô hình thống kê là nguyên tắc cơ bản đối với
    các gen. Đại số thống kê làm sáng tỏ cho những ý tưởng trọng tâm về phân tích dữ liệu
    rời rạc nói riêng và phân tích chuỗi sinh học nói riêng.
    Ước lượng hợp lý cực đại (Maximum Likelihood Estimation – MLE) được
    công thức hoá trong Xác suất cổ điển, nó có tính chất của một ước lượng tốt. Phương
    pháp MLE đánh giá những tham số của một mô hình thối lui. MLE dẫn đến việc giải
    quyết là làm cực đại tích của những đa thức.
    Đại số máy tính là một lãnh vực mới, nó cung cấp những nền tảng để giải bài
    toán MLE trên máy tính.
    Đề tài này tập trung vào việc nghiên cứu mô hình xác suất thống kê trên cây
    sinh loài từ những dữ liệu là các gen của sinh vật sống. Sau đó sử dụng những nền tảng
    toán học, đại số máy tính để giải quyết bài toán hợp lý cực đại của mô hình xác suất
    trên. Mục tiêu cuối cùng là tìm một cây sinh loài thích hợp nhất để giải thích sự tiến
    hoá. Những kết quả của luận văn đã làm như sau:
    - Về phương pháp: Chọn phương pháp đáng tin cậy nhất là phương pháp ước
    lượng hợp lý cực đại cho mô hình hóa bài toán. Giải phương trình hợp lý bằng
    phương pháp tính toán đại số để tìm kết quả chính xác.
    - Về tính toán: Viết một chương trình để mô hình hóa ước lượng hợp lý cực đại
    trên cây sinh loài và chạy tìm nghiệm phương trình hợp lý trên một số cây sinh
    loài nhỏ 3 và 4 taxa ở một số mô hình.

    MỤC LỤC
    LỜI CAM ĐOAN 1
    LỜI CẢM ƠN 2
    TÓM TẮT LUẬN VĂN 3
    DANH MỤC BẢNG 4
    DANH MỤC HÌNH .5
    MỤC LỤC 6
    Chương 1. GIỚI THIỆU ĐỀ TÀI 9
    1.1. Giới thiệu 9
    1.2. Cấu trúc luận văn 10
    Chương 2. CƠ SỞ LÝ THUYẾT VỀ CÁC CẤU TRÚC ĐẠI SỐ VÀ XÁC SUẤT
    THỐNG KÊ 12
    2.1. Một số cấu trúc đại số cơ bàn .12
    2.1.1. Lý thuyết nhóm .12
    2.1.2. Lý thuyết vành 13
    2.1.3. Trường 14
    2.1.4. Vành đa thức .14
    2.1.5. Ma trận 15
    2.1.6. Định thức 15
    2.1.7. Không gian vector .16
    2.1.8. Đa tạp đại số .18
    2.2. Các khái niệm về xác suất thống kê .18
    2.2.1. Định nghĩa về xác suất 18
    2.2.2. Xác suất có điều kiện 19
    2.2.3. Đại lượng ngẫu nhiên và hàm phân phối 20
    2.2.4. Các đặc trưng của đại lượng ngẫu nhiên .20
    2.2.5. Lý thuyết mẫu .21
    2.2.6. Ước lượng tham số 22
    2.2.7. Sơ lược về ước lượng hợp lý cực đại 22
    Chương 3. ƯỚC LƯỢNG HỢP LÝ CỰC ĐẠI TRÊN MẪU QUAN SÁT 25
    3.1. Ước lượng hợp lý cực đại là gì? 25
    3.1.1. Đặt vấn đề .25
    3.1.2. Khái quát về ước lượng hợp lý cực đại .25
    3.1.3. Ví dụ về ước lượng hợp lý cực đại .26
    3.2. Giải bài toán ước lượng hợp lý cực đại 26
    3.2.1. Nguyên lý ước lượng hợp lý cực đại 26
    3.2.2. Logarit hàm hợp lý 26
    3.3. Tổng quát hóa bài toán ước lượng hợp lý cực đại 27
    3.3.1. Ước lượng hợp lý cực đại trên mẫu quan sát 27
    3.3.2. Một số phương pháp giải phương trình hợp lý .28
    Chương 4. CÂY SINH LOÀI - MÔ HÌNH XÁC SUẤT THỐNG KÊ TRÊN CÂY
    SINH LOÀI .30
    4.1. Giới thiệu sơ lược về cây sinh loài 30
    4.2. Các nghiên cứu phát sinh sinh loài .31
    4.3. Mô hình ước lượng hợp lý cực đại trên cây sinh loài .32
    4.4. Mô hình tiến hóa 33
    Chương 5. BẤT BIẾN TRÊN CÂY SINH LOÀI .37
    5.1. Dẫn nhập .37
    5.2. Mô hình xác suất trên cây sinh loài 38
    5.2.1. Mô hình bài toán cây sinh loài 38
    5.2.2. Nhóm Abel và sự liên hệ với các ma trận chuyển đổi 39
    5.3. Biến đổi Fourier .40
    5.4. Toạ độ Fourier .42
    5.5. Áp dụng tìm bất biến trên một cây sinh loài .42
    5.5.1. Mô hình bài toán .42
    5.5.2. Các khả năng xảy ra trên các nút lá 43
    5.5.3. Các lớp xác suất tương đương 43
    5.5.4. Chuyển đổi Fourier .44
    5.5.5. Kết quả tìm được 45
    5.6. Những tính chất của thành phần bất biến .46
    Chương 6. GIẢI PHƯƠNG TRÌNH HỢP LÝ 47
    6.1. Quỹ tích hợp lý trên một đa tạp .47
    6.2. Ma trận Jacobi của các đa thức bất biến .47
    6.2.1. Gradient- Vector vận tốc .47
    6.2.2. Ma trận Jacobi của các đa thức bất biến .48
    6.2.3. Không gian tiếp xúc 49
    6.3. Bài toán cực trị điều kiện 49
    6.4. Bậc của hợp lý cực đại .50
    6.5. Các thuật toán 50
    6.6. Áp dụng giải phương trình hợp lý 51
    Chương 7. CHƯƠNG TRÌNH THỰC HIỆN .53
    7.1. Sơ đồ khối chương trình 53
    7.2. Sơ lược về chương trình 54
    7.3. Kết quả chương trình 54
    Chương 8. TỔNG KẾT – ĐÁNH GIÁ 57
    8.1. Tổng kết 57
    8.2. Những đóng góp của luận văn 57
    8.3. Hướng phát triển .58
    TÀI LIỆU THAM KHẢO .59
     

    Các file đính kèm:

Đang tải...