Luận Văn Khai thác dữ liệu ests (expressed sequence tags) ở chi cam chanh (citrus) cho việc phát triển marker

Thảo luận trong 'Sinh Học' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    167
    Điểm thành tích:
    0
    Xu:
    0Xu
    vii


    Mục Lục


    LỜI CẢM ƠN iii


    TÓM TẮT KHOÁ LUẬN .iv


    ABSTRACT vi


    DANH SÁCH CÁC TỪ VIẾT TẮT xi


    Chương 1 1


    MỞ ĐẦU . 1


    1.1 Đặt vấn đề


    1.2.Mục tiêu của khóa luận


    Chương 2 3


    TỔNG QUAN TÀI LIỆU .3


    2.1 Giớ thiệu về chi cam chanh .3


    2.1.1 Vị trí phân lọai .3


    2.1.2 Đặc điểm 4


    2.1.3 Sâu hại và bệnh tật 6


    2.2 EST .7


    2.3.1 Sơ lược về EST 7


    2.3.2 Nguồn gốc của EST .7


    2.3.Sơ lược về phương pháp Microsatellite (SSR) .8


    2.3.1Những khái niệm về kỹ thuật microsatellite .8


    2.3.2 Giới thiệu chung .9


    2.3.2.1 Tính chất 9


    2.3.2.2 Khuếch đại của microsatellites . 10


    2.3.2.3 Những giới hạn của microsatellite 11


    2.3.3 Các loại microsatellite . 12


    2.3.4 Cơ chế hình thành microsatellite . 12

    viii


    2.3.5 Vai trò của microsatellite . 13


    2.4 Phương pháp xác định microsatellite truyền thống . 15


    2.5 Phương pháp phát hiện microsatellite sử dụng . 16


    2.6 Ứng dụng . 18


    2.7 Cơ sở dữ liệu sinh học . 18


    2.7.1 NCBI 19


    2.7.1.1 Vài nét về NCBI 19


    3.1.1.2 Một số cơ sở dữ liệu trong NCBI 19


    Chương 3 . 20


    VẬT LIỆU VÀ PHưƠNG PHÁP 20


    3.1 Các chương trình và ngôn ngữ lập trình được sử dụng . 20


    3.1.1 Hệ điều hành 20


    3.1.2 Các chương trình phân tích trình tự .20


    3.1.2.1 Chương trình Perl ssrfinder_1 20


    3.1.2.2 Chương trình tìm kiếm các trình tự tương đồng – BLAST 22


    3.1.2.3 Hệ quả trị CSDL quan hệ Microsoft ACEESS .23


    3.1.2.4 Egassembler 23


    3.1.3 Apache web Server 24


    3.4 CÁC BưỚC TIẾN HÀNH .25


    Chương 4 37


    KẾT QUẢ VÀ THẢO LUẬN 37


    4.1 Thu thập trình tự ESTs Citrus từ CSDL dbEST .37


    4.2 Loại các dữ liệu nhiễu và dư bằng công cụ EGassembler bao gồm các bước sau:


    .38


    4.2.1 Làm sạch trình tự .38


    4.2.2 Dấu những vùng trình tự nhiễu của vector và adaptors .39


    4.2.3 Dấu những vùng trình tự nhiễu của các bào quan 39

    ix


    4.3 Assembling 41


    4.4 Tìm SSR: bằng SSRFinder v1.0 của Steven Schroeder 42


    4.4.1 BLASTn: .43


    4.5.Thiết kế và kiểm tra primer .45


    4.6 tBLASTx .48


    4.7. Đưa tất cả các dữ liệu này vào CSDL quan hệ Microsoft ACCESS để dễ dàng


    truy xuất thông tin. 49


    4.8 Tích hợp CSDL vừa xây dựng vào web thông qua Apache Server để chia sẽ


    thông tin qua mạng. 49


    4.8.1 Trang chủ (HOME PAGE) 49


    4.8.2 Trang cơ sở dữ liệu SSRs (SSRs PAGE) .50


    Chương5 .52


    KẾT LUẬN VÀ ĐỀ NGHỊ .52


    5.1. Kết luận 52


    5.2. Đề nghị .53


    TÀI LIỆU THAM KHẢO .54


    Phụ Lục .57

    xi


    DANH SÁCH CÁC BẢNG


    Bảng 3.1 Sơ đồ tóm tắt quá trình thu nhận trình tự chính từ NCBI 26


    Bảng 3.2 : Từ khóa sử dụng để thu nhận trình tự trên NCBI 26


    Bảng 3.3 Nội dung tblStrain .34


    Bảng 3. 4 Nội dung tblMotifLengthGroup .34


    Bảng 3.5 Nội dung tblSSR 34


    Bảng 4.1 số lượng ESTs của từng loài thu nhận được từ NCBI .37


    Bảng 4.2 Số trình tự bị lọai bỏ ở bước 2.1 .38


    Bảng 4.3 số trình tự bị lọai bỏ ở bước 2.3 .39


    Bảng 4.4 số trình tự bị lọai bỏ ở bước 2.4 .39


    Bảng 4.5 số lượng Contigs thu được ở mỗi lòai sau khi assembling 41


    Bảng 4.6 Tổng số lượng SSRs thu nhận được 42


    Bảng 4.7 Lượng trình tự ESTs và số primer mới được tạo thành .43


    Bảng 4.8 Tổng số primer thiết kế được .45


    Bảng 4.9 Tổng số Primer còn lại sau khi kiểm tra 45


    Bảng 4.10 Các trình tự tương đồng với gene kháng virus tristeza 48


    Bảng 4.11: Các nhóm Strain id có trong cơ sở dữ liệu .50


    Bảng 4.12 Các nhóm Motif trong cơ sở dữ liệu 51

    xii


    DANH SÁCH CÁC HÌNH


    Hình 2.1. CTV dưới KHV điện tử . 6


    Hình 2.2: Nguồn gốc của EST 8


    Hình 2.3 Cơ chế bắt chéo lỗi trong giảm phân . 12


    Hình 2.4 Cơ chế trượt lỗi trong quá trình sao mã . 13


    Hình 2.5: Phương pháp phân lập microsatellite truyền thống 16


    Hình 2.6 Tương quan giữa NCBI (National Library of Medicine và NIH) 19


    Hình 3.1 : Danh sách các trình tự EST Citrus trên NCBI (nguồn


    www.NCBI.nlm.nih.gov/genomes/plant/plantlist.html#est) 27


    Hình 3.2 : Các bước thực hiện của Egassembler 29


    Hình 3.3 phân biệt giữa Contig và Singleton 30


    Hình 3.4 nội dung tập tin “ssrout20030101.txt” .31


    Hình 3.5 nội dung tập tin “labdbout20030101.txt” .31


    Hình 3.6 Nội dung tập tin “new_ids20030101.txt” .32


    Hình 3.7 Trang web mẫu về trình tự microsatellite(Nguồn: http://www.ncl-


    india.org/ssr/ssr.htm) .36


    Hình 4.1: Sơ đồ so sánh lượng ESTs của từng loài 37


    Hình 4.2: Bảng so sánh dữ liệu ESTs trước và sau khi lọai nhiễu .40


    Hình 4.3: Bảng so sánh lượng Contigs và ESTs .41


    Hình 4.4: Biểu đồ so sánh lượng SSRs phân lập và lượng ESTs ban đầu .42-43


    Hình 4.5: Biểu đồ so sánh lượng noneprimers và ESTs, Primers mới 44


    Hình 4.6: Bảng so sánh lượng Primers trước và sau khi kiểm tra 46


    Hình 4.7: Bảng so sánh tổng trình tự SSRs và Primers thiết kế được 47


    Hình 4.8 : Mối quan hệ giữa các bảng 49


    Hình 4.9: Tổng quan về Website 49


    Hình 4.10 Trang cơ sở dữ liệu SSRs (All) 50


    Hình 4.11 Trang cơ sở dữ liệu SSRs chọn lọc theo Strain Id “ST01” và “Motif


    Length Group ID” là 3 51
     

    Các file đính kèm:

Đang tải...