Luận Văn Khai thác dữ liệu ests (expressed sequence tags) ở chi cam chanh (citrus) cho việc phát triển marker

Thảo luận trong 'Sinh Học' bắt đầu bởi Phí Lan Dương, 9/7/13.

  1. Phí Lan Dương

    Phí Lan Dương New Member
    Thành viên vàng

    Bài viết:
    18,524
    Được thích:
    18
    Điểm thành tích:
    0
    Xu:
    0Xu
    vii
    Mục Lục
    LỜI CẢM ƠN iii
    TÓM TẮT KHOÁ LUẬN .iv
    ABSTRACT vi
    DANH SÁCH CÁC TỪ VIẾT TẮT xi
    Chương 1 1
    MỞ ĐẦU . 1
    1.1 Đặt vấn đề
    1.2.Mục tiêu của khóa luận
    Chương 2 3
    TỔNG QUAN TÀI LIỆU .3
    2.1 Giớ thiệu về chi cam chanh .3
    2.1.1 Vị trí phân lọai .3
    2.1.2 Đặc điểm 4
    2.1.3 Sâu hại và bệnh tật 6
    2.2 EST .7
    2.3.1 Sơ lược về EST 7
    2.3.2 Nguồn gốc của EST .7
    2.3.Sơ lược về phương pháp Microsatellite (SSR) .8
    2.3.1Những khái niệm về kỹ thuật microsatellite .8
    2.3.2 Giới thiệu chung .9
    2.3.2.1 Tính chất 9
    2.3.2.2 Khuếch đại của microsatellites . 10
    2.3.2.3 Những giới hạn của microsatellite 11
    2.3.3 Các loại microsatellite . 12
    2.3.4 Cơ chế hình thành microsatellite . 12
    viii
    2.3.5 Vai trò của microsatellite . 13
    2.4 Phương pháp xác định microsatellite truyền thống . 15
    2.5 Phương pháp phát hiện microsatellite sử dụng . 16
    2.6 Ứng dụng . 18
    2.7 Cơ sở dữ liệu sinh học . 18
    2.7.1 NCBI 19
    2.7.1.1 Vài nét về NCBI 19
    3.1.1.2 Một số cơ sở dữ liệu trong NCBI 19
    Chương 3 . 20
    VẬT LIỆU VÀ PHưƠNG PHÁP 20
    3.1 Các chương trình và ngôn ngữ lập trình được sử dụng . 20
    3.1.1 Hệ điều hành 20
    3.1.2 Các chương trình phân tích trình tự .20
    3.1.2.1 Chương trình Perl ssrfinder_1 20
    3.1.2.2 Chương trình tìm kiếm các trình tự tương đồng – BLAST 22
    3.1.2.3 Hệ quả trị CSDL quan hệ Microsoft ACEESS .23
    3.1.2.4 Egassembler 23
    3.1.3 Apache web Server 24
    3.4 CÁC BưỚC TIẾN HÀNH .25
    Chương 4 37
    KẾT QUẢ VÀ THẢO LUẬN 37
    4.1 Thu thập trình tự ESTs Citrus từ CSDL dbEST .37
    4.2 Loại các dữ liệu nhiễu và dư bằng công cụ EGassembler bao gồm các bước sau:
    .38
    4.2.1 Làm sạch trình tự .38
    4.2.2 Dấu những vùng trình tự nhiễu của vector và adaptors .39
    4.2.3 Dấu những vùng trình tự nhiễu của các bào quan 39
    ix
    4.3 Assembling 41
    4.4 Tìm SSR: bằng SSRFinder v1.0 của Steven Schroeder 42
    4.4.1 BLASTn: .43
    4.5.Thiết kế và kiểm tra primer .45
    4.6 tBLASTx .48
    4.7. Đưa tất cả các dữ liệu này vào CSDL quan hệ Microsoft ACCESS để dễ dàng
    truy xuất thông tin. 49
    4.8 Tích hợp CSDL vừa xây dựng vào web thông qua Apache Server để chia sẽ
    thông tin qua mạng. 49
    4.8.1 Trang chủ (HOME PAGE) 49
    4.8.2 Trang cơ sở dữ liệu SSRs (SSRs PAGE) .50
    Chương5 .52
    KẾT LUẬN VÀ ĐỀ NGHỊ .52
    5.1. Kết luận 52
    5.2. Đề nghị .53
    TÀI LIỆU THAM KHẢO .54
    Phụ Lục .57
    xi
    DANH SÁCH CÁC BẢNG
    Bảng 3.1 Sơ đồ tóm tắt quá trình thu nhận trình tự chính từ NCBI 26
    Bảng 3.2 : Từ khóa sử dụng để thu nhận trình tự trên NCBI 26
    Bảng 3.3 Nội dung tblStrain .34
    Bảng 3. 4 Nội dung tblMotifLengthGroup .34
    Bảng 3.5 Nội dung tblSSR 34
    Bảng 4.1 số lượng ESTs của từng loài thu nhận được từ NCBI .37
    Bảng 4.2 Số trình tự bị lọai bỏ ở bước 2.1 .38
    Bảng 4.3 số trình tự bị lọai bỏ ở bước 2.3 .39
    Bảng 4.4 số trình tự bị lọai bỏ ở bước 2.4 .39
    Bảng 4.5 số lượng Contigs thu được ở mỗi lòai sau khi assembling 41
    Bảng 4.6 Tổng số lượng SSRs thu nhận được 42
    Bảng 4.7 Lượng trình tự ESTs và số primer mới được tạo thành .43
    Bảng 4.8 Tổng số primer thiết kế được .45
    Bảng 4.9 Tổng số Primer còn lại sau khi kiểm tra 45
    Bảng 4.10 Các trình tự tương đồng với gene kháng virus tristeza 48
    Bảng 4.11: Các nhóm Strain id có trong cơ sở dữ liệu .50
    Bảng 4.12 Các nhóm Motif trong cơ sở dữ liệu 51
    xii
    DANH SÁCH CÁC HÌNH
    Hình 2.1. CTV dưới KHV điện tử . 6
    Hình 2.2: Nguồn gốc của EST 8
    Hình 2.3 Cơ chế bắt chéo lỗi trong giảm phân . 12
    Hình 2.4 Cơ chế trượt lỗi trong quá trình sao mã . 13
    Hình 2.5: Phương pháp phân lập microsatellite truyền thống 16
    Hình 2.6 Tương quan giữa NCBI (National Library of Medicine và NIH) 19
    Hình 3.1 : Danh sách các trình tự EST Citrus trên NCBI (nguồn
    www.NCBI.nlm.nih.gov/genomes/plant/plantlist.html#est) 27
    Hình 3.2 : Các bước thực hiện của Egassembler 29
    Hình 3.3 phân biệt giữa Contig và Singleton 30
    Hình 3.4 nội dung tập tin “ssrout20030101.txt” .31
    Hình 3.5 nội dung tập tin “labdbout20030101.txt” .31
    Hình 3.6 Nội dung tập tin “new_ids20030101.txt” .32
    Hình 3.7 Trang web mẫu về trình tự microsatellite(Nguồn: http://www.ncl-
    india.org/ssr/ssr.htm) .36
    Hình 4.1: Sơ đồ so sánh lượng ESTs của từng loài 37
    Hình 4.2: Bảng so sánh dữ liệu ESTs trước và sau khi lọai nhiễu .40
    Hình 4.3: Bảng so sánh lượng Contigs và ESTs .41
    Hình 4.4: Biểu đồ so sánh lượng SSRs phân lập và lượng ESTs ban đầu .42-43
    Hình 4.5: Biểu đồ so sánh lượng noneprimers và ESTs, Primers mới 44
    Hình 4.6: Bảng so sánh lượng Primers trước và sau khi kiểm tra 46
    Hình 4.7: Bảng so sánh tổng trình tự SSRs và Primers thiết kế được 47
    Hình 4.8 : Mối quan hệ giữa các bảng 49
    Hình 4.9: Tổng quan về Website 49
    Hình 4.10 Trang cơ sở dữ liệu SSRs (All) 50
    Hình 4.11 Trang cơ sở dữ liệu SSRs chọn lọc theo Strain Id “ST01” và “Motif
    Length Group ID” là 3 51
     
Đang tải...