Luận Văn Khai thác dữ liệu ESTs ở chi cam chanh cho việc phát triển marker phân tử SSRs

Thảo luận trong 'Sinh Học' bắt đầu bởi Quy Ẩn Giang Hồ, 19/4/12.

  1. Quy Ẩn Giang Hồ

    Quy Ẩn Giang Hồ Administrator
    Thành viên BQT

    Bài viết:
    3,084
    Được thích:
    23
    Điểm thành tích:
    38
    Xu:
    0Xu
    TÓM TẮT KHOÁ LUẬN

    LưU TRẦN CÔNG HUY, Đại Học Nông Lâm TP. Hồ Chí Minh, tháng 07/2007. “KHAI THÁC DỮ LIỆU ESTs (EXPRESSED SEQUENCE TAGs) Ở CHI CAM CHANH (CITRUS) CHO VIỆC PHÁT TRIỂN MARKER PHÂN TỬ SSR (SIMPLE SEQUENCE REPEATS)” Hội đồng hướng dẫn TS. Trần Thị Dung Cử Nhân. Lưu Phúc Lợi Khóa luận được thực hiện tại bộ môn Công Nghệ Sinh Học, trường đại học Nông Lâm TP. Hồ Chí Minh, trong khoảng thời gian từ tháng 3/2007 đến 8/2007. Trong những năm qua, sinh học không ngừng phát triển và đã tạo ra những kho dữ liệu miễn phí và trực tuyến rất lớn về trình tự gene, protein, bộ gene . của thực vật lẫn động vật như các cơ sở dữ liệu sinh học lớn như NCBI, EMBL, DDBj . Một trong những CSDL lớn đó là ESTs (Expressed Sequence Tags), trong đó có ESTs của chi cam chanh (citrus). Những trình tự ESTs này có thể được sử dụng để khai thác các SSRs (Simple Sequence Repeats). Những SSRs này rất hữu ích vì chúng có rất nhiều ứng dụng như genome mapping, phenotype mapping và chọn giống thực vật nhờ marker phân tử. Hơn thế nữa, việc phát triển marker SSR từ EST có chi phí rất thấp so với phương pháp phân lập SSR truyền thống. Để đạt được mục tiêu trên, khóa luận cần đảm bảo thực hiện những nội dung như sau: 1) Dùng Perl script để thu nhận trình tự các nucleotide của ESTs của Citrus vừa tìm từ trang cơ sở dữ liệu GenBank NCBI. 2) Tìm và tách các đoạn microsatellite có thể có trong mỗi đoạn gen. 3) Tìm SSR nằm trên vùng gen kháng virus Tristeza
    4) Tìm hiểu về mô hình dữ liệu quan hệ, sử dụng mô hình này vào việc lưu trữ dữ liệu các trình tự nucleotide và trình tự SSRs của chi cam chanh (Citrus), và tạo cơ sở dữ liệu chứa những trình tự này. Sau đó đưa các dữ liệu này vào cơ sở dữ liệu chính. 5) Trang web được thiết kế để chia sẻ thông tin trực tuyến với người dùng Kết quả Thu nhận được 191.110 trình tự ESTs của các loài Citrus được thu thập từ CSDL dbEST và CoreNucleotide của GenBank. Những trình tự ESTs này được tìm các vùng lặp lại, từ đó xác định được 28.241 SSRs trong 190412 ESTs . 19755 primers được thiết kế trên vùng flanking của các SSRs. Các primers này đã được kiểm tra sự lặp lại và sự bắt cặp đặc hiệu bằng BLAST. Cơ sở dữ liệu có 28241 trình tự SSRs được chuyển vào CSDL quan hệ và tích hợp vào website BUILDING SSRs DATABASE of Citrus. Sau khi được loại bỏ các trình tự tạp, nhiễu và dấu các trình tự ở các bào quan, trình tự lặp lại và trình tự vector, các trình tự ESTs được phân nhóm thành 2 nhóm Contigs và Singletons. Việc nhóm các trình tự giúp ích cho việc giảm bớt các trình tự dư thừa, kéo dài các EST-SSR và xác định các trình tự bảo tồn. Kết quả là thêm 1071 primers được thiết kế cho các EST-SSR được kéo dài. Ngoài ra, chúng tôi cũng xác định được 33 EST-SSRs tương đồng gene kháng virus Tristeza bằng công cụ BLAST với ngưỡng e-value = 10-10
    Chương 1 1
    MỞ ĐẦU 1
    1.1 Đặt vấn đề
    1.2.Mục tiêu của khóa luận
    Chương 2 3
    TỔNG QUAN TÀI LIỆU 3
    2.1 Giớ thiệu về chi cam chanh 3
    2.1.1 Vị trí phân lọai 3
    2.1.2 Đặc điểm 4
    2.1.3 Sâu hại và bệnh tật 6
    2.2 EST 7
    2.3.1 Sơ lược về EST 7
    2.3.2 Nguồn gốc của EST 7
    2.3.Sơ lược về phương pháp Microsatellite (SSR) 8
    2.3.1Những khái niệm về kỹ thuật microsatellite 8
    2.3.2 Giới thiệu chung 9
    2.3.2.1 Tính chất 9
    2.3.2.2 Khuếch đại của microsatellites 10
    2.3.2.3 Những giới hạn của microsatellite 11
    2.3.3 Các loại microsatellite 12
    2.3.4 Cơ chế hình thành microsatellite 12
    2.3.5 Vai trò của microsatellite 13
    2.4 Phương pháp xác định microsatellite truyền thống 15
    2.5 Phương pháp phát hiện microsatellite sử dụng 16
    2.6 Ứng dụng 18
    2.7 Cơ sở dữ liệu sinh học 18
    2.7.1 NCBI 19
    2.7.1.1 Vài nét về NCBI 19
    3.1.1.2 Một số cơ sở dữ liệu trong NCBI 19
    Chương 3 20
    VẬT LIỆU VÀ PHưƠNG PHÁP 20
    3.1 Các chương trình và ngôn ngữ lập trình được sử dụng 20
    3.1.1 Hệ điều hành 20
    3.1.2 Các chương trình phân tích trình tự 20
    3.1.2.1 Chương trình Perl ssrfinder_1 20
    3.1.2.2 Chương trình tìm kiếm các trình tự tương đồng – BLAST 22
    3.1.2.3 Hệ quả trị CSDL quan hệ Microsoft ACEESS 23
    3.1.2.4 Egassembler 23
    3.1.3 Apache web Server 24
    3.4 CÁC BưỚC TIẾN HÀNH 25
    Chương 4 37
    KẾT QUẢ VÀ THẢO LUẬN 37
    4.1 Thu thập trình tự ESTs Citrus từ CSDL dbEST 37
    4.2 Loại các dữ liệu nhiễu và dư bằng công cụ EGassembler bao gồm các bước sau:
    4.2.1 Làm sạch trình tự 38
    4.2.2 Dấu những vùng trình tự nhiễu của vector và adaptors 39
    4.2.3 Dấu những vùng trình tự nhiễu của các bào quan 39
    4.3 Assembling 41
    4.4 Tìm SSR: bằng SSRFinder v1.0 của Steven Schroeder 42
    4.4.1 BLASTn: 43
    4.5.Thiết kế và kiểm tra primer 45
    4.6 tBLASTx 48
    4.7. Đưa tất cả các dữ liệu này vào CSDL quan hệ Microsoft ACCESS để dễ dàng truy xuất thông tin. 49
    4.8 Tích hợp CSDL vừa xây dựng vào web thông qua Apache Server để chia sẽ thông tin qua mạng. 49
    4.8.1 Trang chủ (HOME PAGE) 49
    4.8.2 Trang cơ sở dữ liệu SSRs (SSRs PAGE) 50
    Chương5 52
    KẾT LUẬN VÀ ĐỀ NGHỊ 52
    5.1. Kết luận 52
    5.2. Đề nghị 53
    TÀI LIỆU THAM KHẢO 54
    Phụ Lục 57
     

    Các file đính kèm:

Đang tải...