Luận Văn Xây dựng cơ sở dữ liệu hai gene hsp-70 và reverse transcripte-RNaseH ở một số loài virus thực vật

Thảo luận trong 'Sinh Học' bắt đầu bởi Thúy Viết Bài, 5/12/13.

  1. Thúy Viết Bài

    Thành viên vàng

    Bài viết:
    198,891
    Được thích:
    168
    Điểm thành tích:
    0
    Xu:
    0Xu
    TÓM TẮT KHOÁ LUẬN


    “XÂY DỰNG CƠ SỞ DỮ LIỆU HAI GENE HSP-70 VÀ REVERSE


    TRANSCRIPTASE-RNaseH Ở MỘT SỐ LOÀI VIRUS THỰC VẬT”


    Với sự phát triển của kỹ thuật giải trình tự, một số lượng lớn các gene hsp-70 và RT-


    RNaseH đã được giải trình tự. Những trình tự gene này được lưu trữ trong CSDL sinh


    học lớn như NCBI, EMBL, DDBj, Vì các CSDL này quá lớn và chứa rất nhiều thông


    tin khác nhau, không tập trung thành từng gene cụ thể nên khó có thể thực hiện việc


    truy xuất các thông tin phục vụ trực tiếp cho một nghiên cứu chuyên biệt. Do vậy, mục


    tiêu của chúng tôi là tiến hành xây dựng cơ sở dữ liệu hai gene hsp-70 và reverse


    transcriptase-RNaseH ở một số loài virus thực vật.


    Để đạt được mục tiêu trên, khóa luận cần đảm bảo thực hiện nội dung như sau:


    Dùng Perl script để thu nhận trình tự các nucleotide và protein của hai gene từ


    trang CSDL GenBank (NCBI cơ sở dữ liệu nucleotide).


    Xác định gene và protein của hai gene hsp-70 và Reverse transcriptase-RNaseH


    (RT-RNaseH) trong genome hay ORF (Open Reading Frame) của virus.


    Tìm hiểu về mô hình dữ liệu quan hệ, sử dụng mô hình này vào việc lưu trữ dữ


    liệu các trình tự nucleotide và protein của hai gene, tạo CSDL hai gene này.


    Dùng Perl script để chuyển tự động các dữ liệu vào CSDL.


    Sử dụng giao thức CGI kết hợp với ngôn ngữ lập trình Perl, để thiết kế trang


    web CSDL về hai gene hsp-70 và RT-RNaseH ở trên hai họ virus


    Closteroviridae và Caulimoviridae.


    Sau khi thực hiện các nội dung trên chúng tôi đạt được những kết quả như sau:


    Chúng tôi đã tải được 325 trình tự gene hsp-70 và RT-RNaseH từ cơ sở dữ


    liệu NCBI.


    Thông qua việc tìm hiểu về hai họ virus, trình tự gene tương đồng, trình tự


    protein bảo tồn và kết hợp với ClustalW. Chúng tôi đã xác định được vị trí


    gene hsp-70 và RT-RNaseH trong ORF hay nằm trong genome của chúng.


    CSDL có 325 trình tự được tích hợp với Web.


    Trang Web CSDL gene hsp-70 và RT-RNaseH gồm có 6 trang chính, đó là


    HOME, SEARCH, TOOL, TAXONOMY, LINK, ABOUT PAGE. Ngoài ra,


    từ những trang web chính này còn có thể kết nối đến những trang phụ khác để


    cung cấp những tiện ích cho người dùng. Từ các trang web này, người sử


    dụng có thể truy xuất thông tin, so sánh một trình tự quan tâm với các trình tự


    trong cơ sở dữ liệu gene hsp-70 và RT-RNaseH, tìm kiếm trình tự, các đặc


    tính của loài,


    MỤC LỤC


    Nội dung Trang


    Trang bìa .i


    Trang trong ii


    Lời Cảm Tạ iii


    Tóm Tắt Luận Văn .iv


    Mục Lục vi


    Danh Sách Các Bảng ix


    Danh Sách Các Hình .x


    Danh Sách Các Chử Viết Tắt xii


    Phần 1. LỜI MỞ ĐẦU 1


    Phần 2. TỔNG QUAN TÀI LIỆU 4


    2.1. SƠ LưỢC VỀ CƠ SỞ DỮ LIỆU 4


    2.1.1. Định nghĩa 4


    2.1.2. Hệ quản trị CSDL .4


    2.1.3. Các mô hình dữ liệu 5


    2.1.3.1. Định nghĩa 5


    2.1.3.2. So sánh các mô hình dữ liệu 5


    2.2. NGÔN NGỮ LẬP TRÌNH PERL, MẠNG INTERNET VÀ WEB 6


    2.2.1. Perl 6


    2.2.1.1. Tóm tắt lịch sử phát triển 6


    2.2.1.2. Ứng dụng 7


    2.2.1.3. Một số module của Perl thường được sử dụng .7


    2.2.2. Giới thiệu về mạng Internet .8


    2.2.2.1. Tóm lược lịch sử phát triển .8


    2.2.2.2. Một số khái niệm 9


    2.2.3. Web .9


    2.2.3.1. Tóm lượt lịch sử phát triển .9


    2.2.3.2. Tích hợp CSDL với web dùng CGI 10


    2.3. CƠ SỞ DỮ LIỆU SINH HỌC .11


    2.3.1. NCBI .11


    2.3.1.1. Vài nét về NCBI .11


    2.3.1.2. Một số cơ sở dữ liệu trong NCBI 11


    2.3.1.3. Một số công cụ trong NCBI 12


    2.3.2. EBI 13


    2.3.2.1. Vài nét về EBI .13


    2.3.2.2. Một số cơ sở dữ liệu trong EBI .13


    2.3.2.3. Một số công cụ hỗ trợ phân tích trình tự sinh học 14


    2.3.3. SIB .15


    2.3.4. DDJB và PDBj 15


    2.4. VIRUS CAULIMOVIRIDAE VÀ CLOSTEROVIRIDAE .18


    2.4.1. CAULIMOVIRIDAE .19


    2.4.1.1. Khái quát 19


    2.4.1.2. Cấu tạo .20


    2.4.1.3. Đặc tính sinh học .20


    2.4.1.4. Cơ chế xâm nhiễm và sao mã trong tế bào ký chủ 20


    2.4.2. CLOSTEROVIRIDAE .21


    2.4.2.1. Khái quát 21


    2.4.2.2. Cấu tạo .21


    2.4.2.3. Cơ chế xâm nhiễm và sao mã trong tế bào ký chủ 22


    2.5. Gene Hsp-70 và Reverse transcriptase-RNaseH 23


    2.5.1. Gene Reverse transciptase-RNaseH .23


    2.5.2.1. Vị trí gene RT-RNaseH nằm trong genome 23


    2.5.2.2. Chức năng của protein .23


    2.5.2. Gene hsp-70 24


    2.5.1.1. Vị trí gene hsp-70 nằm trong genome .24


    2.5.1.2. Chức năng 24


    PHẦN 3. PHưƠNG PHÁP VÀ CHưƠNG TRÌNH SỬ DỤNG .25


    3.1. Các chương trình và ngôn ngữ lập trình được sử dụng 25


    3.1.1. Hệ điều hành .25


    3.1.2. Các chương trình phân tích trình tự .25


    3.1.2.1. Chương trình so sánh trình tự ClustalW 25


    3.1.2.2. Chương trình tìm kiếm các trình tự tương đồng – BLAST .25


    3.1.2.3. Hệ quả trị CSDL quan hệ MySQL 26


    3.1.2.4. Apache web Server 27


    3.1.2.5. Ngôn ngữ lập trình Perl và các gói sử dụng 27


    3.2. Phương pháp .28


    3.2.1. Thu nhận trình tự 28


    3.2.2. Xác định gene và protein trong bộ gene virus 29


    3.2.3. Thiết kế CSDL trình tự gene và protein hsp-70 và RT-RNaseH 32


    3.2.3.1. Phân tích dữ liệu 32


    3.2.3.2. Thiết kế CSDL dạng bảng .34


    3.2.3.3. Lưu trữ các thông tin vào CSDL .35


    3.2.4. Tích hợp CSDL gene hsp-70 và RT-RNaseH với trang Web 37


    Phần 4. KẾT QUẢ VÀ THẢO LUẬN .39


    4.1. Kết quả thu nhận trình tự của hai họ Closteroviridae và Caulimoviridae 39


    4.2. Kết quả thu nhận trình tự hai gene hsp-70 vàReverse transcriptase-RNaseH .41


    4.3. CSDL trình tự gene hsp-70 và RT-RNaseH 42


    4.4. Trang web thể hiện thông tin CSDL gene hsp-70 và RT-RNaseH .46


    4.4.1. Trang thông tin chung về CSDL gene hsp-70 và RT-RNaseH 47


    4.4.2. Trang tìm kiếm 47


    4.4.3. Trang công cụ 49


    4.4.4. Trang cây phân loài .52


    4.4.4.1. Trang Caulimoviridae .52


    4.4.4.2. Trang Closteroviridae .54


    4.4.5. Trang liên kết .54


    4.4.6. Trang thông tin về bộ môn công nghệ sinh học 54


    PHẦN 5. KẾT LUẬN VÀ ĐỀ NGHỊ .55


    4.1. KẾT LUẬN 55


    4.2. ĐỀ NGHỊ .55


    PHẦN 6. TÀI LIỆU THAM KHẢO 57


    PHỤ LỤC .59
     

    Các file đính kèm:

Đang tải...