TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
NGÀNH CÔNG NGHỆ SINH HỌC
LỚP 09CS
----------------------
ĐỀ THI HỌC KỲ
MÔN HỌC: THỰC TẬP BIOINFORMATICS (TIN SINH HỌC)
THỜI GIAN: 30 PHÚT
(KHÔNG SỬ DỤNG TÀI LIỆU)
ĐỀ 1
Câu 1: Đọc mẫu tin dưới đây và trả lời các câu hỏi:
human granulocyte-colony stimulating factor [Homo sapiens]
LOCUS AAA03056 186 aa linear PRI 27-APR-1993
DEFINITION human granulocyte-colony stimulating factor, partial [Homo
sapiens].
ACCESSION AAA03056
VERSION AAA03056.1 GI:183045
DBSOURCE locus HUMGCSFB accession M13008.1
KEYWORDS .
SOURCE Homo sapiens (human)
ORGANISM Homo sapiens
Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;
Catarrhini; Hominidae; Homo.
REFERENCE 1 (residues 1 to 186)
AUTHORS Souza,L.M., Boone,T.C., Gabrilove,J., Lai,P.H., Zsebo,K.M.,
Murdock,D.C., Chazin,V.R., Bruszewski,J., Lu,H., Chen,K.K. et al.
TITLE Recombinant human granulocyte colony-stimulating factor: effects on
normal and leukemic myeloid cells
JOURNAL Science 232 (4746), 61-65 (1986)
PUBMED 2420009
COMMENT Method: conceptual translation.
FEATURES Location/Qualifiers
source 1..186
/organism="Homo sapiens"
/db_xref="taxon:9606"
Protein 1..186
/name="human granulocyte-colony stimulating factor"
sig_peptide <1..12
/note="human granulocyte-colony stimulating factor signal
peptide"
mat_peptide 13..186
/product="human granulocyte-colony stimulating factor
mature peptide"
Region 33..181
/region_name="IL6"
/note="Interleukin-6/G-CSF/MGF family; cl02473"
/db_xref="CDD:141448"
CDS 1..186
/gene="CSF1"
/coded_by="M13008.1:<1..561"
ORIGIN 1 lwhsalwtvq eatplgpass lpqsfllkcl eqvrkiqgdg aalqeklcat yklchpeelv
61 llghslgipw aplsscpsqa lqlagclsql hsglflyqgl lqalegispe lgptldtlql
121 dvadfattiw qqmeelgmap alqptqgamp afasafqrra ggvlvashlq sflevsyrvl
181 rhlaqp
//
a. Đây là mẫu tin về loại trình tự nào? Tên trình tự ?
b. Cho biết mã số Accession, GI của trình tự, số lần cập nhật, chiều dài trình tự và trình tự này thuộc loài nào?
c. Cho biết vị trí của đoạn trình tự mã hóa cho trình tự tín hiệu “signal peptide”?
Câu 2:Trong cơ sở dữ liệu PUBMED, bạn hãy cho biết từ khóa sử dụng để tìm tất cả bài báo viết về H1N1 được đăng tải trong năm 2011 của tác giả Smith?
Câu 3: Một domain bảo tồn có trình tự như sau: [STAVD]-T-R-Y-[FYEW]-D-x(3)-L-[EDS]-[CA]. Trình tự protein nào sau đây thuộc họ protein trên:
a. STRYFDEWLEC
b. TTYYYDVDTLDA
c. ATRYEDVSTLEC
d. VTRYWDEDDVLDA
Câu 4:Cho kết quả BLAST sau:
[img][/img]
Cho biết giá trị Identities, Positives, Gaps của kết quả trên (ghi theo dạng …./….(…%))
Câu 5:Hãy cho biết, trong phản ứng PCR, yếu tố nào quyết định thời gian của bước kéo dài?
Câu 6:Dùng chương trình Annhyb tìm trình tự protein P1 trong bộ gen của virus V. Biết rằng protein P1 có chiều dài 168aa, trình tự bộ gen của virus V được lưu trong file DNA1 trong thư mục D:\Bioinformatics\Sequences
Câu 7:Hãy vẽ cây phát sinh loài các trình tự trong tập tin protein4_2 trong thư mục D:\Bioinformatics\Sequences và cho biết trình tự nào có khoảng cách tiến hóa gần với trình tự gi|116324|sp|P27054|CHI4_PHAVU nhất. Lưu kết quả vẽ cây phát sinh loài vào thư mục MSSV với tên protein4_2.ph.
Câu 8:Vẽ bản đồ plasmid PlasN với các thông tin sau:
Gọi x là 2 chữ số cuối trong mã số sinh viên (ví dụ MSSV là 0918123, thì x sẽ có giá trị là x=23)
- Plasmid có chiều dài 7000+x
- Ori nằm tại ví trí 100+x và dài 150bp
- Gen kháng ampicilin nằm ngay phía sau Ori và dài 800pb
- Gen kháng Tetracilin nằm ở vị trí 2000+x và dài 1000pb, và có vị trí cắt giới hạn của enzyme EcoRI tại vị trí 2500
- Multi cloning site từ vị trí 5000 đến 5200 và mang các enzyme cắt giới hạn sau: BamHI(5050), XhoI(5188)
Lưu bản đồ plasmid PlasN vào file PlasN vào thư mục mang tên mã số sinh viên