蛋白质蛋白质相互作用习题
- 格式:doc
- 大小:48.50 KB
- 文档页数:4
1. 生物信息学的定义及主要研究内容
利用计算机存储、检索、分析、预测生物分子组成与结构的科学
2. 目前世界上主要的基因组数据库、蛋白质序列数据库及蛋白质结构数据库是什么
基因组数据库:GenBank、EMBL、DDBJ;蛋白质序列数据库:SWISS-PROT 、PIR、NCBI 蛋白质数据库;蛋白质结构数据库:PDB
3. Sequence alignment 的定义是什么?
将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,它是序列相似程度的一种定性描述
4. 什么是多重序列比对
多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。
5. 什么是BLAST?
是Basic Local Alignment Search Tool 基本局部比对搜索工具的英文缩写。
6. BLAST包含哪些子程序,分别有什么功能?
BLAST 包含5个子程序:
blastn为核酸—核酸比对程序,用户输入一个核酸序列可以找到NCBI核酸数据库中与该序列最相似的序列。
blastp为蛋白—蛋白比对程序,用户输入一个蛋白质序列可以找到NCBI蛋白数据库中与该序列最相似的序列。
blastx为核酸—蛋白比对程序,用户输入一个核酸序列,程序会将其按照6种读码形式翻译成蛋白质序列,然后在NCBI蛋白数据库中找到与该序列最相似的序列。tblastn为蛋白—核酸比对程序,用户输入一个蛋白质序列,程序按照氨基酸密码子将蛋白序列转换成核酸序列,然后在NCBI核酸数据库中找到与该序列最相似的序列。tblastx为核酸—核酸比对程序,用户输入一个核酸序列,程序会将其按照6种读码形式翻译成蛋白质序列,同时将数据库中的核酸序列也按照6种读码形式翻译成蛋白质序列,然后比较转换后的蛋白质序列相似性,进而找到核酸数据库中与该序列最相似的序列,该程序运算量很大,比对速度也最慢。
7. 在序列相似性较差的比对中,blastn 参数如何设定更可能找到相似序列?
降低Expect threshold,降低Word size。
8. 在NCBI数据库中refseq_rna 和refseq_genomic 分布代表什么数据库,有什么特点?refseq_rna为参考rna数据库,refseq_genomic 为参考基因组数据库,参考数据库都是经过人工审核的数据库,具有较高的可信性。
9.什么是FASTA格式?
文件第一行以大于号开头,随后为任意文字说明,第二行为序列信息,使用核酸或氨基酸序列符号。
10. 在BlastP程序中PAM模型和BLOSUM模型分别用于哪种搜索。
PAM模型可用于寻找蛋白质的进化起源,而BLOSUM模型则用于发现蛋白质的保守域。
11. Blast结果中的E-value是什么?
12. 如何进行电子克隆?电子克隆时需要注意哪些事项?
13. 构建进化树有哪些常用的方法,哪些适合于远缘序列进化树构建?
MEGA5 工具栏中的Phylogeny提供5种常用系统进化树的构建方法:
Maximum Likelihood, ML最大似然法
Neighbor-Joining,NJ 临位连接法
Minimum-Evolution,ME 最小进化法
Maximum Parsimony,MP 最大简约法
UPGMA 除权配对法
以上5种方法原理不同,但构建方法基本一致。通常对分化程度较大的远缘序列选择ML、NJ、ME,近缘序列可采用MP或UPGMA。
14. 什么是转录组学?
在任何一个时间点由一个或一群细胞的基因组转录而来的所有RNA转录本的整体被称为转录组,研究转录组整体的科学称为转了组学。
15. 什么是蛋白质组学?
应用大规模分离及鉴定技术研究一个物种中所产生的所有蛋白产物被称为蛋白质组学
16. 遗传变异的种类有哪些?
结构变异(Structural variants),插入(Insertions),倒位(Inversions),易位(Rearrangements)拷贝数变异(Copy number variants),序列变异(Sequence Variants),点突变(Point mutations)插入和缺失(Insertions and deletions)
17. 蛋白质转录后修饰都有哪些?
磷酸化、糖基化、乙酰化……
18. 给定一段基因序列,如何对其进行生物信息学分析?
•利用BLAST程序进行比对,找到与该序列最相似的基因,查看相似基因的功能注释。
•查找该基因编码蛋白的结构域,预测蛋白功能
•对该基因进行基因组定位,获得包含该基因的基因组序列
•预测可能的甲基化位点
•预测该基因的启动子序列
•预测可能与启动子结合的转录因子
•查找该基因所在的代谢途径
•预测蛋白质-蛋白质相互作用
•预测亚细胞定位
•如果是膜蛋白,预测蛋白的跨膜域
•预测蛋白质的三维结构
19.研究蛋白质相互作用的方法有哪些?
免疫共沉淀(Co-immunoprecipitation)
酵母双杂交(Yeast two hybrid)
噬菌体展示(Phage display)
亲和层析和质谱(Affinity purification & mass spectrometry)
蛋白芯片(Protein chip)
20. 预测蛋白质相互作用的方法有哪些?
基于结构的预测
基于序列的预测
●相互作用的直系同源蛋白
●相互作用的结构域对
基于基因组的预测
●基因位点的上下文
✓基因临近
✓基因融合(Rosetta-Stone method )
●电子双杂交