蛋白质序列分析常用网站
- 格式:doc
- 大小:28.00 KB
- 文档页数:4
蛋白质序列分析
蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到。蛋白质的很多功能特征可直接由分析其序列而获得。例如,疏水性图谱可通知来预测跨膜螺旋。同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网。WEB中有很多此类资源用于帮助预测蛋白质的功能。
基本理化性质分析:
信号肽预测:
在生物内,蛋白质的合成场所与功能场所常被一层或多层细胞膜所隔开,这样就涉及到蛋白质的转运。合成的蛋白质只有准确地定向运行才能保证生命活动的正常进行。一般来说,蛋白质的定位的信息存在于该蛋白质自身结构中,并通过与膜上特殊的受体相互作用而得以表达。在起始密码子之后,有一段编码疏水性氨基酸序列的RNA 片段,这个氨基酸序列就这个氨基酸序列就是信号肽序列。含有信号肽的蛋白质一般都是分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值。
糖基化位点预测:
跨膜区分析:TMORED
蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。
蛋白酶的结构功能进行预测和分析:
同源建模分析:
二级结构及折叠类预测:Predictprotein
特殊结构或结构预测:COILS MacStripe
疏水性分析:ExPASy的ProtScale
基于序列同源性分析的蛋白质功能预测:
至少有80个氨基酸长度范围内具有25%以上序列一致性才提示可能的显著性意义。类似于核酸序列同源性分析,用户直接将待分析的蛋白质序列输入NCBI/BLAST(),选择程序BLASTP就可网上分析。
基于motif、结构位点、结构功能域数据库的蛋白质功能预测
蛋白质的磷酸化与糖基化对蛋白质的功能影响很大,所以对其的分析也是生物信息学的一个部分。同时,分子进化方面的研究表明,蛋白质的不同区域具有不同的进化速率,一些氨基酸必须在进化过程中足够保守以实现蛋白质的功能。在序列模式的
鉴定方面有两类技术,第一类是依赖于和一致性序列(consensus sequence)或基序各残基的匹配模式,该技术可用于十分容易并快速搜索motif数据库。
Motif数据库-PROSITE
最好的是prosite)。
InterProScan是EBI 开发的一个集成了蛋白质结构域和功能位点的数据库,其中把SWISS-PROT,等数据库提供的蛋白质序列中的各种局域模式,如结构域,motif等信息统一起来,提供了一个较为全央的分析工具。
简单模块构架搜索工具(simple modular architecture research tool,SMART)一个较好的蛋白质结构功能域的数据,可用于蛋白质结构功能域的分析,所得到的结构域同时提供相关的资源的链接
InterProScan综合分析网站
InterProScan是EBI 开发的一个集成了蛋白质结构域和功能位点的数据库,其中把SWISS-PROT,等数据库提供的蛋白质序列中的各种局域模式,如结构域,motif等信息统一起来,提供了一个较为全央的分析工具。
蛋白质的结构功能域分析
简单模块构架搜索工具(simple modular architecture research tool,SMART)一个较好的蛋白质结构功能域的数据,可用于蛋白质结构功能域的分析,所得到的结构域同时提供相关的资源的链接
蛋白质结构预测
PDB数据库
蛋白质基本立体结构数据库(PDB,其中有大量工具用于查看PDB数据库中的结构,如rasmol,可用于显于出蛋白质的空间结构,下载地址:
PDBFinder 数据库
是在PDB、DSSP、HSSP基础上建立的二级库,它包含PDB序列,作者,R因子,分辨率、二级结构等,这些些信息随着PDB库每次发布新版,PDBFinder在EBI自动生成,网址为
NRL-3D数据库:是所有已知结构蛋白质的数据库,可用于查询蛋白序列时行相似性分析以确定其结构
ISSD数据库:蛋白质序列数据库,其每个条目包含一个基因的编码序列,同相应的氨基酸序列对比,并给出相应的多肽链结构数据。
HSSP数据库:是根据同源性导出的蛋白质二级结构数据库,每一条PDB项目都有一个对应的HSSP文件,
蛋白质结构分类数据库
对已知蛋白质三维结构进行手工分类得到的数据库,位于剑桥的站点也提供BLAST检索服务
MMDB蛋白质分子模型数据库
是ENTREZ检索工具所使用的三维结构数据库,以ASN格式反蚋的PDB中的结构和序列数据。NCBI同时提供一个配套的三维结构显示程序的Cn3D,
Dali/FSSP数据库
基于PDB数据库中现有的蛋白质三维结构,用自动结构对比程序Dali比较而形成的折叠单元和家庭分类库。
蛋白质二级结构预测
基于序列进行蛋白质二级结构方面已有了大量文献描述,本质上,这些研究可被分为两大类:基于单一序列的分析和基于多重序列对齐的分析。文献报道PHD程序是目前此方面的最好程序,提供了从二级结构到折叠方面分析的多种资源。其网址为www.embl-heidel-berg.d ... tprotein.html,也可通过
进行数据分析。
蛋白质三级结构预测
蛋白质同源家庭的分析对于确立物种之间的亲缘关系和预测新蛋白质序列的功能有重要意义,同源蛋白质(homolog)进一步划分为直系同源(ortholog)和旁系同源(paralog),前者指不同物种中具有相同功能和共同起源的基因,后者则指在同一物种内具有不同功能,但也有共同起源的基因,例如同是起源于珠蛋白的α珠蛋白、β珠蛋白和肌红蛋白。
蛋白质分类数据库(ProtoMap)
是对SWISS-PROT数据库中的全部蛋白质由计算机自动时行层次分类,把相关者聚集分极所得到的数据库。
蛋白质序列多重对齐分析及进化分析
如果发现一个未知蛋白质序列和较多不同和种属或同一种属的蛋白质序列具有较高的同源性(大于30%)那么提示待分析的蛋白质序列可能是相应家族的成员,从而可从分子时化的角度对蛋白质序列进行综合分析。
常用在线蛋白工具
BCM Search Launcher
蛋白序列二级结构预测综合站点,从此出发,输入蛋白序列,可以根据需要,使用各种在线预测工具,包括Coils、nnPredict、PSSP/SSP、PSSP/NNSSP、SAPS、TMp red、SOUSI、Paircoil、Protein Hydrophilicity/Hydrophobicity Search、SOPM,使用十分方便。。
DAS:蛋白跨膜预测服务器、输入蛋白序列,预测跨膜区域。