计算生物学讲解
- 格式:doc
- 大小:3.61 MB
- 文档页数:19
第一讲:学科间的关联
• 首先锁定研究对象:分子 + 环境,或者更大的体系 – 分子:单个或几个分子 ,千万个分子 – 环境:多个分子,连续介质 • 计算途径:原理 + 算法
– 原理:物理学,化学,生物学 – 算法:数学、统计学
同样的几个问题 1. 包含什么?
tRNA, mRNA, protein, water 2. 有何关联?
tRNA-mRNA; mRNA-protein 3. 可否调控?
tRNA 的移动过程; protein 的形成 4. 计算模型?
水分子;离子;药物小分子等
不同体系,不同方法 Multiple proteins
蛋白质内部,buried molecule, loop flipping
蛋白质之间:binding sites Rotation H-bonding
Electrostatic interaction Van der Waals interaction
精确的计算方法,快速的近似方法
数学、统计学
• 数字拟合,分类与回归,贝叶斯推断,蒙特 卡罗方法,马尔可夫链 • 微分方程解析解与数值解,矩阵与数值计算
• 集合,拓扑学,图论,群伦,排列组合
物理学 经典力学 量子力学 相对论处理 热力学 统计力学 电动力学 凝聚态理论 计算机科学
• Linux 操作系统: – Serial computing, – Distributed or parallel computing (并行计算), MPI – Linux scripts, sed, awk – Perl, Python, Fortran, C++, Java
• MySQL, PHP, Apache • Windows 视窗:MATLAB, R, Java,
生物信息学Bioinformatics • 数据挖掘data mining
• 机器学习machine learning/artificial intelligence
– 算法:决策树Decision tree, 随机森林Random forests, 关联式规则 Association rule, 人工神经网络Artificial neural networks, 遗传编程 Genetic programming, 诱导逻辑编程Inductive logic programming, 支持 向量机Support vector machines, 聚类Clustering, 贝叶斯网络Bayesian networks,系综学习Ensemble learning, …
机器Computers
• 微机类: Pymol, Rasmol, R, Matlab, Mathmatica
• 工作站: Gaussian, CHARMM, DOCK CPU 计算,GPU 图形 • 集群计算机Cluster: MPI
硬盘阵列RAID (redundant array of independent disks)
应用: 1. 理解:
实验数据,光谱峰位置 探究反应机理 2. 预测:
分子和材料的结构与性能 辅助化学合成
药物设计、催化剂设计 结构-性质关系QSPR 结构-活性关系QSAR
方法:
1、量子化学: Gaussian 从头算、半经验方法 密度泛函
分子反应动力学、带结构 2、分子动力学: CHARMM 蛋白质模拟
量子/经典混杂方法 3、分子对接: DOCK 药物设计
–应用:模式识别pattern recognition
•分类Classification, 回归Regression, …
•可视化visualization
方法Methods
•信息Information
databases, data mining, web technologies, online query, sequencing, alignment, discovery, judge,
•理解Understanding
image processing, visualization, statistics, data fitting, modeling,
•预测Prediction
interaction, energy terms, scoring function, simulation, structure, superposition
第二讲:经典力学
一、与研究对象如何关联?
二、现有的方法合理吗?
三、你自己关心的问题如何描述?
torsion
Dihedral δ= 0,π;cos(δ) cos(m φ)=cos(m φ+δ)
第三讲:分子间相互作用•有哪些分子间相互作用?•能量表达项重叠吗?
•加和与权重?
静电
第四讲:打分函数1
基于力场的打分函数
The force-field-based scoring functions •打分函数的本质是什么?
•打分函数正确吗?
•如何减小误差?
第五讲:打分函数2
基于力场的打分函数
计算能量与距离的变化
The force-field-based scoring functions
•有多少途径来计算打分函数?
•整体计算还是分解成能量项来计算?
•能量项之间的物理意思重复吗?
第六讲:打分函数3
三种打分函数
• 1, Force-field-based scoring functions • 2, Empirical scoring functions
•
3, Knowledge-based scoring functions