化合物脂水分配系数计算软件及比较研究
178
学报
Journal of China Phar maceutical University 2008, 39(2) :178-182
化合物脂水分配系数计算软件及比较研究
苏 笠, 杨 劲, 王友群, 王广基
(中国药科大学药物代谢与动力学研究中心, 南京210009)
3
摘 要 目的:介绍几种常用的化合物脂水分配系数计算软件, 。方法:从分子结构出发, 运用C LOGP 、ACD /LogP、Pallas 和Molins p irati on 4P 值, 。结果:本文选择的
4种计算软件均能比较准确的计算出化合物的l og P 值l og P 值, 有助于
计算机辅助药物设计。
关键词 定量构效关系; ; ; 分子结构; C LOGP; Pallas; ACD /LogP;Molinsp irati on 中图分类号 1000-5048(2008) 02-0178-05
I n tr o duc ti o n p a riso n o f so ft w a re s u sed i n ca l cu l a ti ng li p i d /wa te r
p a rtiti o n co effi c i en t o f com po und s
S U L i, Y ANG J in ,WANG You 2qun,WANG Guang 2ji
Center of Phar m acokinetics and D rug M etabolis m , China Phar m aceutical U niversity, N anjing 210009, China
3
Ab s trac t A i m :To intr oduce the available s oft w ares used t o calculate the li p id /waterpartiti on coefficients of compounds and t o compare the esti m ati on accuracy . M e tho d s:Based on the molecular structures selected, the values of l og P were calculated using s oft w ares CLOGP, Pallas, ACD /LogPand Molins p irati on, and the esti m a 2ti on accuracy was assessed one by one . R e su lts:The four s oft w ares could accurately calculate the values of l og P . Co nc l u s i o n:App licati on of these s oft w ares in the calculati on of l og P values of compounds facilitates computer 2aided drug design .
Key wo rd s QS AR; co mputer 2aided drug design; li p id /waterpartiti on coefficient; molecular structure; CLOGP;
Pallas; ACD /LogP;Molinsp irati on
脂水分配系数(l og P ) 是用来表示化合物的亲脂性、透过生物膜的性能及与受体(包括酶) 间疏水性结合力的一种参数。疏水性影响药物吸收、生物活性、疏水性药物受体相互作用、分子代谢变化
[1, 2]
毒性等, 在定量构效关系的研究中很重要。新药开发过程中, 可以所得定量构效和构动相关式为基础, 设计生物活性好并具有良好药动学参数的化合物。在分子设计阶段, 可以预先计算所设计分子的l og P 值, 进行虚拟筛选, 从而节省大量的时间和财力, 提高工作效率。总之, 用计算的方法得到化合物的l og P 值的目的之一就是为新药设计
[3]
服务。
1 基础与原理
脂水分配系数(l og P ) 为化合物在非水相中的平衡浓度与其在水相中的中性形式平衡浓度的比值的对数, 公式表达如下:
l og P =l og (c o /c w ) 其中, c o 和c w 分别表示化合物在非水相中的平衡浓度与其在水相中的中性形式的平衡浓度, l og P 值越大则脂溶性越强。
l og P 数值的获得有实验法和计算法两种。实
验法可靠, 但花费较大, 并需要预先合成化合物, 不能进行虚拟筛选; 计算法简便快捷, 但是计算结果不够精确。
3收稿日期 2007209216 3通讯作者 Tel:025-83271386 E 2mail:yangjingqw@2631
net
第2期苏 笠等:化合物脂水分配系数计算软件及比较研究
17
9
Log P 的计算方法有两种:一是通过有机化合物
的片断加和性来进行计算, 二是通过化合物其他物理化学参数以及其与脂水分配系数的内在联系来计算。
片断加和法的原理是将分子划分为基本片断, 每种特定的基本片断具有特定的贡献值, 整个分子的l og P 是所有片断的加和。片断加和法计算简便、快捷, 计算结果精度较高、适用范围广, 目前常用的脂水分配系数计算软件都是基于此原理开发的。2 计算软件介绍
, 结构出发, , 。
目前常用的CLOGP 软件、Pallas 软件的Pr oLogP 模块、ACD /LogP的I 2Lab 模块、SY BY L 软件的Cl ogP /CMR 模块和Molins p ira 2ti on 网络版等。本文主要介绍CLOGP 、Pallas 软件的Pr oLogP 模块、ACD /LogP模块和Molins p irati on 网络版4种计算工具。211 CLOGP 软件
CLOGP 是基于碎片常数加和法的原理, 1979年实现程序化, 中间几经修改, 1994年又有新版本(B i obyte 公司) , 商品名为Mal ogP T M , 目前发展为B i ol oom 。CLOGP 曾经是脂水分配系数计算领域的
黄金标准, 随着计算化学的发展, 目前流行的计算软件准确度比CLOGP 有明显的提高。212 Pallas 软件
Pallas 软件是CompuD rug 公司的产品, 用于计算l og P 的部件称作Pr oLogP 。l og P 的计算分为5
[4]
个步骤:首先对结构式进行分解, 然后探查碎片相互作用和邻近效应的测定根据数据库, 计算各碎片的贡献值及它们之间的相互影响, 最后把各个数据库计算出来的值通过公式计算出综合l og P 值。
Pallas 软件中的Pr oLogP 默认计算公式为:l og P combined =01019l og P CD I 2Rekker +01235l og P ANNLogP +01746l og P ANNLogP2005
这是Compu D rug 公司根据约8000个化合物的实验数据, 通过神经网络方法进行数据分析得出的经验公式, 其中CD I 2Rekker 、ANNLogP 和ANNLogP 2005为默认数据库。
由Pr oLogP 计算的l og P 值是根据碎片数据库直接计算而得, 碎片数据库的容量、构成、权重直接
影响最后的计算值。目前, Pr oLogP 710有3个根
据不同方法建立的基本数据库:CD I 2Rekker 、A t om ic 和A t om ic 5。
CD 2Rekker 数据库是根据Rekker 对化合物疏
[5]
水性碎片的研究成果建立的, 其中包括约1000个化合物的实验值。此外, 一些在这些化合物的基, 从而使该方法的。
。
A t om ic 5数据库也是把原子当作碎片来进行计算的, 它和Rekker 数据库一样, 加入修饰步骤, 从而使其预测更准确。该数据库有如下特点:加入了新的原子类型; 碎片的相互作用中加入了离域作用、氢键作用等; 贡献值通过线性回归进行重新计算。
此外还有A t om ic 6数据库、ANNLogP 和ANNLogP 2005数据库。
Pr o LogP 一个显著特点就是, 进行具体工作时, 可以根据经验选择数据库并决定他们的权重值, 这可以极大的提高预测系列化合物l og P 值的准确性。213 ACD /LogP(I 2Lab ) 软件
ACD /LogP用于计算l og P 的程序为ACD /[5]
LogP 。ACD /LogP计算中性分子的l og P 值大部分误差都小于±013的范围。该算法是建立在18400个l og P 实验值的数据库基础上, 拥有多于1200个基本功能基团。
21311 ACD /LogP计算步骤 首先将化合物分解成多个碎片, 然后在内部数据库中搜索相同的碎片, 如果有内部数据库中不存在的碎片, 系统将运用二级算法估算该碎片与数据库中碎片的差值, 最后系统将权衡整体的互变异构体、离子平衡, 计算误差的影响, 得出最终结果。21312 ACD /LogP的特性 同时显示化合物结构和l og P 计算结果; 建立计算过程备忘, 分子中用于计算l og P 的各个原子碎片的贡献值均有显示, 如果有对计算结果有重要影响的结构因素, 例如互变异构体, ACD /LogP 会在结果中显著地显示出来; 该软件同时还可以计算Polar Surface A rea (PS A ) 、Freely Rotatable Bonds (FRB ) , 和L i p inski ′s “Rule 2of 25”参数; 能评价中性分子的生物浓度指数(bi oconcentrati on fact or ) 和吸收系数; 可以将新的数值加入到数据库中, 提高预测的准确性; 图片数
180
学报 Journal of China Phar m aceutical U niversity 第39卷
据库评价趋势; 能同时计算化合物的各种属性, 在
历史窗口一起显示, 且能同时以S Dfile 输出多个化合物计算结果; 可以将新的数值加入到数据库中, 提高预测的准确性。21313 计算限制 能用于计算的化合物, 其结构中只能包括下列原子:H 、O 、S 、P 、N 、F 、CL 、B r 、I 、Se 、Si 、Ge 、Pb 、Sn 、A s 和B; l og P 不能计算带电荷的分子(两性氨基酸分子、多肽分子、与氧结合四价氮结构例外) ; 能计算的化合物所含原子不能多于
[5]
255个; 程序不能辨别立体异构体。214 Molins p irati on 网络版
Molins p irati on 网络版预测l og 是:m ib batch molecule p r [6]
。它通过超过12000系统, 来预测恰当的l og P 值。在该系统中, 通过35个小的基本碎片, 185个大的碎片来表征分子内氢的键合对l og P 的贡献和电荷相互影响。Molin 2s p irati on 计算l og P 的方法非常强大, 它可以预测几乎全部的有机分子和大多数有机金属分子。
通过对12202个类药性比较好的化合物进行回归分析, 其复测定系数为0. 944, 标准误差为01428, 平均绝对误差为01328, 模型比较稳定; 对于12202个分子, 5015%的l og P 值预测误差小于
Table 1 Calculati on of l og P values by 4s ofl w ares
Compd .
Acetazola m ide Acycl ovir Amphetam ine A s p irin A tr op ine Benazep ril Benz ocaine Bep ridil Carbenicillin Carbenoxol one Chl orhexidine Chl or phenira m ine Dexa methas one D iltiaze m D icoumar ol Fluoxy mester one Fenop r ofen
Experi m ental value
-0122-[***********][***********][***********][***********]2146
ACD /LogP-[***********][***********][***********][**************]6
0125, 8012%的l og P 值预测误差小于015, 9615%
的l og P 值预测误差小于110, 只有315%的误差大于110, 准确性也较好。可用于新化合物的预测。
Molins p irati on 运用很广泛, 其计算出来的l og P 值被证明与不同药物体内转运性质有很好的相关性, 它计算的稳定性和良好的预测能力使它在ZI N C 数据库(htt p://zinc 11org/) 虚拟筛选。
, 预测化合物数目100以内。3 计算软件准确性比较
l og P 的原始值参见参考文献[7], 该网络数据
库提供了约4300种上市药物和类药性好的化合物的具体参数。从中随机选取了100个药物, 用CLOGP 、ACD /LogP、Molins p irati on 和Pallas 这4种软件计算l og P , 结果见表1。
由于篇幅关系, 表1中仅附上30个化合物的计算数据; 表1中加下划线的数据是与实验值最接近的计算结果; ACD /LogP输出结果含有置信区间, 这里仅取其中值, 例如:Ampheta m ine (实验值=11799) , 计算结果为1181+/-0120, 本文选取平均值1181。
Molins p irati on
-11146-[***********][***********][***********][**************]5Pallas -[***********][***********][***********]54
CLOGP -111309-[***********][***********][***********][***********][***********]212294
……
I ndapam ide Mephenyt oin Met ocl op ra
m ide
第2期苏 笠等:化合物脂水分配系数计算软件及比较研究
181
(Continued )
Compd . Mexiletine Pentaz ocine Quinacrine Ra m i p ril R 2mephobarbital Succinic acid Test oster one Trifluridine Tri m ep razine W arfarin
Experi m ental value
[***********]92-01603160-[1**********]1
ACD /LogP[***********]7101014198Molins p irati on
[***********]92-0165531245-0197441Pallas [1**********]5-01803101CLOGP [***********]115399-[***********]
值, 系数是指4[8, 9]
系数。由图1, 计算值和原始值之间得出了较好的相关关系。4种计算软件的标准偏差在0147到0186之间, 稍大于通常认为的实验值的误差0140, 不过由于选取的比较样本只有100个, 4种软件给出的结果是相当令人满意的。
Table 2 Data comparis on of the different s oft w ares Na me CLOGP ACD /LogPMolins p irati on Pallas
a
C LOGP 、ACD /LogP、Molins p irati on 和Pallas 的
MAE a
0. [***********]
ST D b [***********]5
r
[***********]61
Mean abs olute err or; b Standard deviati on
计算值中最接近原始数据的个数分别为19、23、31和27; 误差≤±018的数据数分别为65%、81%、84%和79%;误差≤±015的数据数分别为45%、53%、63%和59%。综合表2的结果可以看出:AC D /LogP、Molins p irati on 和Pallas 这3个软件的计算准确度比C LOGP 有明显的提高; 就这100个化合物而言,Molins p irati on 的计算准确度是最好的。
另外我们考虑一些特殊化合物作为测试样本, 来比较这几种软件的计算准确度及适用范围, 这里选取了金属化合物进行计算, 结果见表3。
通过回归分析比较,Molins p irati on 的标准偏差和相关系数分别为1135, 01959; CLOGP 的标准偏差和相关系数分别为12128, 01851。Molins p irati on 的计算准确度优于CLOGP 。而ACD /LogP和Pallas 不能计算含金属的化合物。
Table 3 Log P values of metallic compounds Compd . [1**********]ST D
r
Experi m ental
ACD /LogPMolins p irati on
values
1196-0155-2108-2170-[**************]5-41221187
----------1184-0137-1172-2193-[**************]3-[**************]59
Pallas CLOGP ----------1191-1172-2189-3122-[**************]41-1136-[1**********]85
1:22(Ethyl m ercuri 2thi o ) benz oic acid; 2:3
2Mercuri 242a m inobenzenesul 2fonam ide; 3:Adenosine monotungstate; 4:Adenosine 25′2ditungstate; 5:
F i gure 1 Si m ulati on of experi m ental l og P and p redicted l og P by different s oft w ares
A:ACD /LogP;B:Molinsp irati on; C:Pallas; D:CLOGP
Cis p latin; 6:Ferricr ocin ir on; 7:Delta 2bis (2, 2′2bi pyridine ) 2(52methyl 2222′2bi pyridine ) 2C22ada mantane ruthenium (Ii ) ; 8:Delta 2bis (2, 2′2bi pyridine ) i m idaz ole os m ium (Ii ) ; 9:Desferal; 10:Mercury dii odide
18
2
学报 Journal of China Phar m aceutical U niversity 第39卷
4 讨论与结论
定量构效关系的研究工作时, 要有清醒的认识。
参考文献
[1] 卡米尔・乔治・维尔穆特. 创新药物化学[M]1第2版1广
本文随机选取的100个化合物其相对分子质
量基本都在400以内, l og P 值介于-41102~6196。对这100个化合物而言,Molins p irati on 计算结果更准确一些。
CLOGP 曾经是脂水分配系数计算领域的黄金标准, 目前常用的其他计算软件都是在其算法基础上发展而来, 计算准确度有明显的提高。
Pallas 软件拥有多个数据库, 根据经验选择数据库并决定其权值, 化合物计算时可根据经验, 值, Log D 计算功能, ACD /LogP , 在实际工作中, 对虚拟合成的有机分子进行筛选时可利用ACD /LogP 的置信区间, 降低误筛选率。我们在工作中还可以将新的实验数据加入数据库, 提高计算准确性。
Molins p irati on 网络版几乎可以计算全部的有机分子、大多数有机金属分子和带有电荷的分子。实际工作中碰到特殊化合物时可使用该软件。总之, l og P 计算值有误差, 这种误差是不可避免的, 计算值不能替代实验值。在应用该参数进行
州:广东世界图书出版公司, 2005:447-4791
[2] 王连生(W ang LS ) , 韩朔睽(Han SK ) , 孔令仁(Kong LR ) ,
等. 分子结构、形式与活性[M]北京:化学工业出版社,
1997:26-401
[3]陈凯先Chen (J , 嵇汝运(J i RY ) 1计
[M]1上海:上海1
[4P (版本号3151112, CompuD rug 公司) 1[5] Rekker RF, DeKort HM. The hydr ophobic frag mental constant
[J ].Eur J M ed Che m , 1979, 14:479-488.
[6] Robin Martin, Sanjivanjit K . Bhal . ACD /Labsfreeware short
start tut orial [EB /OL].[7] Anony mous .
(200723225) [2007210220].htt p://
www . acdlabs . com /download /docs/l ogp shor start tut orial . pdf .
Molins p irati on app licati on tut orial [EB /OL].
(200721021) [2007210222].www . molins p irati on . com. [8] W ishart DS, Knox C, Guo AC, et al 1, D rug Bank:a comp rehen 2
sive res ource for in silico drug discovery and exp l orati on [J ].
N ucleic A cids Res , 2006, D668-D6721
[9] 孙振球(Sun Z Q ) 1医学统计学[M]1北京:人民卫生出版社,
2002:342-3461
[10]王静龙(W ang JL ) 1现代外国统计学优秀著作译丛———应用
线性回归[M]1第二版, 北京:中国统计出版社, 1998:20
-651
・会 讯・
第九届全国青年药学工作者最新科研成果交流会
为广泛交流我国青年药学工作者的最新科研成果, 促进青年药学工作者健康成长, 加速培养药学科技人才, 为青年学者提供学术交流的机会和平台, 由中国药学会主办的第九届全国青年药学工
作者最新科研成果交流会将于2008年5月底在北京市召开。联系方式:
中国药学会学术部:孙文虹、鲁毅、王爱国
地址:北京市朝阳区建外大街4号建外S OHO 九号楼18层1802(100022)
电话:010-58699275-819/820传真:010-58699125E 2mail:sun wenhong2002@163. com 或yxhwag@s ohu . com