DrugBank数据库——小分子

这里写自定义目录标题

一、介绍

从DrugBank爬取小分子药物数据,并存入数据库中,由于每一个收录的分子,DrugBank都做了很详尽的描述,信息量非常大,因此将爬取到的信息分两张表保存:一张表(A表)保存基本药物基本信息和化学性质,另一张表(B表)保存与大分子(包括靶标蛋白、酶、转运蛋白)的相互作用。

A表字段

字段名类型解释说明
Compound_Idint化合物Id,化合物的唯一标识
Drug_namevarchar(200)药物名称
accession_numbervarchar(80)在DrugBank中的变化,以DB为开头
groupsVarchar(60)1:approved, 2:nutraceutical, 3:llliclit
4:Investigational, 5:withdrawn, 6:experimental
casVarchar(30)CAS号
weightfloat分子量
smilesVarchar(600)分子的smiles格式的字符串
Action_mechanismtext作用机制描述
Absorptiontext吸收过程描述
Protein_bindingtext蛋白结合率描述
metabolismtext代谢过程描述
Toxicitytext毒性描述
ex_solubleVarchar(150)实验测的溶解度,由于表述方式不同,只能记录其表述,后期需要训练时,再转化为“易容、可溶、微溶”等分类。该数据常常会空缺。
ex_logPfloat实验测得的logP值,常常空缺。
Pred_solubilityfloat由ALOGPS预测的水溶解度,单位为mg/ml偶尔空缺
Pred_logPfloat由ALOGPS预测的logP, 偶尔空缺
Pred_logSfloat由ALOGPS预测的logS, 偶尔空缺
Pre_Intestinal_absorptionint是否能通过肠胃吸收(预测值),-1:不吸收,1:吸收
Pre_bbbint是否能通过血脑屏障(预测值),-1:通不过,1:通过
Pre_CYP_2C9Varchar(40)是否抑制Pre_CYP_2C9
Pre_CYP_2D6Varchar(40)是否抑制Pre_CYP_2D6
Pre_CYP_2C19Varchar(40)是否抑制Pre_CYP_2C19
Pre_CYP_3A4Varchar(40)是否抑制Pre_CYP_3A4
ClassVarchar(100)分子的分类
Sub_classVarchar(100)分子的亚类,可用于相似结构的搜索

说明:MOL、SDF、3D-SDF、PDB、SMILES、InChI以文件形式下载后保存

B表字段

字段名类型解释说明
Item_idint记录的id
Compound_IdintId,化合物的唯一标识,与A表的Compound_Id对应
Interatction_targetvarchar(400)作用于大分子的名称
Target_kindint大分子类别,1:蛋白质, 2:核酸, 3:多糖
OrganismVarchar(50)大分子来源的物种
Action_typeVarchar(50)与大分子的作用方式,是激动还是抑制
Action_relaitonVarchar(30)作用的关系,是靶标还是代谢酶或是转运蛋白
Gene_nameVarchar(100)基因名称
Uniprot_idVarchar(150)大分子在www.uniprot.org数据库中的ID,通过这个id,可以在www.uniprot.org中查询到该大分子的详尽信息
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值