宝塔服务器面板,一键全能部署及管理,送你10850元礼包,点我领取

这期内容当中小编将会给大家带来有关如何解析IMex和IntAct数据库,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。

蛋白质相互作用的数据库非常的多,比如DIP, MINT, IntAct, BioGRID等,不同数据库中的信息存在了大量的冗余,而且在不同数据库之间进行检索也非常的费力。

为了减少不同数据库的冗余,最大化提升数据存储和检索的效率,由多个数据库的开发团队和维护者共同参与成立了一个委员会,名字叫做international molecular exchange consortium, 简称IMEx, 该委员会致力于将不同数据库中的信息合并,减少冗余并提供了一个统一的查询工具

该委员会的成员示意如下

如何解析IMex和IntAct数据库-风君雪科技博客

如何解析IMex和IntAct数据库-风君雪科技博客
该项目的地址如下

http://www.imexconsortium.org/

通过官网的检索框,可以方便的检索各个成员数据库中的内容,示意如下

如何解析IMex和IntAct数据库-风君雪科技博客

tp53为例,检索结果如下

如何解析IMex和IntAct数据库-风君雪科技博客
点击IMEx的链接,可以看到如下所示的表格

如何解析IMex和IntAct数据库-风君雪科技博客

采用了MITAB格式来展示蛋白质相互作用信息,通过左上角的Download按钮可以进行下载,通过IMEx的官网,我们可以方便的查询某个蛋白的相关作用网络信息的,但是下载数据并不是非常的方便,如果要下载数据,还是要借助IntAct数据库。

IntAct数据库是IMEx的成员数据库之一,目前该数据也整合了IMEx的所有数据,网址如下

https://www.ebi.ac.uk/intact/

在线检索功能肯定是有的,如下所示,支持多种查询方式

如何解析IMex和IntAct数据库-风君雪科技博客

在检索结果的页面,可以自定义展示的列信息,也可以选择对应的格式进行下载,示意如下

如何解析IMex和IntAct数据库-风君雪科技博客

通过Graph按钮,还可以显示查询蛋白的相互作用网络

如何解析IMex和IntAct数据库-风君雪科技博客

和string数据库相比,IntAct的检索功能也有其局限性,只适用于查询单个蛋白的相互作用网络,无法查询输入的多个蛋白之间的相互作用网络。如果要查询多个蛋白之间的相互作用网络,只能自己写脚本从整个相互作用网络中提取信息,官网提供了下载功能,示意如下

如何解析IMex和IntAct数据库-风君雪科技博客

提供了多种格式的下载,主要有XMLTAB两种格式, PSI-MI格式就是xml格式的文件,PSI-MI TAB就是\t分隔的文件,TAB格式的内容相对直观,而XML格式适用于程序处理。

对于蛋白质相互作用网络而言,String数据库的使用更加简单,更加的人性化,所以知名度更高,而IMEx和IntAct的使用有一定的技术门槛,但是可以作为String数据库的一种补充,能够得到更加丰富的信息。