|
分子生物学数据库及相关软件的开发利用 |
|
构象参数数据库DSSP、按三级结构分类的同源蛋白质数据库HSSP、按三级结构分类的蛋白质家族数据库FSSP各占140MB、83MB、270MB存储空间。PDBFinder是用于查询PDB的数据库,占空间较小,只有4兆。其他数据库一般都在几兆到一两百兆之间,如最新SwissProt第36期包括74019条序列,共有26 840个氨基酸,占142MB存储空间。
2 应用软件 在针对生物信息数据库开发的软件中,有一些为商业性软件,用于UNIX系统的常用序列分析软件是 GCG和Staden。这些软件功能齐全,并在不断更新。不少非商业性软件仅需要很低的费用甚至免费即可获得,这些软件有些功能比较单一,有些功能比较丰富;有些使用Xwindow界面,有些使用WWW界面,而有些以命令行(command line)方式运行。使用Xwindow界面的软件,一般运行在UNIX操作系统环境下的工作站或服务器上,用户需要有帐户,并要在装有Xterminal仿真软件的终端或PC机上操作,其优点是软件具有丰富的菜单结构以及可以产生高质量的图形输出。 对于WWW界面的软件,通常不必在服务器上开设帐户,可在任何装有WWW浏览器的机器上访问,这给用户软件的使用及管理都带来便利。由欧洲生物信息研究所开发的SRS(Sequence Retrieval System)是以WWW界面运行的数据库检索系统〔4〕,其主要功能是将所有数据库建立参照(cross-references)索引,用户可通过输入查询代码、编号、物种来源、说明、文献、作者、日期、关键词等信息对所有已建立索引的数据库进行检索,从而得到用户所需的序列或相关内容。SRS具有快速、详尽的查询功能,使之成为流行的数据库查询软件。需要注意的是,SRS通过建立索引来加速检索,同时也产生了比较大的索引文件,这些索引文件会占据1GB以上的存储空间,所以用户在决定存储空间大小时要予以考虑。 对于以命令行方式运行的软件,用户不仅要在UNIX环境下的工作站或服务器上有帐户,而且用户还要熟悉命令及各种参数的使用,以及软件运行的各种环境变量的设置。如果能将这类软件增加WWW接口,即以WWW界面方式运行,会给用户带来极大的方便。例如,BLAST是由NCBI开发的的数据库搜索软件,其典型的命令行运行方式为:blastall -p 程序名, -d 数据库, -i 查询序列, -o 查询输出。实际上, 此命令行还可以加入更多的参数,通常那些参数都使用缺省值,所以不在命令行上出现。如果要进行更加严谨合理的搜索,就要在命令行上对那些参数进行调整。而以WWW界面方式运行的BLAST则把所有这些参数作成选项,用户可以在任何一个浏览器上通过调整选项取值对输入的序列进行重复搜索,并可在浏览器上直接得到满意的结果。与BLAST类似的命令行软件还有很多,为它们设计WWW用户界面,是对这类软件很好的集成,从而更便于用户使用。
上一页 [1] [2] 上一个医学论文: 家蚕分子连锁图谱的构建及分子标记育种研究进展 下一个医学论文: 一种简便 快速的大肠杆菌质粒转化方法
|
|
|
|
|
|
|