大游中国股份有限公司-BG大游官方网站-DNA存储纠错编码技术专家

一个基于软件设计模式的生物信息存储模式

作者:小编 日期:Jul.17.2025 点击数:  

  

一个基于软件设计模式的生物信息存储模式(图1)

  多年高中历史授课经验,具有相应专业背景,善于与学生沟通,善于调动课堂气氛。

  内容提示:第27卷第7期2010年7月计算机应用研究Appl i cati onResearch ofComput emV01.27 No.7J ul .2010一个基于软件设计模式的生物信息存储模式杨进才,赵森,刘小姣,胡金柱( 华中师范大学计算机科学系,武汉430079)摘要:为了消除各生物信息学数据库之间的模式异构问题,根据生物信息的存储现状,提出了一种存储模式。该模式从物种、类别、基本信息、功能和测序方法五个方面对数据中的信息进行抽象。运用了软件设计模式的思想.通过“ 派生” “ 组装” 等面向对象的方法生成与模式对应的XML据之间的关系更加紧密,而且可以形成交叉索引的完整生物信息体系。关键词:生物信息抽象;...

  第27卷第7期2010年7月计算机应用研究Appl i cati onResearch ofComput emV01.27 No.7J ul .2010一个基于软件设计模式的生物信息存储模式杨进才,赵森,刘小姣,胡金柱( 华中师范大学计算机科学系,武汉430079)摘要:为了消除各生物信息学数据库之间的模式异构问题,根据生物信息的存储现状,提出了一种存储模式。该模式从物种、类别、基本信息、功能和测序方法五个方面对数据中的信息进行抽象。运用了软件设计模式的思想.通过“ 派生” “ 组装” 等面向对象的方法生成与模式对应的XML据之间的关系更加紧密,而且可以形成交叉索引的完整生物信息体系。关键词:生物信息抽象;生物数据存储模式;设计模式;可扩展标记语言中图分类号:Q811.4文献标志码:A 文章编号:10013695( 2010) 07-2598-04doi :10.3969/j .i asn.1001-3695.2010.07.055Storage patternof bi oi nformati onYANG J i n-cai ,ZHAO Sen,LIU( Dept.ofComputer Sci ence,Huazl wngNormalAbstract:For el i mi nati ng the pattern heterogeneous between bi o-i nformati onaccordi ng to the current storage status of bi ol ogi cal data,whi chti es,category,basi c i nformati on,functi on,and sequenci ngmethod.Generatedconceptsofdesi gn patternsand 80meobj ect ori entedmean9 l i ke“ deri vi ng” and“ assembl i ng” .Thi sonl ymake therel ati onshi psbetween bi ol ogi cal data more cl ose,al socross.i ndex.Key words:bi oi nformati on abstracti on;bi ol ogi cal data storage目前,越来越多的生物基因( 组) 已测序完成,生物信息学数据呈指数增长。当前主流的生物信息数据库包括核酸序列数据库(GenBank、EMBL、DDBJ 等)、蛋白质序列数据库(PIR、PROSITE等) 、三维分子结构数据库( PDB、SCOP等) ⋯ 。由于这些数据库中数据的存储模式千差万别,使得生物信息学数据中存在严重的模式异构现象。模式异构是指同样的生物信息在不同的数据库中采用不同的属性集与不同的结构。因为目前国际上还没有形成生物数据存储模式的统一标准,对于模式异构问题尚无很好的解决方法瞄J 。关于生物信息学数据的整合也存在大量的讨论和研究,文献[ 3,4] 中阐述了生物信息学数据整合的困难所在。但绝大多数研究都是在现有数据存储模式的基础上加以整合,争取较大限度地对其进行数据挖掘,虽然在一定程度上解决了数据的语法和语义异构,但所得结果并不能完全满足大多数领域学者的要求。本文提出了一种基于软件设计模式思想的生物信息学数据的存储模式SCIFS,其代表从五方面抽象生物信息学数据中所含信息( speci es,care-gory,i nformati on,functi on and sequenci ng) ,能最大程度地解决数据存储的模式异构问题,随之从根本上避免了非同源数据间的语法及语义异构问题。本文使用XML( extengi bl e markupl anguage,可扩展标记语言) 描述SCIFS的具体实现。方便数据之间的交流与集成。当前流行的生物信息学数据库中大多都已提供了XML格式的数据下载哺.7 J ,但均为“ 单方向” 的,即只有当用户需要XML格式的生物数据时,各大数据库才提供XML文件,但在各数据库之间仍然存在着“ 数据鸿沟” 。而要从根本上解决这些问题,就必须充分发挥XML的特点,从数据的存储层面杜绝数据异构现象。1.2刈L在新型存储模式中的优势本文提出的SCIFS存储模式( 下文将进行详细描述) 借用了软件设计模式的思想,将数据结构模块化,利用派生、继承等手段生成灵活多变且结构统一的数据存储模式。XML对数据结构的描述和本身灵活多变的特点,使其十分适用于这种组装模式,为新型存储模式的应用提供了技术基础。收稿日期:2009.1210;修回日期:2010-Ol -18作者简介:扬进才( 1967.) ,男,湖北成宁人。教授,项导,博士.主要研究方向为生物信息学、现代数据库理论与技术;赵森( 1984 ) ,男,山东青岛冬,硕士研究生,主要研究方向为生物信息学( .cn) ;刘小姣( 1982 ) ,女,湖北麻城人,硕士研究生,主要研究方向为移动数据库;胡金柱( 1947-) ,男,湖北宜昌人,教授,博导,主要研究方向为分布式信息系统、软件工程.BG大游娱乐平台BG大游娱乐平台