联系人:
所在地:
由于XML文档本身的结构特性,使得在应用关系系统管理XML数据的时候面临着数据冗余、查询效率低下等问题。对此,我们以构建Native XML数据库为目标,从XML数据的存储、编码、索引、查询代数及优化等方面进行了系统深入的研究。 (1)Native XML的存储方法:基于文档模式信息的聚簇子树存储策略。其原型系统OrientStore发表在VLDB2003。Athena Vakal等人在IEEE Computer Society上的文章指出我们的方法在好几个新的应用中具有明显的优势。 (2)XML数据的编码方法:针对不同特征的XML数据和应用环境提出了一整套预留算法和编码更新算法。该成果发表在WWWJ2005第一期和软件学报上,被认为是研究XML编码更新问题的重要工作。 (3)XML数据的索引方法:提出了基于序列(XSeq)的XML数据索引方法。论文发表在ICDE2005,其演示系统XSeq发表在SIGMOD2004。该工作随即被VLDB2005两篇论文引用,IEEE Internet Computing9(2)认为该工作是序列索引的代表性工作,该工作目前被引用11次,Bartley等在其文章中指出我们的方法在索引XML文档的时候采用了完全不同的方法,K.Hima Prasad等在其文章中指出我们的工作由于具有整体查询处理的特性而变得越来越重要。 (4)查询代数和优化:提出了OrientXA XQuery查询代数。该方面的工作发表于WAIM2004、软件学报和计算机研究与发展。 (5)原形数据库系统——OrientX:设计并实现了自己的Native XML数据库系统OrientX,并于2004年5月在W3C上发布。目前,该系统已被W3C收录在XQuery实现列表中并得到世界各地五十多个国家和地区的研究者的关注。 该项目先后在VLDB2003、SIGMOD2004、ICDE2005、DASFAA2003、WWWJ、软件学报等会议和刊物上均有论文发表,共计30多篇,被来自VLDB2005、IEEE Internet Computing9(2)、SIGMOD WebDB、CIKM2005、EDBT2005、DKE2005等国际会议和刊物引用18次。在OrientX被W3C收录后不久,希腊国家技术大学的Timos Sellis教授即主动与我们联系并得到了科技部“基于context的XML数据管理研究”项目的支持。其他国际交流与合作涉及新加坡国立大学数据库实验室,IBM TJ Walton等。2006年11月的“Dagstuhl Seminar on XQuery Implementation Paradigms”会议主席在邀请函中特别指出OrientX系统的研究对于本领域的研究工作来说是一个重要贡献(Your native XML database system OrientX is clearly recognized as a highly significant contribution in this research area)。