高维空间数据索引技术研究Research on index technology of high dimensional spatial data
夏宇,朱欣焰
摘要(Abstract):
目前空间数据相似性查询有着广泛的应用需求,解决相似性查询问题的一项关键技术就是高维空间数据索引。从分析高维空间数据的分布特性入手,探讨相似性查询中的高维空间数据检索问题,在此基础上,提出一种针对相似性查询的高维空间数据索引的分类方法,将高维空间数据索引分为三类:向量空间树型索引、基于向量近似的索引以及基于距离的索引,这种分类初步理顺了高维空间数据索引与相似性查询的关系,并以各类方法的代表性索引结构为例,分析指出各类高维索引方法的实现机理及其适应性,为相似性查询中索引技术的研究奠定了基础。
关键词(KeyWords): 相似性查询;向量空间;度量空间;向量近似;高维索引
基金项目(Foundation): 国家973计划资助(2006CB701305)
作者(Author): 夏宇,朱欣焰
参考文献(References):
- [1]Christian Bohm.Searching in high-dimensional spaces:In-dex structures for improving the performance of multimedia databases[J].ACMComputing Surveys,2001,33(3).
- [2]Christian M.Garcia-Arellano.Quantization Techniques for Similarity Search in High-Dimensional Data Spaces[D].Ph.D thesis.Toronto:University of Toronto.2002.
- [3]崔江涛.高维索引技术中向量近似方法研究[D].西安:西安电子科技大学,2005.
- [4]叶航军.面向大规模图像库的索引和检索机制研究[D].北京:清华大学,2003.
- [5]Gonzalo Navarro.Searching in metric spaces by spatial ap-proximation[J].The VLDB Journal2002,11:28-46.
- [6]Jinhua Li.Efficient similarity search based on data distri-bution properties in high dimensions[D].Ph.D thesis.Michigan:Michigan State University.2001.
- [7]R.Weber,H.J.Scheck,S.Blott.A quantitative analysis and performance study for similarity search in high di-mensional spaces[C]//Proceedings of the24th Inter-national Conference on Very Large Data Bases(VLDB'98),NewYork,USA,1998:194-205.
- [8]Stefan Berchtold,Christian Bohm,H V Jagad-ish.Independent Quantization:An Index Compression Technique for High-Dimensional Data Spaces[C]//San Diego:Proc.of the16th Int.Conf.on Data Engi-neering(ICDE'00),Ca California:IEEE Computer Science Society Press.California,USA2000:577-588.
- [9]董道国.高维数据索引结构研究[D].上海:复旦大学,2005.