利用泰森多边形的点实体匹配算法Point entity matching algorithm based on Thiessen polygon
吴建华,万洋洋
摘要(Abstract):
针对众源地理数据中的同名点实体之间存在距离、方向等非一致性偏差,导致匹配困难的问题,该文提出了基于泰森多边形的点实体匹配算法。利用相匹配的点实体数据集其对应的泰森多边形具有较高的对应关系这一特点,将不确定的点与点之间的匹配转化为匹配度更高的对应泰森多边形的匹配。首先统计出被彼此泰森多边形包含的点对,根据点对的距离概率分布,计算出距离阈值作为确认同名实体的条件之一;然后将泰森多边形的位置及形状相似性作为匹配条件二;最后将相似度最高的实体确认为同名实体。通过实验与现有的几种点实体匹配算法进行了比较,结果表明,该算法具有较高的查全率和查准率,且普适性强。
关键词(KeyWords): 形状相似度;实体匹配;数据融合;泰森多边形;众源地理数据
基金项目(Foundation): 国家自然科学基金项目(41201409,41261086);; 江西省教育厅青年科学基金项目(GJJ1220);; 鄱阳湖湿地与流域研究教育部重点实验室主任开放基金项目(ZK2013008)
作者(Author): 吴建华,万洋洋
DOI: 10.16251/j.cnki.1009-2307.2015.04.022
参考文献(References):
- [1]Saalfeld A.Automated Map Conflation[D].Washington D C:University of Maryland,1993:1-10.
- [2]李德仁,龚健雅,张桥平.论地图数据库合并技术[J].测绘科学,2004,29(1):1-4.
- [3]张桥平,李德仁,龚健雅.地图合并技术[J].测绘通报,2001(7):6-8.
- [4]张桥平.地图数据库实体匹配与合并技术研究[D].武汉:武汉大学,2002:1-10.
- [5]刘东琴,苏山舞.多空间数据库位置匹配方法及其应用[J].测绘科学,2005,30(2):78-81.
- [6]Beeri C,Kanza Y,Safra E,et al.Object Fusion in Geographic Information Systems[C]//Proceedings of the30th VLDB Conference.Toronto,2004:816-827.
- [7]Walter V,Fritsch D.Matching Spatial Data Sets a Statistical Approach[J].Geographical Information Science,1999,13(5):445-473.
- [8]童小华,邓愫愫,史文中.基于概率的地图实体匹配方法[J].测绘学报,2007,36(2):210-217.
- [9]Cobb M A,Chung M J,Foley III H,et al.A Rule-based Approach for the Conflation of Attributed Vector Data[J].Geo Informatics,1998,2(1):7-35.
- [10]吴建华.顾及环境相似的多特征组合的实体匹配方法[J].地理与地理信息科学,2010,26(4):1-6.
- [11]吴建华,付仲良.数据更新中要素变化检测与匹配方法[J].计算机应用,2008,28(6):1383-1386.
- [12]Fu Zhongliang,Wu Jianhua.Entity Matching in Vector Data[C]//The 21st ISPRS Conference,Beijing,2008,37,Part B4:1467-1472.