多元地址要素组合的地址匹配方法A method of address matching based on multiple address element combinations
吕欢欢,宋伟东
摘要(Abstract):
针对数字城市地理空间框架建设中地址匹配的具体需求和现存中文地址匹配方法中存在的问题,该文提出一种多元地址要素组合的地址匹配方法:分析地名地址数据的分词方法和作为参考数据的地址编码库的物理结构;给出组合策略和匹配流程,针对地址要素的不同重要程度分配权重,计算不同组合中各地址要素相似性匹配指数,并采用加权求和方式获得匹配总分;并以城市地址编码数据库为参考数据,工商领域监管对象地名地址数据为输入地址对提出方法进行实验和验证,与其他匹配算法对比的结果表明,提出算法有效、正确、灵活。
关键词(KeyWords): 数字城市;地址匹配;多元地址要素;地址分词;组合
基金项目(Foundation): 国家自然科学基金项目(41101452)
作者(Author): 吕欢欢,宋伟东
DOI: 10.16251/j.cnki.1009-2307.2015.03.020
参考文献(References):
- [1]李志刚,蒋捷,翟永,等.面向分布式服务聚合的“天地图”总体技术架构[J].测绘地理信息,2012,37(5):13-15.
- [2]张雪英,闾国年,李伯秋,等.基于规则的中文地址要素解析方法[J].地球信息科学学报,2010,12(1):9-16.
- [3]U.S.Census Bureau TIGER/Line.U.S.Census Bureau2009[EB/OL].http://www.cense=us.gov/geo/www/tiger.
- [4]Daniel W Goldberg,John P Wilson,Craig A Knoblock.From Text to Geographic Coordinates:The Current State of Geocoding[J].URISA Journal,2007,19(1):33-46.
- [5]程昌秀,于滨.一种基于规则的模糊中文地址分词匹配方法[J].地理与地理信息科学,2011,27(3):26-29.
- [6]于焕菊,齐清文,李云岭.街道的城市地址编码模型与实验[J].地球信息科学学报,2013,15(2):175-179.
- [7]孙存群,周顺平,杨林.基于分级地址库的中文地理编码[J].计算机应用,2010,30(7):1953-1958.
- [8]国家测绘地理信息局.CH/Z 9010-2011,国家地理信息公共服务平台地理实体与地名地址数据规范[S].北京:测绘出版社,2011:6-8.
- [9]赵阳阳,王亮,仇阿根.地址要素识别机制的地名地址分词算法[J].测绘科学,2013,38(5):81-83.
- [10]王旭阳,萧波.基于概念关联度的智能检索研究[J].计算机工程与设计,2013,34(4):1415-1419.