贪心算法的地理加权回归特征变量选择方法An approach of characteristics variable selection of geographically weighted regression based on greedy algorithm
赵阳阳,刘纪平,张福浩,仇阿根
摘要(Abstract):
针对建立地理加权回归(GWR)模型时,无法直接应用普通线性回归(OLR)常用的特征变量选择方法,且计算过程较复杂的问题,该文基于贪心算法原理,通过引入Akaike信息法则,设计了适用于GWR的特征变量选择方法:逐个引入或删除特征变量,判断该变量对模型置信水平影响程度,根据评价准则决定该变量的取舍,最终实现模型外没有关系强的变量、模型内没有关系弱的变量。实验结果表明,比较基于OLR的逐步回归、向前引入法和向后删除法3种方法选择变量建立模型,向前引入法优于向后剔除法,两者都优于基于OLR的逐步回归法,更适用于GWR分析。
关键词(KeyWords): 特征变量选择;地理加权回归;贪心算法;人口影响因素
基金项目(Foundation): 公益性行业科研专项(201512032);; 中国测绘科学研究院基本科研项目(7771414);; 基础测绘项目(201512027)
作者(Author): 赵阳阳,刘纪平,张福浩,仇阿根
DOI: 10.16251/j.cnki.1009-2307.2016.07.009
参考文献(References):
- [1]陈彦光.基于Matlab的地理数据分析[M].北京:高等教育出版社,2012:34-45.
- [2]ZHANG S,XU,GAO X,et aL.Face sketch synthesis via sparse representation-based greedy search[J].IEEE transactions on image processing,2015,24(8):2466-2477.
- [3]BAKILLAH M,LI R Y,AMP,et al.Geo-located community detection in Twitter with enhanced fast-greedy optimization of modularity:the case study of typhoon Haiyan[J].International Journal of Geographical Information Science,2015,29(2):258-279.
- [4]OMKAR K H Z.An optimal greedy routing algorithm for triangulated polygons[J].Computational Geometry,2013,46(6):640-647.
- [5]PORTA J,PARAPAR J,DAOLLO R B,et al.A population-based iterated greedy algorithm for the delimitation and zoning of rural settlements[J].Computers,Environment and Urban Systems,2013,39:12-26.
- [6]FOTHERINGHAM A S,BRUNSDON C,CHARLTON M.Geographically Weighted Regression,the analysis of spatially varying relationships[M].New York:JOHN WILEY&SONS,LET,2002:34-45.
- [7]覃文忠.地理加权回归基本理论与应用研究[D].上海:同济大学,2007.
- [8]黄砚玲.地理加权空间经济计量模型的GMM估计及区域金融发展收敛性实证研究[D].广州:华南理工大学,2012.
- [9]玄海燕,罗双华,王大斌.GWR模型中权函数的选取与窗宽参数的确定[J].甘肃联合大学学报:自然科学版,2008,22(3):10-12.
- [10]LU B,CHARLTON M,HARRIS P,et al.Geographically weighted regression with a non-Euclidean distance metric:a case study using hedonic house price data[J].International Journal of Geographical Information Science,2014,28(4):660-681.
- [11]王美红,康国栋.陕西县域经济发展与SO2排放及环境容量测评[J].环境与可持续发展,2011(1):28-32.
- [12]孙根年.国家区域公路网密度与人口密度、人均GNP关系的统计分析[J].西南交通大学学报,2000,35(2):220-223.