旅游地理信息垂直搜索引擎及应用研究Study on vertical search engine of tourism geographical information and its application
朱宇峰,兰小机,康俊锋
摘要(Abstract):
针对互联网上旅游信息量飞速增长导致旅游者难以从海量大数据中检索出有效信息的问题,该文为帮助旅游者从众多Web旅游网站中高效地获取想要的地理信息,基于开源的Nutch搜索引擎框架,结合旅游领域与地理信息的特性,对原有搜索引擎框架的索引及搜索方法模块进行改造,通过设计基于词典的双向最大匹配模型对地理信息进行分词,并集成到Nutch搜索引擎框架的分词模块中,构建出面向旅游领域地理信息的垂直搜索引擎。最后,利用GIS技术,设计并实现了一个旅游地理信息垂直搜索系统,对旅游地理信息搜索服务进行了验证。
关键词(KeyWords): 垂直搜索引擎;旅游;地理信息;Nutch;双向最大匹配
基金项目(Foundation): 国家自然科学基金(40971234,40761017);; 江西省青年科学基金资助项目(20132BAB211024);; 江西省教育厅科学技术研究项目(GJJ13414)
作者(Author): 朱宇峰,兰小机,康俊锋
DOI: 10.16251/j.cnki.1009-2307.2016.05.032
参考文献(References):
- [1]李卫疆,赵铁军,朴星海.一种新的面向主题的爬行算法[J].计算机应用研究,2009,26(5):1663-1666.
- [2]肖冬梅.垂直搜索引擎研究[J].图书馆学研究,2003(2):87-89.
- [3]吴洁明,冀单单,韩云辉.基于Web的DCI垂直搜索引擎的研究与设计[J].计算机工程与设计,2013,34(4):1481-1487.
- [4]王静,刘伟峰,汪伟.面向旅游信息的垂直搜索引擎的设计与实现[J].信息系统工程,2014(3):29-31.
- [5]FETTERLY D.A large-scale study of the evolution of web pages[C]//Proceedings of the 12th International Conference on World Wide Web.ACM:Budapest,Hungary.2003:669-678.
- [6]MICHAEL K.BERGMAN.The deep web:surfacing hidden value[J].The Journal of Electronic Publishing,2001,7(1):8912-8914.
- [7]徐敏政,许珺.语境感知的地理信息检索[J].地理与地理信息科学,2014,30(1):1-7.
- [8]杜萍,刘勇.地理信息Web检索系统体系结构、原理及发展[J].热带地理,2010,30(4):392-395.
- [9]黎志升.地理信息检索若干技术研究[D].合肥:中国科学技术大学,2009:1-15.
- [10]张林曼,吴升.地理编码系统中地名地址分词算法研究[J].测绘科学,2010,35(2):46-48.
- [11]梁南元.书面汉语自动分词系统-CDWS[J].中文信息学报,1997,1(2):44-54.
- [12]苏菲,王丹力,戴国忠.基于标记的规则统计模型与未登录词识别算法[J].计算机工程与应用,2004(15):43-45.
- [13]张茂元,卢正鼎,邹春燕.一种基于语境的中文分词方法研究[J].小型微型计算机系统,2006,26(1):130-133.
- [14]陈晓明,李伶俐,梁雄友.消除语义网络中分词歧义方法研究[J].微电子学与计算机,2012,29(3):178-181.
- [15]张李义,李亚子.基于反序词典的中文逆向最大匹配分词系统设计[J].现代图书情报技术,2006(8):42-45.
- [16]MIKE C,DOUG C.Building nutch:Open Source search[J].ACM Queue,2004(2):56-61.
- [17]杨丹波.应用Web数据挖掘的主题元搜索引擎设计与实现[D].北京:清华大学,2008:1-25.