Zhejiang Daxue xuebao. Lixue ban (Nov 2014)

Research of kNN algorithm based on MapReduce and double levels of inverted grid index(基于MapReduce和双层倒排网格索引的kNN算法)

  • ZHAOMinchao(赵敏超),
  • DUZhenhong(杜震洪),
  • ZHANGFeng(张丰),
  • LIURenyi(刘仁义),
  • LIRongya(李荣亚)

DOI
https://doi.org/10.3785/j.issn.1008-9497.2014.06.016
Journal volume & issue
Vol. 41, no. 6
pp. 703 – 708

Abstract

Read online

随着卫星定位技术和移动互联网技术的飞速发展,地理空间数据来源变得更加多源异构.面对海量地理空间数据,如何快速有效地找到目标周围的兴趣点变得异常重要.依据空间k近邻(kNN)查询算法,提高效率的关键在数据索引和数据块存储结构设计,通过引入云计算的MapReduce编程模型,设计了一种面向MapReduce的地理空间数据双层倒排网格索引,利用CircularTrip算法实现了目标点近邻查询计算,最终获得距离目标点最邻近的数据点集.实验结果表明,该索引方法较单层倒排网格索引下的kNN查询效率有明显提高,且数据量越大效率提升越明显,此法适合大规模并行计算.

Keywords