下载地址:An investigation of geographic mapping techniques for internet hosts | Proceedings of the 2001 conference on Applications, technologies, architectures, and protocols for computer communications
被引次数:766
Padmanabhan V N, Subramanian L. An investigation of geographic map** techniques for Internet hosts[C]//Proceedings of the 2001 conference on Applications, technologies, architectures, and protocols for computer communications. 2001: 173-185.
ABSTRACT
在本文中,我们问是否有可能为互联网主机建立一个IP地址到地理位置映射服务。这样的服务将启用一类大型而有趣的位置感知应用程序。这是一个具有挑战性的问题,因为IP地址本身并不包含位置的指示。
我们提出并评估了三种不同的技术,统称为IP2Geo,用于确定互联网主机的地理位置。第一种技术是GeoTrack,根据目标主机或其他附近网络节点的DNS名称来推断位置。第二种技术是GeoPing,它利用来自地理分布位置的网络延迟测量来推断目标主机的坐标。第三种技术是GeoCluster,它结合了部分的(可能是不准确的)主机到位置的映射信息和BGP prex(前缀)信息来推断目标主机的位置。使用广泛和多样的数据集,我们评估了这些技术的性能,并确定了从互联网主机的IP地址推断地理位置时面临的基本心理挑战。
我们提出并评估了三种不同的技术,统称为IP2Geo,用于确定互联网主机的地理位置。
1. Introduction
在本文中,我们提出了这样一个问题:是否有可能为互联网主机建立一个IP地址到地理位置映射服务?给定一个IP地址,映射服务将返回已分配给该IP地址的主机的地理位置。这是一个具有挑战性的问题,因为IP地址本身并不包含地理位置的指示。
建立一个IP地址到位置的映射服务(简称位置映射问题)本身就是一个有趣的问题。这种服务还将为互联网主机提供大量有趣的位置感知应用程序,就像GPS[6]等系统为移动设备提供的那样。通过了解客户端主机的位置,一个应用程序,例如Web服务,可以发送基于用户位置的关于本地事件、区域天气等的目标信息。((targeted advertising) 有针对性的广告)根据位置对用户进行分类(例如,根据用户所在的区域计算点击数),或者根据用户的位置控制数据的可用性(类似于电视广播权的领土权利管理)。每个应用程序可能对所需的位置信息的解析有不同的要求。
[6] P. Enge and P. Misra, The Global Positioning System, Proc. of the IEEE, January 1999.
在本文中,我们提出了几种新的技术,统称为IP2Geo,从不同的角度来解决位置映射问题。这些技术利用了互联网上的各种特性和观察结果,如分层寻址(hierarchical addressing )和延迟和距离之间的(hierarchical addressing )相关性。我们分析了各种数据集,以评估这些技术,并评估它们的性能。据我们所知,我们是在详细研究这个问题的开放文献中首次重新搜索。
第一种技术,GeoTrack,试图根据目标主机或附近其他的网络节点的DNS名称来推断位置。互联网主机的DNS名称有时会包含有关主机位置的线索。当有这样的线索时,可以指示不同粒度级别的位置,如城市(例如,corerouter1.SanFrancisco.cw.net表示旧金山市)、州(例如,www.state.ca.us表示加利福尼亚州)或国家(例如,www.un.cm表示喀麦隆国家)。
第二种技术,GeoPing,利用来自地理分布位置的网络延迟测量来推断目标主机的坐标。它是基于前提的延迟经历包一对主机之间的网络,圣顺序,主机之间的地理分离的功能(类似于信号强度和距离之间的关系利用无线用户定位系统如雷达[1])。当然,这只是一个近似值。因此,我们的基于延迟的技术在很大程度上依赖于网络时延的经验测量,如第5节所述。
第三种技术,GeoCluster,它将部分(可能是不准确的)IP-to-location映射信息与BGP prex信息相结合来推断感兴趣的主机的位置。在我们的研究中,我们从各种来源获得了主机到位置的映射信息,包括一个流行的基于网络的电子邮件网站、一个商业网站托管网站和一个在线电视指南网站。所获得的数据是部分的,因为它只包括相对较少的IP地址。我们使用BGP prex信息通过识别可能位于同一地理区域的IP地址集群来扩展此数据的覆盖范围。这种技术是自校准的,因为它可以提供特定的位置估计可能有多精确的指示。
我们已经使用广泛和不同的数据集来评估了这些技术。虽然没有一种技术是完美的,但它们的表现却令人鼓舞。我们的位置估计的中值误差从28公里到几百公里不等,这取决于所使用的技术和所定位的主机的性质(例如,连接良好的客户端和代理客户端)。我们认为,我们工作的一个重要贡献是对广泛的技术的系统研究,并讨论仅基于主机的IP地址来确定位置的基本挑战。
2. Related Work
在第2节中,我们调查了相关的工作。
在无线环境中定位主机的问题上,已经有了很多工作。其中最著名的是全球定位系统(GPS)[6]。然而,GPS在室内是很有效的。已经有几个针对室内环境的系统,包括主动Badge[9]、Bat [10]和雷达[1]。正如我们稍后讨论的,我们的GeoPing技术使用了我们为雷达开发的一种算法的一种变体。然而,一般来说,这些技术是无线网络的规格,并不容易扩展到互联网。
[1] P. Bahl and V.N. Padmanabhan. RADAR: An In-Building RF-Based User Location and Tracking System. IEEE Infocom, March 2000.
[9] Andy Harter and Andy Hopper. A Distributed Location System, for the Active OÆce. IEEE Network Vol.8 No.1, January 1994.
[10] A. Harter, A. Hopper, P. Steggles, A. Ward, and P. Webster, The Anatomy of a Context-Aware Application, ACM Mobicom, August 1999.
确定位置是为了寻求用户的输入(例如,通过要求用户注册和/或登录到站点,通过将用户的凭据存储在基于客户机的cookie中,等等)。然而,这样的方法可能会对用户造成(a)负担,如果用户使用的客户端是其他的(b),并且(c)容易由于(可能是故意的)个人用户提供的位置信息不准确而出现错误。(在第6节中,我们将讨论地理集群如何通过聚合来自单个用户的信息来处理这些不准确的问题。)
[16] U. Raz. How to nd a host's geographic location. http://www.private.org.il/IP2geo.html
另一种方法是构建一个将IP地址映射到相应的地理位置[16]的服务。有几种方法:
1.在域名系统(DNS)记录中合并位置信息(例如,纬度和经度)。
2.使用Whois [8]数据库来确定分配给其IP地址的组织的位置。
3.使用跟踪器[11]工具,并将路径中的路由器名称映射到地理位置。
4.做一个详尽的表格IP地址范围及其相应的位置。
[8] K. Harrenstien, M. Stahl, E. Feinler, NICKNAME/ WHOIS, RFC-954, IETF, October 1985.
[11] V. Jacobson, Traceroute software, 1989, ftp://ftp.ee.lbl.gov/traceroute.tar.gz
基于DNS的方法在RFC 1876 [17]中提出了。这项工作要求使用DNS的新资源记录(RR)的格式,并保留相应的DNS类型助记符(LOC)和数字代码(29)。基于DNS的方法面临着部署障碍,因为它需要修改DNS记录的记录结构。这也加重了管理员输入LOC记录的负担。此外,也没有一种简单的方法来验证所输入的位置的准确性。
[17] D. C. Vixie, P. Goodwin and T. Dickinson. A Means for Expressing Location Information in the Domain Name System, RFC-1876, IETF, January 1996.
[29] NeoTrace, A Graphical Traceroute Tool http://www.neoworx.com/products/neotrace/default.asp
在许多工具中广泛使用的一种方法是查询Whois服务器[8]。IP2LL [26]和NetGeo [14]等工具使用Whois数据库中记录的位置信息来推断主机的地理位置。
[14] D. Moore et.al. Where in the World is netgeo.caida.org? INET 2000, June 2000.
[26] IP to Latitude/Longitude Server, University of Illinois http://cel lo.cs.uiuc.edu/cgi