Towards IP Geolocation Using Delay and TopologyMeasurements(TBG)(2006年)

下载地址:Towards IP geolocation using delay and topology measurements | Proceedings of the 6th ACM SIGCOMM conference on Internet measurement

被引次数:492

Katz-Bassett E, John J P, Krishnamurthy A, et al. Towards IP geolocation using delay and topology measurements[C]//Proceedings of the 6th ACM SIGCOMM conference on Internet measurement. 2006: 71-84.

Abstract

我们提出了基于拓扑的地理定位(Topology-based Geolocation,TBG),一种新的估计任意互联网主机的地理位置的方法。我们激励我们的工作表明1)现有的方法,基于端到端延迟测量从一组地标,未能超越简单的技术,和2)这些方法的误差强烈由距离最近的地标,即使三角测量用于结合估计从不同的地标。我们的方法改进了这些早期的技术,利用网络拓扑,以及网络延迟的测量,来约束主机的位置。我们将拓扑数据和延迟数据转换为一组约束条件,然后同时求解路由器和主机的位置。这种方法提高了位置估计的一致性,在我们对Abilene和Sprint的实验中,大大减少了结构化网络的误差。对于结构约束不足的网络,我们的技术集成了外部提示,在被信任之前使用度量进行验证。总之,这些技术将我们基于大学的数据集的中值估计误差降低到67公里,而之前最好的计算方法为228公里。

Categories and Subject Descriptors

C.2.4 [Computer-Communication Networks]:分布式系统

General Terms

算法(Algorithm)、测量(Measurement)

Keywords

地理定位(Geolocation),网络拓扑(Network topology),延迟测量(Delay measurements),路由测量(Route measurements)

1. INTRODUCTION

确定一个互联网主机的地理位置的能力将使各种应用程序成为可能,从平凡的到必要的。商业数据库目前提供粗略和不完整的位置信息,使一些有针对性的广告提供,以及其他内容本地化。如果可靠,它可以作为E-911系统的一部分或区域紧急情况的广播系统的一部分。作为基础设施的一部分,一个无处不在的定位服务已经被一些人确定为未来互联网[5,13]的一个重要愿景。

[5] D. Clark, C. Partridge, R. Braden, B. Davie, S. Floyd, V. Jacobson, K. Kitabi, G. Minshall, K. Ramakrishnan, T. Roscoe, I. Stoica, J. Wroclawski, and L. Zhang. Making the World (of Communication) a Different Place. ACM SIGCOMM Computer Communication Review, 35(3), 2005.

[13] A. LaMarca, Y. Chawathe, S. Consolvo, J. Hightower, I. Smith, J. Scott, T. Sohn, J. Howard, J. Hughes, F. Potter, J. Tabert, P. Powledge, G. Borriello, and B. Schilit. Place Lab: Device positioning using radio beacons in the wild. In Proc. of Pervasive, Munich,Germany, 2005.

我们将查找互联网主机的地理位置的过程称为IP地理定位。这是一个困难的问题,即使把移动性放在一边,因为互联网的分散管理意味着没有关于主机位置的权威数据库。确实存在的数据库是通过组合各种源代码(包括DNS LOC记录、whois注册和DNS主机名解析规则)而派生出来的。它们都是手动维护的,因此受到不一致和过时的信息。自动化系统是可取的,因为它们可以消除这些问题并产生可靠的结果。然而,它们只存在于特殊的情况和设备,如使用GPS [8]和GSM或802.11 beacons[13];甚至后者也依赖于一个必须手动输入的大型地标数据库。

[8] P. Enge and P. Misra. Special issue on global positioning system. In Proceedings of the IEEE, volume 87, pages 3–15, jan 1999.

[13] A. LaMarca, Y. Chawathe, S. Consolvo, J. Hightower, I. Smith, J. Scott, T. Sohn, J. Howard, J. Hughes, F. Potter, J. Tabert, P. Powledge, G. Borriello, and B. Schilit. Place Lab: Device positioning using radio beacons in the wild. In Proc. of Pervasive, Munich,Germany, 2005.

我们更大的目标是开发一种针对IP地理定位的自动化服务,它广泛适用,并可扩展到互联网的规模。这样的服务将由IP地址进行查询,并返回一个准确的位置估计值。与现有的系统相比,它将具有关键的优势。与GPS、GSM和802.11方法不同,它不需要专门的硬件,因此可以真正地无处不在,适用于所有的互联网主机。与基于DNS名称[15,18]的方法不同,即使DNS名称不可用或不正确,它也会自动推导出位置估计值,这在高流失率数据库中很常见。

[15] D. Moore, R. Periakaruppan, J. Donohoe, and K. Claffy. Where in the world is netgeo.caida.org? In Proc. of the INET, Yokohama,Japan, 2000.

[18] V. Padmanabhan and L. Subramanian. An investigation of geographic mapping techniques for Internet hosts. In Proc. of the ACM SIGCOMM, San Diego,CA,USA, 2001.

在本文中,我们考虑了实现这种服务必须解决的核心问题:如何估计给定主机IP地址的位置。为了设计一个自动化的解决方案,我们专注于网络测量的使用。由于我们不是第一个这样做的人,所以我们通过研究其他人提出的技术来开始我们的研究。这些技术是基于来自一组已知位置[18,10]的地标的端到端延迟测量。当我们使用在PlanetLab上收集的数据集对变化进行实验和评估时,我们惊讶地发现,更简单的基于延迟的算法能够提供与最先进的算法一样好或更好的性能。

[18] V. Padmanabhan and L. Subramanian. An investigation of geographic mapping techniques for Internet hosts. In Proc. of the ACM SIGCOMM, San Diego,CA,USA, 2001.

[10] B. Gueye, A. Ziviani, M. Crovella, and S. Fdida. Constraint-based geolocation of Internet hosts. To appear in ACM Transactions on Networking.

我们进一步发现,我们研究的所有纯延迟算法的误差在很大程度上取决于与最近地标的距离这种影响是由于互联网路径的迂回和不规则性造成的,将跨地标的延迟合并在一起的技术几乎没有帮助。结果是,基于延迟的算法必须使用许多经过仔细选择的地标,才能始终如一地达到任何合理的精度水平。由于很难在各处均匀地找到标记点,这些算法通常对一小部分目标效果不佳;在我们的美国实验中,有超过1000公里估计距离。

这种推理路线使我们得出结论,认为还需要其他类型的技术。为此,我们研究了结合延迟和拓扑来考虑互联网电路路径的算法。启发来自算法用于定位传感器网络[7,4],我们将互联网路线测量转换成一组约束目标的未知位置的路线和中间路由器,然后同时定位目标和所有的路由器的方式最好地满足约束。这种方法,我们称之为基于拓扑的地理定位(TBG),它有许多理想的特性:

它利用了地标附近的路由器很容易定位的事实;

它使用中间路由器的位置来量化到目标的路径的直接性,从而使这些测量更加有用;

它允许使用网络元素之间的耦合迭代解决方案,直到所有元素都收敛到一个一致的整体映射,这在现实中必须是这样的。

TBG将结构化的Abilene和Sprint网络上的目标的平均误差分别降低了约40%和70%,以及第90百分位的误差为4倍。

[7] L. Doherty, K. S. J. Pister, and L. E. Ghaoui. Convex position estimation in wireless sensor networks. In Proceedings of Infocom, pages 1655–1633, 2001.

[4] P. Biswas and Y. Ye. Semidefinite programming for ad hoc wireless sensor network localization. In Proceedings of Information Processing in Sensor Networks, 2004.

然而,我们的研究表明,仅基于网络测量的技术有其固有的局限性。例如,如果到目标的互联网路由没有充分限制目标的位置——比如当所有路由的尾部收敛到一个具有显著延迟的共享段时——那么在没有其他信息来源的情况下就不可能准确地地理定位目标。幸运的是,我们基于拓扑的技术可以验证和合并“被动”参考节点的位置——这些节点不能发布度量,但可以被“主动”地标探测——以帮助约束拓扑。它生成包含目标和被动参考节点的网络拓扑,使用延迟和拓扑测量来验证被动节点的位置,然后基于整个拓扑得到目标的位置估计。与已建立的技术相比,我们将困难目标的中位数误差提高了3倍以上。我们相信,这种方法有望成为未来IP地理定位工作的一个方向。

本文的其余部分组织如下。在第2节中,我们将更详细地介绍这个问题,并回顾相关的工作。第3节介绍并评估了基于延迟的地理定位技术的新的和现有的变化,并确定了它们的一些局限性。第4节然后介绍了一种地理定位技术,该技术还考虑了互联网的结构及其路由,第5节评估了它与基于延迟的技术相比的性能。最后,我们讨论了不同技术的优缺点。

2. PROBLEM AND PRIOR WORK

在第2节中,我们将更详细地介绍这个问题,并回顾相关的工作。

2.1 Problem

我们所考虑的IP地理定位问题的版本是如何自动估计互联网上任意计算机的粗粒度地理位置。我们自动的意思是该技术不应该依赖人工输入,而不是为参考主机建立地理坐标;所有方案都需要一些真实值来引导系统,但一小部分参考主机应该能够实现更大的目标集的位置。此外,如果由外部源提供节点的可能位置,必须由参考主机自动验证,然后才能用于地理定位目标。通过任意的计算机,我们的意思是该技术应该能够定位所有的IP地址,而不是属于一个特定的提供者的子集,已经以某种方式注册,等等。通过粗粒度位置,我们的意思是估计应该准确到一个主要大都市区的水平内。更严格的估计是可取的,但城市层面的估计对于许多应用就足够了。

本文研究了基于网络度量的IP地理定位技术。在这种情况下,我们有一组具有已知位置的参考主机,我们将其称为地标。有些是可以发出探测器的主动地标,而有些可能是被动的地标,不能发出探测器。在本文的其他地方,我们将指定,当区别很重要时,地标是被动的;否则,就可以假定它们是主动的。我们收集地标和其他未知位置的主机之间的测量,以及地标之间的测量。然后,我们根据指定的算法来处理测量值,以估计目标的位置。因为我们希望能够在不首先升级其软件的情况下绘制主机,所以我们只考虑可以使用源自地标的测量来运行的算法,例如,测量路径和到目标的延迟。我们不使用任何源自目标的测量方法。

2.2 Internet Measurement Techniques

两种已发布的地理定位技术适合我们的问题和方法,GeoPing [18]和基于约束的地理定位(CBG)[10]。两者都使用从地标上进行的延迟测量来估计互联网主机的位置。我们将在下面详细介绍它们,因为它们显示了延迟如何以重要的方式与位置相关,而且我们将很快在这些基础上构建(第3节)。

[18] V. Padmanabhan and L. Subramanian. An investigation of geographic mapping techniques for Internet hosts. In Proc. of the ACM SIGCOMM, San Diego,CA,USA, 2001.

[10] B. Gueye, A. Ziviani, M. Crovella, and S. Fdida. Constraint-based geolocation of Internet hosts. To appear in ACM Transactions on Networking.

2.2.1 GeoPing

GeoPing通过将目标映射到最具代表性的地标,并使用该地标的位置作为目标[18]位置的估计值来定位目标。为了做到这一点,GeoPing假设两个相邻的主机将测量与其他地标相似的延迟。从所有地标探测目标,建立一个延迟向量,作为地标“接近”的轮廓。目标被映射到轮廓最相似的地标。相似度计算为延迟向量之间的欧氏距离,即在“延迟空间”中到目标的距离。

有趣的是,GeoPing可以通过一组不能对目标执行探测的被动地标来增强其地标集。在这种设置中,目标可以映射到主动或被动地标。这种设置很有趣,因为添加被动地标“更便宜”,而且它们可能允许技术在不增加探测地标密度的情况下表现得更好。

2.2.2 Constraint-Based Geolocation

基于约束的地理定位(CBG)采用了地标的位置,而是使用类似三角的技术来组合来自多个地标的延迟,并可以返回位于地标之间的位置。为了将延迟与距离联系起来,每个地标测量从自身到所有其他地标的延迟。然后它符合这个数据的最佳线。这本质上是所有(延迟,距离)对的最紧的线。图1显示了普林斯顿大学(Princeton University)地标的例子。因为最佳线位于所有测点之上,所以它将延迟转换为被当作上界的距离估计。然后假设目标在一个圆圈内,以地标为中心,其半径为估计的距离。

图1:散点图和CBG最佳线 

然后,CBG通过相交于所有的圆来组合来自所有地标的距离估计值。这个交点产生了一个假定目标所在的可行区域。目标被任意估计为位于区域的质心上,并将区域的大小作为估计中的不确定性(或置信度)的度量。图2显示了一个示例。“+”标志是地标,虚线圆是约束条件,交叉点区域以粗体周长为界。实验表明,在美国和欧洲的数据集[10]上,CBG比GeoPing和基于dns的方法(如[28])提供更好的地理定位估计。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/531027.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【鸿蒙开发】系统组件Column

Column组件 Column沿垂直方向布局的容器。 接口: Column(value?: {space?: string | number}) 参数: 参数名 参数类型 必填 参数描述 space string | number 否 纵向布局元素垂直方向间距。 从API version 9开始,space为负数或者…

洪水预警:如何通过数据可视化提前应对灾害

数据可视化在应对洪涝灾害问题中发挥着重要作用。洪涝灾害是一种常见而严重的自然灾害,给人们的生命、财产和生活带来了巨大的威胁和损失。而数据可视化技术通过将海量的数据转化为直观、易懂的图表、图像或地图等形式,帮助人们更好地理解洪涝灾害的发生…

PostgreSQL入门到实战-第十三弹

PostgreSQL入门到实战 PostgreSQL数据过滤(六)官网地址PostgreSQL概述PostgreSQL中IN命令理论PostgreSQL中IN命令实战更新计划 PostgreSQL数据过滤(六) 使用PostgreSQL IN运算符来检查值是否与列表中的任何值匹配 官网地址 声明: 由于操作系统, 版本更新等原因, 文章所列内容…

宁波宠物展|2024中国(宁波)国际宠物用品博览会

中国(宁波)国际宠物用品博览会 地点:宁波国际会展中心 时间:2024年11月14-16日 主办单位:凤麟展览(宁波)有限公司 协办单位:浙江省宠物产业协会 宁波市跨境电子商务协会 宁波欧德国际商务咨询服务有限公司 宁波扬扬会议展览有限公司 20000方展览…

大模型的实践应用20-一种内存高效微调技术LISA,效果比LoRA有显著提升

大家好,我是微学AI,今天给大家介绍一下大模型的实践应用20-一种内存高效微调技术LISA,效果比LoRA有显著提升。LISA是一种新型的微调技术,全称为Layerwise Importance Sampled AdamW,由UIUC联合LMFlow团队提出。这项技术…

PUBG绝地求生29.1版本加速器推荐 免费低延迟不丢包加速器

绝地求生是一款多人大逃杀游戏,游戏有多张地图可供玩家选择,玩家空投跳伞至地图的各个角落,赤手空拳寻找武器,车辆以及物资,并在多种多样的地形中展开战斗,枪械角色身上可携带4种武器,分别是近战…

绝地求生29.1版本更新后进不去 绝地求生更新后进不去游戏怎么办

绝地求生游戏共有两种主要模式:第一人称模式和第三人称模式。在这两种模式下玩家可以分别进行单排,双排,四人组队或单人匹配四人团队模式。在进入游戏的时候,玩家可以在面板选择第一人称以及第三人称。在双排或四排等组队多人游戏…

为什么说无人机的发展是必然趋势???

随着科技的飞速发展,无人机已经逐渐从军事领域走进了普通人的生活,成为了我们探索天空、捕捉美好瞬间的新工具。今天,就让我带大家一起走进无人机的世界,感受它带来的无限魅力与可能性。 无人机,顾名思义,就…

C# 如何修改项目名称

目录 背景具体步骤1、Visual Studio中修改项目名和程序集名称以及命名空间2、修改项目文件夹名3、修改解决方案里项目的路径4、再次打开解决方案,问题解决步骤总结 名词解释解决方案(Solution)项目(Project)程序集&…

【千帆平台】百度智能云千帆AppBuilder应用探索益智游戏之猜物小游戏

欢迎来到《小5讲堂》 这是《千帆平台》系列文章,每篇文章将以博主理解的角度展开讲解。 温馨提示:博主能力有限,理解水平有限,若有不对之处望指正! 目录 背景AppBuilder控制台创建应用设置应用自动配置随机生成AI生成应…

线程池(详解)

目录 前言 线程池的好处 使用Executors 创建常见的线程池 工厂模式: 往线程池当中添加任务 常见线程类 ​编辑 线程池的参数介绍 线程池的工作流程 补充 前言 如果我们需要频繁的创建销毁线程,此时创建销毁线程的成本,不能忽视了 因此就可以使用线程池.提前创建好一波…

Vue - 4( 8000 字 Vue 入门级教程)

一: Vue 初阶 1.1 关于不同版本的 Vue Vue.js 有不同版本,如 vue.js 与 vue.runtime.xxx.js,这些版本主要针对不同的使用场景和需求进行了优化,区别主要体现在以下几个方面: 完整版 vs 运行时版: vue.js&…

标注平台工作流:如何提高训练数据质量与管理效率

世界发展日益依托数据的驱动,企业发现,管理不断增长的数据集却愈发困难。数据标注是诸多行业的一个关键过程,其中包括机器学习、计算机视觉和自然语言处理。对于大型语言模型(LLM)来说尤是如此,大型语言模型…

代码随想录阅读笔记-回溯【组合总和III】

题目 找出所有相加之和为 n 的 k 个数的组合。组合中只允许含有 1 - 9 的正整数,并且每种组合中不存在重复的数字。 示例 1: 输入: k 3, n 7 输出: [[1,2,4]] 示例 2: 输入: k 3, n 9 输出: [[1,2,6], [1,3,5], [2,3,4]] 说明: 所有数字都是正整数。…

Day30 回溯 LeedCode 332.重新安排行程 51. N皇后 37. 解数独 蓝桥杯 与或异或

332. 重新安排行程 给你一份航线列表 tickets ,其中 tickets[i] [fromi, toi] 表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。 所有这些机票都属于一个从 JFK(肯尼迪国际机场)出发的先生,所以该行程必须从 JFK…

【小程序】常用方法、知识点汇总1

欢迎来到《小5讲堂》 这是《小程序》系列文章,每篇文章将以博主理解的角度展开讲解, 温馨提示:博主能力有限,理解水平有限,若有不对之处望指正! 目录 前言请求超时Markdown解析逐行显示效果文本变动事件转发…

C语言—每日选择题—Day65

前言 我们的刷题专栏又又又开始了,本专栏总结了作者做题过程中的好题和易错题。每道题都会有相应解析和配图,一方面可以使作者加深理解,一方面可以给大家提供思路,希望大家多多支持哦~ 第一题 1、如下代码输出的是什么…

LINUX系统触摸工业显示器芯片应用方案--Model4(简称M4芯片)

背景介绍: 触摸工业显示器传统的还是以WINDOWS为主,但近年来,安卓紧随其后,但一直市场应用情况不够理想,反而是LINUX系统的触摸工业显示器大受追捧呢? 触摸工业显示器传统是以Windows系统为主&#xff0c…

无线游戏手柄的测试(Windows11系统手柄调试方法)

实物 1、把游戏手柄的无线接收器插入到电脑usb接口中 2、【控制面板】----【查看设备和打印机】 3、【蓝牙和其它设备】--【更多设备和打印机设置】 4、鼠标右键【游戏控制器设置】 5、【属性】 6、【测试】(每个按键是否正常) 7、【校准】(…

学习笔记:解决拖延

1 解决拖延,减轻压力的关键心态和方法 1.1 要点梳理 拖延是因为自己一直在逃避,重点是要有效突破逃避圈,进入学习圈,扩展成长圈。 毒蛇曲线(见思维导图)中越是临近截止期限,拖延的焦虑越上升…