一次有关 DNS 解析导致 APP 慢的问题探究

一、业务背景

HTTTPDNS

AWS Router53

APP 使用 HTTPDNS, 为解决 DNS 解析生效慢, DNS 劫持等问题。

我们 IOS 和安卓都是使用了 HTTPDNS

域名托管在 AWS Router53

域名有多个解析(基于延迟),为了解决就近接入。

示例配置

ai.baidu.com	CNAME	延迟	亚太地区(香港)	alias-ai-hk.baidu.com
ai.baidu.com	CNAME	延迟	默认值 	123455.baidu.com
ai.baidu.com	CNAME	延迟	中国	alias-ai-zh.baidu.com
alias-ai-zh.baidu.com  A - - 18.18.18.18(国内ip接入)

二、 问题

很直观的体现就是, APP 打开很慢。反馈主要是国内的用户。APP 用户面向的群体是全球,所以我们有多个接入。背后通过专线打通。

三、问题排查

不管是从前往后查,还是从后往前查。每个阶段都需要查下。

  1. 用户访问到接入层的网络
  2. 接入层到网关的网络。
  3. 各个服务的耗时。看下链路追踪。

这里也就直接说下我们重点关注的问题的地方: DNS 解析。

3.1、问题一: 基于DNS 延迟的解析

因为我们发现由于是基于DNS 延迟的策略,我发现在深圳通过 HTTPDNS 接口获取对应域名的解析,有很大概率会解析到香港的节点。 我们发现这个并不准确。

然后我们调整为 基于 地理位置 的 路由策略。

ai.baidu.com	CNAME	地理位置	香港	 alias-ai-hk.baidu.com
ai.baidu.com	CNAME	地理位置	默认值 	123455.awsglobalaccelerator.com
ai.baidu.com	CNAME	地理位置	中国	alias-ai-zh.baidu.com
alias-ai-zh.baidu.com  A - - 18.18.18.18(国内ip接入)

我们经过测试,发现这个对应的大陆请求都是解析到大陆的节点。 经过这次调整,我们几个APP 好像打开都快了点(不知道是不是心里作用)。 我们继续往下看。

3.2、问题二:HTTPDNS侧

HTTPDNS基础理论

img

HTTPDNS 的原理:

原本用户进行 DNS 解析是向运营商的 DNS 服务器发起 UDP 报文进行查询,而在 HTTPDNS 下,修改为用户带上待查询的域名和本机 IP 地址直接向 HTTPDNS 服务器发起 HTTP 请求,这个 HTTPDNS 服务将返回域名解析后的IP地址。那么这个 HTTPDNS 服务器会做什么? 第一 HTTPDNS 获取到请求后,如果当前节点(HTTPDNS 有很多节点) 没有缓存,那么 HTTPDNS 当前节点会向 DNS权威服务器 发起请求获取对应的解析记录。

那么一个域名的 DNS 权威服务器是什么? 我们可以找到我们的域名再对应的 DNS 管理可以看到。我们的 DNS 服务器信息。

image-20230530223820806

[root@185 ~]# dig xiaoaxiao.cn

; <<>> DiG 9.11.4-P2-RedHat-9.11.4-26.P2.el7_9.13 <<>> xiaoaxiao.cn
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 16195
;; flags: qr rd ra; QUERY: 1, ANSWER: 0, AUTHORITY: 1, ADDITIONAL: 1

;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 4096
;; QUESTION SECTION:
;xiaoaxiao.cn.			IN	A

;; AUTHORITY SECTION:
xiaoaxiao.cn.		600	IN	SOA	dns27.hichina.com. hostmaster.hichina.com. 2022052002 3600 1200 86400 600

;; Query time: 261 msec
;; SERVER: ……
;; WHEN: Tue May 30 22:37:28 CST 2023
;; MSG SIZE  rcvd: 105

其中 dns27.hichina.com 和 dns28.hichina.com 就是我们这个域名的对应的权威服务器。

每个域名的权威DNS服务器是指该域名的DNS服务器,它负责管理该域名下的所有DNS记录,包括IP地址、邮件服务器、别名等。权威DNS服务器的作用是回答其他DNS服务器关于该域名的所有DNS查询请求。当用户访问该域名时,他们的计算机会向该域名的权威DNS服务器发送查询请求,以获取与该域名相关的IP地址和其他DNS记录

相关问题

前面讲到 HTTPDNS 会请求 该域名的 DNS 权威服务器, 这里注意我们的域名是托管在AWS 的 router53 上的,也就是该域名对应的 DNS 服务器是 AWS 的在海外的。 注意是海外的。 那么这里有个链路就涉及到跨地域了,我们国内的用户访问 HTTPDNSHTTPDNS服务端 再去访问 AWS 的DNS 服务器,这就涉及到跨地域。我询问了下 httpdns 的技术人员,并让他们给出对比数据。 HTTPDNS服务端 再去访问 AWS 的DNS 服务器 这个延迟会比访问国内的 DNS服务器慢很多。

北京:dp(35ms),aws(110ms);
上海:dp(3ms),aws(61ms);
广州:dp(5ms),aws(90ms);

那么这也是一个慢的原因。

我们继续怀着疑问,那么 HTTPDNS 服务端的节点不会有缓存吗? 如果有缓存的话那也只有第一次会慢。 HTTPDNS对应的技术人员告诉我们目前的策略是,是有缓存的,基于域名的 ttl 值来进行缓存的。当到达 ttl 值的 30% 剩余时间,如果剩余时间内有请求过来,那么会异步去再去请求权威服务器来刷新当前的缓存值。 如果没有请求,则到了ttl 值缓存失效。

  • ttl 值
  • 请求量。

实际测试并不是这个逻辑。 根本没有 30% 的阈值和 异步。说是后期会有。

image-20230531181616551

也就是说,HTTPDNS, 服务端做的缓存只有存在一个基于TTL的缓存,如果你的请求是在TTL 过期的时间后,那么那一次请求 HTTPDNS 会耗时比较久。我测试了几次,第一次获取基本需要400MS左右。

四、优化方向

4.1、域名解析配置

  • 尽量只配置一层解析。或者使用 CNAME 加速

    假设 a.comb.comc.com 都是在 解析的域名:

    域名记录类型记录值
    www.a.comCNAMEwww.b.com
    www.b.comCNAMEwww.c.com
    www.c.comA1.2.3.4

    只配置一层解析也就是 www.a.com 直接 A 记录到具体的 IP

    如果我们设置的是 www.a.com cname 到 www.b.comwww.b.com cname 到 www.c.com, www.c.com A 记录到具体的 IP,

    一般情况下,递归需要到授权服务器请求三次才能得到 www.a.com 的 IP 地址,如下图所示:
     

    img


    启用 CNAME 加速功能,授权服务器会把 CNAME 记录和最终的 A 记录一次返回给递归,递归服务器由请求三次授权服务器,减小到请求一次,如下图所示:
     

    img


    这样就极大地减少了请求和应答中网络通信消耗的时间,让解析变得更快,特别是在设置多条 CNAME 解析记录的情况下,加速效果更明显。

4.2、靠近 HTTPDNS 服务端层

  • 缩减 HTTPDNS 到权威服务器之间的耗时。 把域名切到 DNSPOD 、万网等国内域名商。 AWS(非AWS 中国) Router53 不支持国内 DNS 节点。

  • 调整 TTL 值, 也就是增大 TTL 值,让它在 HTTPDNS 服务端缓存失效的时间变长,时间变长,在相同时间范围内,需要去请求权威服务器的次数也会变少。

  • 增加请求量, 像 HTTPDNS 某个运营商在国内有近 100多个节点。 如果我们的请求量达不到一个层级的话。那么请求到每个节点的请求去命中缓存的概率也会降低。 这样可以通过拨测实现,但是注意,不是直接拨测对应的域名,拨测的应该特定的接口(HTTPDNS 的接口)。 如果直接拨测域名的话,只是改变的公网解析的场景,而改变不了HTTPDNS 的场景。

4.3、靠近用户层

也就是APP 层

  • 减少请求HTTPDNS

    尽量使用缓存的DNS , 不要频繁请求 HTTPDNS

  • 预解析和乐观DNS

    预解析: 绝大多数的 APP 在应用初始化阶段都有一个启动期,我们可以在这个启动期做一些preflight工作,即在初始化阶段我们可以针对业务的热点域名在后台发起异步的 HTTPDNS 解析请求。这部分预解析结果在后续的业务请求中可以直接使用,进而消除首次业务请求的 DNS 解析开销,提升 APP 首页的加载速度。

    乐观DNS: 乐观 DNSOptimistic DNS)是一种基于缓存的 DNS 解析方法,它认为大多数 DNS 查询都会命中缓存,因此不需要每次都向上游 DNS 服务器发送查询请求,而是直接使用本地缓存中的结果。只有在缓存中没有找到对应的解析结果时,才会向上游 DNS 服务器发送请求。

五、扩展

5.1、如何测试本地到权威DNS服务器 获取域名的时间

[root@185 ~]# time dig @ns4.dnsv4.com  www.a.com  
……

real	0m0.074s
user	0m0.006s
sys	    0m0.008s

5.2、 同地区不同网络,访问HTTPDNS 会不会命中缓存。

比如同一个手机,不同的网络,切换 联通到电信 在TTL 时间范围内,访问 HTTPDNS(腾讯云) 会不会命中缓存?
比如后面的 DNS 配置只配置了,基于地理位置的逻辑的配置。 比如 国内 到 A , 国外到 B. 在这个场景下 会不会命中缓存? 可以想一想?

经过确认, 腾讯云的HTTPDNS 是 同一个地域(省或者直辖市)+同一个运营商,会命中同一个缓存。 但是注意,同一个地域的 HTTPDNS 后端节点有多个,可能请求会到不同的节点,也可能命中不了缓存。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/604449.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

考情分析 | 2025年西北工业大学计算机考研考情分析!

西北工业简称西工大&#xff08;英文缩写NPU&#xff09;&#xff0c;大学坐落于古都西安&#xff0c;是我国唯一一所以同时发展航空、航天、航海工程教育和科学研究为特色&#xff0c;以工理为主&#xff0c;管、文、经、法协调发展的研究型、多科性和开放式的科学技术大学。十…

《Python编程从入门到实践》day22

# 昨日知识点回顾 方法重构、驾驶飞船左右移动、全屏显示 飞船不移动解决&#xff0c;问题出在移动变量x更新 # Ship.pysnipdef update(self):"""根据移动标志调整飞船的位置"""# 更新飞船而不是rect对象的x值# 如果飞船右移的标志和飞船外接…

嵌入式引脚工作模式

一.引脚工作模式的基本概念 引脚的工作模式通常包括输入模式、输出模式和双向模式&#xff1a; 输入模式&#xff1a;引脚设置为输入模式时&#xff0c;可以接收外部信号或触发器的信号。这种模式通常用于读取传感器数据、接收外部设备的信号等。 输出模式&#xff1a;引脚设…

链表的阶乘

int FactorialSum(List L) {int res 0; // 结果初始化struct Node* x L; // 从链表的头节点开始// 遍历链表中的每一个节点while (x ! NULL) {int data x->Data; // 当前节点的值int y 1; // 用于计算当前节点值的阶乘// 计算当前节点值的阶乘for (int j 1; j < dat…

ROS 2边学边练(44)-- 从头开始构建一个视觉机器人模型

前言 从此篇开始我们就开始接触URDF(Unified Robot Description Format&#xff0c;统一机器人描述格式)&#xff0c;并利用其语法格式搭建我们自己的机器人模型。 动动手 开始之前我们需要确认是否安装joint_state_publisher功能包&#xff0c;如果有安装过二进制版本的urdf_…

单位档案寄存该怎么处理才好

处理单位档案寄存的方式可以根据实际情况来确定&#xff0c;以下是一些常见的处理方式&#xff1a; 1. 数字化存档&#xff1a;将单位档案进行数字化处理&#xff0c;通过扫描或拍照将文件转化为电子格式。这样可以方便查找和管理&#xff0c;减少纸质文件的存储量&#xff0c;…

iOS ------ 内存五大分区

1&#xff0c;内存的概念&#xff1a; 虚拟内存&#xff08;Virtual Memory&#xff09;&#xff1a;虚拟内存是操作系统提供的一种机制&#xff0c;它使得应用程序能够访问超出物理内存限制的内存空间。虚拟内存将应用程序的内存地址空间分割成固定大小的页面&#xff08;Pag…

elementui+vue通过下拉框多选字段进行搜索模糊匹配

从字典中选择的值为["01","03"],在最开始的时候进行的处理是类似于表单提交的时候将json对象转换成了String类型 nature:["01","03"] this.queryParams.nature JSON.stringify(this.queryParams.nature); mapper层 <if test&quo…

PHP单独项目启动演示

文章目录 phpstudy得到文件打开phpStudy.exe运行项目 phpstudy 得到文件 一般我们会得到这么一个项目文件&#xff0c;如果外层有“中文路径”&#xff0c;请剪切此内容作为项目根目录即可 打开phpStudy.exe 因为我又正常的编程环境和mysql&#xff0c;所以这里是正常的&a…

开机弹窗找不到OpenCL.dll是怎么回事,哪种修复方法更推荐

当用户在操作电脑过程中遇到系统提示“OpenCL.dll丢失”时&#xff0c;这究竟是怎么一回事呢&#xff1f;OpenCL.dll&#xff0c;作为Open Computing Language&#xff08;开放计算语言&#xff09;的重要动态链接库文件&#xff0c;它在图形处理器&#xff08;GPU&#xff09;…

企业内部适用的五大知识库工具测评推荐

随着企业规模的不断扩大和业务复杂性的增加&#xff0c;要想更高效地进行企业管理就不得不使用知识库管理工具。本文将对五款企业内部适用的知识库工具进行测评推荐&#xff0c;帮助企业选择出更适合自己的知识库管理工具。 一、Helplook AI知识库 Helplook AI知识库是一款搭建…

PotPlayer v1.7.22218 全格式影音播放器,无广绿色版!

软件介绍 PotPlayer是一款多功能且免费的媒体播放软件&#xff0c;兼容多种音频和视频格式。提供了丰富的功能性以及个性化设置&#xff0c;以迎合不同用户的需求。友好的用户界面&#xff0c;允许用户自定义皮肤和快捷键&#xff0c;提升了操作的便利性。 此外&#xff0c;Po…

JavaScript快速入门系列-1(JavaScript简介)

第一章:JavaScript简介 1. JavaScript简介1.1 什么是JavaScript1.2 JavaScript的历史与应用1.3 环境搭建:浏览器与Node.js2. JavaScript语言基础2.1 变量声明:let, const, var2.2 数据类型:字符串、数字、布尔值、对象、数组、null与undefined2.3 运算符:算术、比较、逻辑…

微信云小程序快速上手云数据库+云函数+云存储的操作

&#x1f680; 作者 &#xff1a;“二当家-小D” &#x1f680; 博主简介&#xff1a;⭐前荔枝FM架构师、阿里资深工程师||曾任职于阿里巴巴担任多个项目负责人&#xff0c;8年开发架构经验&#xff0c;精通java,擅长分布式高并发架构,自动化压力测试&#xff0c;微服务容器化k…

探索Java的未来

探索 Java 的未来是一个非常有趣的话题。Java 是一种广泛使用的编程语言&#xff0c;自 1995 年诞生以来&#xff0c;它已经在软件开发领域占据了重要的地位。尽管有些人担心 Java 可能会因为新技术的出现而变得不再相关&#xff0c;但实际情况并非如此。让我们来看看一些关于 …

Python | Leetcode Python题解之第69题x的平方根

题目&#xff1a; 题解&#xff1a; class Solution:def mySqrt(self, x: int) -> int:if x 0:return 0C, x0 float(x), float(x)while True:xi 0.5 * (x0 C / x0)if abs(x0 - xi) < 1e-7:breakx0 xireturn int(x0)

AI Agent智能应用从0到1定制开发(wanjie)

AI Agent&#xff08;人工智能体&#xff09;是一种能够感知环境、进行决策和执行动作的智能实体。不同于传统的人工智能&#xff0c;AI Agent 具备通过独立思考、调用工具去逐步完成给定目标的能力。 「完结12章」AI Agent智能应用从0到1定制开发 AI Agent 和大模型的区别在…

Windows 虚机扩容C盘

Windows 虚机扩容C盘 操作思路1、新增磁盘容量2、划分磁盘空间3、扩容对应盘 操作步骤 操作思路 1、新增磁盘容量 2、划分磁盘空间 3、扩容对应盘 操作步骤 1、虚机新增磁盘空间 先确认宿主机是否有足够空间&#xff0c;有足够空间后&#xff0c;编辑虚机&#xff0c;增加…

【3D目标检测】常见相关指标说明

一、mAP指标 mean Average Precision&#xff08;平均精度均值&#xff09;&#xff0c;它是目标检测和信息检索等任务中的重要性能指标。mAP 通过综合考虑精度和召回率来衡量模型的总体性能。 1.1 精度&#xff08;Precision&#xff09; 表示检索到的目标中实际为正确目标…

嵌入式开发适不适合做鸿蒙南向开发?看完这篇你就了解了~

随着物联网和智能设备的快速发展&#xff0c;嵌入式开发和鸿蒙系统成为了当前技术领域的热门话题。鸿蒙系统作为华为推出的全场景分布式操作系统&#xff0c;旨在连接各种智能设备&#xff0c;提供无缝的跨设备体验。而南向开发则是鸿蒙系统中的一个重要方向&#xff0c;主要涉…