`
大涛学长
  • 浏览: 111445 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

跟我学-域名解析故障排查技巧

阅读更多
天苍苍,野茫茫,网站一瘫,唯有泪两行!! 
客户跳,老板叫,解析故障,心惊又肉跳!!

 

![6bdbdc3772499db44679d49c0272667a2ba02901.jpeg](https://yqfile.alicdn.com/6bdbdc3772499db44679d49c0272667a2ba02901.jpeg)

 

![2196ba8d1a2aaa17edb55b15462955f202e92d96.jpeg](https://yqfile.alicdn.com/2196ba8d1a2aaa17edb55b15462955f202e92d96.jpeg)

对企业网站来说,很怕出现网站打不开的情况,一旦发生,准会发现公司技术部呈现一片哀嚎景象。为了让运维的难兄难弟们做个精致的小白领,小编特别为你们总结了一套《域名解析故障排查技巧实操全网最全手册》,并分为“初阶版”“进阶版”,跟我学完保您在排查解析故障方面,脑回路神清晰,分分钟就能定位问题。为了助您减少客户不可用时间,并赢得老板信任,今天就来听听小编跟大家唠唠域名解析那点事儿。

![c90524dd907aacc2964780f01596896b7b99e585.png](https://yqfile.alicdn.com/c90524dd907aacc2964780f01596896b7b99e585.png)

 
因为DNS是互联网流量的入口,所以企业网站一旦发现不可用,运维人员都需要第一时间优先排除是否为域名解析故障导致。其次我们需要知道域名解析故障与网站不能访问是两个概念,因为网站的访问与域名解析、网站服务器、网站备案、网站程序、网路环境等诸多因素都有关联,而本文则重点描述 域名解析故障 排查的方法和思路。

初阶版
---

多数用户反映的域名解析故障,其实并不一定是真的域名解析出了问题,小编在这里为大家总结了最常见的四种原因,可帮助大家快速定位原因: 
**第一、 因为域名过期、被锁定都会导致域名无法正常访问。**  
① 首先我们要知道为什么域名异常会直接导致域名解析异常呢? 
因为域名处于域名解析的上游服务,所以递归解析过程中如果域名环节存在异常,权威DNS服务器是接收不到DNS查询请求并完成响应任务的。 
② 其次我们要知道域名在什么场景下会导致域名解析异常?

*   域名过期:一般域名注册商通过修改用户DNS服务器名称,实现访问页面显示域名过期。
*   域名状态:如果域名处于clienthold、serverhold、inactive三种状态,则代表是因为域名状态异常导致解析异常。

③ 最后我们再加深了解如何定位原因与解决。 
阿里云DNS为用户提供了 [域名检测工具](https://zijian.aliyun.com/#/domainDetect),可一键查询出域名有效期和域名状态是否存在异常。 
![_4](https://yqfile.alicdn.com/23f3f494fc4fa2607ab5632e0a2d2335c58a4d65.png)

*   域名过期: 域名续费后解析生效时间取决于TTL的设置,一般10分钟后可以在进行解析生效测试。
*   域名状态:域名状态异常时可参考下图提供的解决方法处理。 
    ![_5](https://yqfile.alicdn.com/9ffcb00a61551ad4c1a614e4493beb31b3394b19.png)

**第二、 check备案是否存在异常** 
首先我们需要知道域名解析和备案实际并无直接关联关系,即使网站出现备案异常,是完全不影响域名解析的设置和解析的生效。而备案异常则会直接影响网站的访问与使用,您可以通过 域名检测工具一键查询备案情况,如备案检查出现异常,即可联系网站服务器供应商定位备案的异常原因并解决。 
![_6](https://yqfile.alicdn.com/25d9421358b1186f1cee79de81de7117a3293ad6.png)

**第三、 check下是否在48小时内修改过域名DNS服务器名称**

![875645fbe8143fcb0496f93e5c0b897b1a0eda2c.png](https://yqfile.alicdn.com/875645fbe8143fcb0496f93e5c0b897b1a0eda2c.png)

修改DNS服务器后,解析生效时间取决于本地DNS中缓存的DNS服务器名称的TTL时间,一般需要24-48小时。所以在修改DNS服务器48小时内,新/旧DNS服务商的解析数据需要保持一致,如果您在原DNS服务商删除了解析记录、或者在新DNS服务商未添加解析记录、或者新/旧DNS服务商添加的解析记录不一致,都有可能导致解析不可用、或者出现站点时而正常时而异常的现象。 
**结论**:如果排查是此情况导致,您可到新/旧DNS服务商操作,最终保持解析数据一致,即可实现快速恢复。

**第四、 check解析记录** 
①检查解析记录的设置是否正确

![06d41fa8e30e1e2d31e106e4cbda6764adbc823e.png](https://yqfile.alicdn.com/06d41fa8e30e1e2d31e106e4cbda6764adbc823e.png)

建议运维GG们首先可通过 域名检测工具 ,检查下DNS服务商的解析结果,如提示“未检测到该域名设置DNS解析记录”,则建议您检查下解析记录的设置是否正确,例如是未设置该条子域名,还是被“误操作”“不小心”给删除了?还是修改解析记录时输入错误了?总之错误的原因皆有可能,我们首要先排除下因配置原因导致的异常错误。 
![_9](https://yqfile.alicdn.com/71a233bcb3bf8986a2d9e6e5aeb3d9e1f53d7781.png)

②检查是否近期刚修改过解析记录。 
如果修改了解析记录,需要等待各地的运营商Localdns的缓存到期,域名解析才会生效。一般修改解析后的生效时间取决于域名的TTL设置。您可以通过 域名检测工具 查出TTL生效时间,等待此TTL生效时间后再次检查。 
![_10](https://yqfile.alicdn.com/835fb2f09ad8ce9e9e7a230ff88ca9340e27373a.png)

③检查智能解析线路是否未设置默认线路 
云解析DNS的智能解析线路,解析优先级是按照“专线”线路、“默认”线路的排序应用,如果访问者来源不属于“专线”线路,而管理员又未设置“默认”线路场景,则会造成此部分用户无法访问站点。 
![_11](https://yqfile.alicdn.com/4e1d9a9c154e2a75d16ea62afb0c377f77004dc7.png) 
如果以上初步排查后,排查结果都属于正常,那么则可以随小编进入进阶版学习了。

进阶版
---

在进入进阶版前,要深入了解域名解析异常情况,绕不开的就得先了解域名解析递归流程,很多同学应该还不知道解析的110套路,简单来说就是在递归DNS未有缓存场景下,1次域名解析需要经历10次查询交互。

![197ed5816bf10a1e2858b316021cd576251e903d.png](https://yqfile.alicdn.com/197ed5816bf10a1e2858b316021cd576251e903d.png)

 
从上面的解析流程介绍我们可以看出,域名解析的过程是经历很多查询交互,任意一环节出现问题都可能会导致解析不生效,所以接下来小编就教教在每个环节如何排查解析异常问题。一般判断解析不生效的定义是DNS查询请求未能查询到域名指向的服务器IP地址或者查询的IP地址与预期不一致。多表现于权威DNS解析结果和递归解析结果/本地DNS解析结果/公共DNS解析结果不一致,或查询结果显示无数据。

**第一、排除下权威DNS的解析数据是否存在异常** 
权威DNS是真正管理域名和IP地址映射关系的DNS服务器,阿里云提供的云解析DNS就是权威DNS,所以第一步,小编教您优先检查权威DNS的解析数据是否存在异常。 
用 [域名检测工具](https://zijian.aliyun.com/#/domainDetect),重点查看DNS服务商解析结果,见下图。 
![_13](https://yqfile.alicdn.com/3ccbb78d5708b394bf9b0e9fa8fd11f325ae4457.png) 
① 检查解析结果和您在DNS服务商控制台处设置的解析记录对比是否一致,如一致代表权威DNS解析是正常生效的。 
② DNS服务商解析结果显示DNS未设置解析记录,则需要检查您是否为忘记设置或误操作过删除等行为。 
③ 检查结果和您在DNS服务商控制台设置的解析记录不一致,此种场景则需要联系您的DNS服务商进行解析数据刷新处理。

**第二、排除下是否属于用户本地DNS服务器问题** 
本地域名服务器是响应来自客户端的递归请求,并最终跟踪直到获取到解析结果的DNS服务器。例如用户本机自动分配的DNS、运营商ISP分配的DNS,我们也可称之为递归DNS。 
用 [域名检测工具](https://zijian.aliyun.com/#/domainDetect),在本地DNS检查模块下载客户端查询工具。 
![_14](https://yqfile.alicdn.com/007029baa2222c933548cb3d361e1543b038286a.png) 
用本地DNS工具检测结果如下: 
![_15](https://yqfile.alicdn.com/940ee905f55067099c2c25fa88bafce40a0f5959.png) 
如果确认权威DNS解析是正确的情况下,发现本地DNS解析结果与权威DNS结果不一致,则代表域名解析是在用户本地没有生效。那么为什么会出现本地解析没有生效呢? 
主要有下列几种情况: 
① 本地DNS服务器上的缓存信息未到期导致。 ->此场景,只需要等待本地DNS解析处显示的TTL生效时间到期后,再次尝试测试即可。 
② 如果本地DNS解析TTL过期后测试,仍然和权威DNS解析结果不一致,尝试检查公共DNS解析结果是否一致。 
③ 如果公共DNS解析结果和权威解析结果一致,说明权威DNS和公共DNS上解析数据都是生效的,那么可以判断为是用户本地DNS未生效,此种情况建议刷新本地DNS服务器后再进行测试、或将本地DNS服务器修改为公共DNS服务器。 
![_16](https://yqfile.alicdn.com/11ad0f4e085fa4574652eed3d2b9b8f58abae9c6.png)

![e2e69bb5b070b7c15784dc9e23fa2834719bec78.png](https://yqfile.alicdn.com/e2e69bb5b070b7c15784dc9e23fa2834719bec78.png)

 
放心放心,小编为了让您能加深了解和记忆,早已为您精心绘制了精简版的Check List,一表在手,让我们帮您把排查解析异常故障的时间**“打下来”。** 
![_18](https://yqfile.alicdn.com/f516dab3c38600110697e0daf5ed196da29690cb.png) 
**第三、排除下是否为域名被阻断导致域名解析异常** 
![_19](https://yqfile.alicdn.com/7e1e0d2e6147cc4fc02fc21ffd6caefb4120c93f.png) 
①通过 [域名检测工具](https://zijian.aliyun.com/#/domainDetect) ,如递归解析追踪报错“域名递归解析过程被污染“。 
一般是域名正常解析过程中受到上级网络设施强行阻断,这已超出权威DNS服务能力, 如果遇到此情况,小编也很遗憾不能给予更好的解决办法,一般建议用户更换业务域名。 
![_20](https://yqfile.alicdn.com/31632295e5f287f43cbadc242814f10423d24493.png) 
②判断递归解析过程哪个环节被“污染” 
您也可以通过命令dig+trace测试,本地DNS向根DNS服务器查询时,直接返回了IP地址,则一般可判断为在DNS查询在根DNS服务器处就被阻断。 

![9a7920f484b40631da959b5035002d823388c925.png](https://yqfile.alicdn.com/9a7920f484b40631da959b5035002d823388c925.png)

这次的分享就先到这里了,最后,希望小编为大家总结的《域名解析故障排查技巧实操全网最全手册》,能够有效帮助到您快速定位解析异常原因和降低业务不可用时间。

 

 

[原文链接](https://link.zhihu.com/?target=https%3A//yq.aliyun.com/articles/739645%3Futm_content%3Dg_1000094672)

本文为阿里云内容,未经允许不得转载。
分享到:
评论

相关推荐

    EtherCAT-TwinCAT故障排查手册.pdf

    软件诊断是故障排查的关键环节,手册提供了多种诊断工具和技巧: 3.1 WorkingCounter的作用和Sync unit同步单元设置: WorkingCounter用于监控EtherCAT从站的状态,而Sync unit设置决定了 EtherCAT网络中的时间同步...

    根叔的云图-网络故障大排查全套文档

    EoC双向网改造导致电视播放异常故障排查.pdf EoC头端无法管理故障排查.pdf EoC终端注册不上故障排查.pdf EoC终端配置下发不生效故障排查.pdf EoC网络PPPoE拨号上网故障排查.pdf EPON EPON网络监控业务不通...

    IPv4与IPv6业务-域名解析故障处理手册-D.docx

    本手册主要针对IPv4和IPv6两种业务环境下的域名解析故障处理,虽然主要以IPv4为例,但IPv6的处理方式与其相似。 1.1 无法解析到域名对应的 IP 当遇到这种情况时,通常表现为执行ping、tracert(traceroute)或...

    根叔的云图-网络故障大排查

    根据给定文件信息,以下是针对“根叔的云图-网络故障大排查”相关内容的知识点。 ### 标题知识点解析 - **根叔的云图**:这个名字可能指代某个特定的网络专家,其在网络技术领域享有权威地位,云图可能意味着其...

    H3C《根叔的云图-网络故障大排查》PDF文档汇总集.rar

    目录: EPON_EoC iMC管理软件 安全产品 公共协议 交换机产品 交换技术 路由器产品 路由技术 无线产品 云计算产品

    IB(NA)-0300484CHN-A JET-G、JET-G-N1用户手册故障排查篇.pdf

    本手册主要针对三菱电机AC伺服系统的MR-JET系列的伺服放大器,特别针对JET-G和JET-G-N1型号,提供故障排查相关内容。手册详细列出了伺服放大器可能出现的故障,并给出了相应的报警编号与警告编号一览,以及详细的...

    H3CIE故障排查重点技术参考资料汇总集.rar

    802.1x与EAD故障排查 AM接口故障排查 ARP-DETECTION故障排查 BGP MPLS故障排查 BGP故障排查 BPDU Tunnel故障排查 DHCP Server故障排查 DVPN HUB-HUB DVPN HUB-SPOKE 2 DVPN HUB-SPOKE DVPN DVPN故障排查 E1POS...

    技术资源分享-我的运维人生-《网络故障排查与修复全攻略》

    **脚本描述**:本脚本主要聚焦于计算机网络中可能出现的故障及其排查与修复方法。...通过这个脚本,用户可以更好地理解网络故障的复杂性,并掌握有效的排查和修复技巧,以确保网络的高效和稳定运行。

    域名解析故障处理手册.pdf

    通过以上步骤,可以系统地排查和解决域名解析故障,确保网络通信的正常进行。在实际操作中,务必遵循文档中的指导,并结合网络环境的具体情况进行分析。对于复杂情况,可能需要更深入的网络知识和技术支持。

    行业分类-设备装置-机床故障排查教学系统.zip

    因此,掌握机床故障排查技巧是每个从事相关工作的技术人员必须具备的基本技能。 本教学系统深入浅出地讲解了机床故障的识别和处理,包括但不限于以下几个方面: 1. **故障类型分析**:从机械结构、电气控制、液压...

    三菱电梯维修调试资料:KCD-91X故障代码.docx

    ### 三菱电梯维修调试资料:KCD-91X故障代码解析 #### 一、概述 本资料旨在为三菱电梯的维修与调试提供详细的故障代码解释及相关排查方法,以帮助技术人员快速定位问题并采取有效措施解决。KCD-91X故障代码涵盖了...

    软件工程的软件工程故障排查.pptx

    #### 第3章 常见故障排查技巧 - **二分法排查法** - 该方法通过不断缩小故障范围来定位具体的问题点。 - 适用于大型系统,能够高效准确地解决问题。 - **模块化排查法** - 将系统拆分为多个模块,并逐一排查每个...

    软件工程中的故障排查技巧.pptx

    ### 软件工程中的故障排查技巧 #### 第1章:软件工程中的故障排查技巧 **引言** 在软件工程领域内,确保软件的质量和稳定性是至关重要的任务之一。故障排查作为这一过程的关键组成部分,其作用不可小觑。通过有效...

    教育学-学校消防隐患排查工作开展实施方案doc.docx

    教育学-学校消防隐患排查工作开展实施方案doc.docx

    H3C网络故障排查一本通.pdf

    根据提供的文件信息,可以生成以下关于H3C网络故障排查的知识点: 1. 故障排查的基本思路 故障排查的第一步是确定设备是否存在硬件故障。接着,需要检查设备在网络中的端口状态是否正常,以及设备的流控功能是否...

    5G-NR故障排查表.xlsx

    5G-NR故障排查表.xlsx

    锐捷交换机产品故障排查指导(V1.1).pdf

    本文档为《锐捷交换机产品故障排查指导(V1.1)》的摘要与关键知识点提炼,旨在帮助锐捷工程师、中锐工程师及渠道工程师快速掌握锐捷交换机产品的故障排查技巧。该文档由锐捷网络有限公司编制,未经许可不得传播。 ...

    EtherCAT故障排查手册_ETHERCAT_EtherCat故障排查手册_twincat_determinetpg_

    本手册主要针对EtherCAT系统在运行过程中可能出现的故障进行排查和解决,结合Twincat软件的使用进行详细讲解。 1. EtherCAT基础: EtherCAT是一种分布式I/O系统,它通过以太网协议实现高速数据传输。其核心技术...

    基本电气故障的排查方法

    【电气故障排查方法详解】 电气设备的故障排查是一项技术性强且需要实践经验的工作,它没有固定的模式,每个人可能都有自己独特的方法。然而,对于一般的故障处理,有一套通用的步骤可以帮助我们系统地进行排查。 ...

Global site tag (gtag.js) - Google Analytics