分類
技術文章 網域名稱

DNS 除錯教學系列文章(5) – 常見 DNS 問題與 dig 除錯方法

DNS 系列文章目錄

DNS 除錯教學系列文章(1) – DNS 入門
DNS 除錯教學系列文章(2) – DNS 架構
DNS 除錯教學系列文章(3) – DNS 紀錄
DNS 除錯教學系列文章(4) – dig 指令
DNS 除錯教學系列文章(5) – 常見 DNS 問題與 dig 除錯方法

首先你一定有一個問題,或是查詢的目標,譬如問題是郵件不會通、網站打不開、或是想知道 www 目前指到那一台伺服器,針對你要查詢的問題,首先查 NS 的位址然後再查詢你要確認的狀況。

第一步驟 – 查詢 NS 的位址

在你作 dig 除錯開始之前,首先你要確認網域名稱的名稱伺服器(NameServer) 位址,因為所有回應都一定從名稱伺服器回應,如果你使用的是域名註冊商或是 CloudFlare 之類的服務,那你的名稱伺服器就是這些業者,就是你在網域名稱註冊商中填寫的名稱伺服器(NameServer) 欄位的資料。

但是你在除錯的時候,不要用登入網頁去查你現在的設定值是什麼,因為你應該模擬 DNS 運作的方式去取得名稱伺服器的位址,就跟正常的查訊一模一樣,該怎麼查詢名稱伺服器的位址呢?請查詢 NS 類型,你可以先用 +short 查看簡易輸出:

$ dig +short rsync.tw ns
ns2.gandi.net.
ns3.gandi.net.
ns1.gandi.net.

這樣就能知道目前網域名稱的名稱伺服器是哪幾台,也就是 DNS 紀錄是由這些伺服器管理。這是一般人查詢 NS 的方式,但最正確的方式應該是透過上層的名稱伺服器來查詢下層名稱伺服器的位址,舉例來說我要知道 rsync.tw 的名稱伺服器,我應該要對 .tw 的伺服器送出 rsync.tw 的 NS 查詢,要直接由 .tw 伺服器回應我才對,這部份要分兩個階段來做,第一步驟是你必須知道上層網域的名稱伺服器,然後第二步驟是直接對這些名稱伺服器送出查詢:

# 第一步驟
$ dig +short tw ns
a.dns.tw.
g.dns.tw.
c.dns.tw.
e.dns.tw.
b.dns.tw.
f.dns.tw.
d.dns.tw.
ns.twnic.net.
h.dns.tw.
anytld.apnic.net.

# 第二步驟
$ dig @h.dns.tw rsync.tw ns
[省略]
;; AUTHORITY SECTION:
rsync.tw.		3600	IN	NS	ns2.gandi.net.
rsync.tw.		3600	IN	NS	ns1.gandi.net.
rsync.tw.		3600	IN	NS	ns3.gandi.net.

為什麼要分兩次查詢呢?難道不能直接用 $ dig +short rsync.tw ns 的方式嗎?若是你直接用 dig 去查詢域名的 ns,系統會透過 DNS Cache Server 來查詢 NS 紀錄 (如下圖左邊),這樣有可能會拿到 Public DNS 的暫存資料,所以你應該用到第二種方式直接對 .tw 伺服器發送查詢 (如下圖右邊),才會拿到最正確的資料。

DNS 查詢

這邊是以 .tw 的網域名稱為範例,如果你是要查詢 .com 或是 .info 的域名,就要去查詢不同的上層名稱伺服器喔!

可能發生的問題

空的、沒有回應

如果你在查詢 NS 的時候出現錯誤,或是發現有回應,但是沒有資料,那表示可能是 (1) 名稱伺服器資料填錯了,請去網域名稱註冊商那邊檢查 (2) 網域到期沒繳,或是狀態有問題,可以用 Whois 查看一下是否有問題。

名稱伺服器是 Public DNS

有些人會把 Public DNS 以為是名稱伺服器,結果就把 8.8.8.8 或是 168.95.1.1 填入名稱伺服器,這當然是不對的。

跟你填的資料不同

NameServer (NS) 的資料就是你在域名註冊商所填入的名稱伺服器,像下面是我在註冊商填入的:

rsync.tw 的名稱伺服器 – Gandi.net

然後這邊是我實際查詢出來的,跟上方要長的一樣,順序沒有關係:

$ dig +short rsync.tw ns
ns2.gandi.net.
ns3.gandi.net.
ns1.gandi.net.

如果你查詢出來不一樣,則表示域名註冊商沒有將您的名稱伺服器更新到域名管理局 或是你剛好更換名稱伺服器中。

第二步驟 – 直接查詢名稱伺服器的資料

在你確認 NS 的位址之後,接下來直接對名稱伺服器送出查詢,查詢你要解析的網域名稱,名稱伺服器回應的資料應該是最新、最完整的,所以你要知道紀錄更新了沒、解析到底正不正確,都是透過直接查詢名稱伺服器來獲得解答。

假設我現在要查詢的是 www.rsync.tw 的資料,或是 rsync.tw 的 MX 紀錄,我直接對名稱伺服器查詢:

$ dig +short @ns1.gandi.net www.rsync.tw a
webredir.vip.gandi.net.
$ dig +short @ns2.gandi.net www.rsync.tw a
webredir.vip.gandi.net.
$ dig +short @ns3.gandi.net www.rsync.tw a
webredir.vip.gandi.net.

可能發生的問題

名稱伺服器同步不一致

為什麼上面的範例要查三次?因為這個網域名稱有三台名稱伺服器,如果你有十台,麻煩查 10 次,因為你要確保每一台的資料都是正確的,如果有其中一台不正確,或是尚未同步,則實際在網站連線的時候,連線就會跳來跳去,一下跑到舊的,一下跑到新的,所以若你發現舊的伺服器持續有連線,表示有某個名稱伺服器還是舊的資料。

名稱伺服器沒有回應

如果你在對名稱伺服器查詢的時候,沒有回應,表示名稱伺服器的 DNS 服務有問題,通常不一定是機器壞掉,有可能是單純 DNS 沒有啟動,這時候你才可以用 ping (ip) 的方式去看一下機器有沒有回應,如果有,表示單純 DNS 服務的問題,這是後又可以用 dig +tcp 的方式將查詢改為 TCP 連線,就可以測試是否是火牆的問題,因為有先防火牆設備 (不論是本機防火牆或是額外的設備) 預設是不開啟 UDP 連線。如果 dig +tcp 的方式有回應,就要朝向防火牆的問題去解決。

所以查詢指令有:

# 查詢名稱伺服器回應,你可以查詢 SOA,因為一定有這筆紀錄
$ dig @(NS IP) (domain) soa

# 如果上面沒有回應,改用 ping 看看是不是主機或網路問題
$ ping (NS IP)

# 如果 ping 有回應,但依舊查不到,改用 +tcp 查看是否為防火牆
$ dig +tcp @(NS IP) (domain) soa

檢查權威伺服器回答

名稱伺服器指的是由上往下的授權,譬如 rsync.tw 的名稱伺服器是由 .tw 上往下授權到 ns[1-3].gandi.net 的名稱伺服器。

雖然上往下授權了,但可不見得授權是正確的,因為上往下的授權其實是使用者自己填的,他可以亂填、或是填錯了,你會發現上層會依照使用者輸入的資料直接變成名稱伺服器(NS)。

但實際上,必須要由系統管理者在伺服器中建立正確的區域檔紀錄,並且告訴 DNS 伺服器要管理某個網域名稱,這時候電腦才會知道說這個網域是我管理範圍,所以要由我來回應。在伺服器設定了管理網域之後,這台伺服寄就會變成所謂的 “權威伺服器” ,而這台伺服器的回應,就叫做 “權威伺服器回答 (回應)” ,所以 DNS 的正確授權應該要確認兩個因素:(1) 由上對下正確授權 (2) 伺服器具備權威伺服器回答,缺一不可!

檢查權威伺服器回答很簡單,因為在 dig 的回應中本來就會顯示是否是權威伺服器回答。在 dig 的參數中不要使用 +short 就可以看到標頭 (header) 的部份,答案就在標頭的 “AA” 旗標。

$ dig @ns1.gandi.net rsync.tw a

; <<>> DiG 9.10.3-P4-Ubuntu <<>> @ns1.gandi.net rsync.tw a
; (2 servers found)
;; global options: +cmd
;; Got answer:
;; ->>HEADER<<- opcode: QUERY, status: NOERROR, id: 45858
;; flags: qr aa rd; QUERY: 1, ANSWER: 1, AUTHORITY: 0, ADDITIONAL: 1
;; WARNING: recursion requested but not available

;; OPT PSEUDOSECTION:
; EDNS: version: 0, flags:; udp: 1680
;; QUESTION SECTION:
;rsync.tw.			IN	A

;; ANSWER SECTION:
rsync.tw.		10800	IN	A	217.70.184.38

在上述的回應中,有一個 “flags: qr aa rd;”,aa = AA 就是權威伺服器回答的意思,也就是這個伺服器知道自己管理了此網域,所以會從區域檔中的資料回應給查詢端。如果你對 Public DNS 查詢的話,是不會有這個 AA 旗標的。如果你查詢的是名稱伺服器,但卻沒有 AA,表示管理員沒有正確設定伺服器。

如果你剛更新了 www 的紀錄,或是想知道 MX 的紀錄是否正確,或是設定了任何 TXT、A、CNAME 的紀錄,想知道權威伺服器是否正確,就可以做幾個查詢,然後順便檢查一下 AA 旗標,記得把名稱伺服器與網域名稱都換成你自己的喔:

# 查詢權威伺服器的 www 紀錄
$ dig @ns1.gandi.net www.rsync.tw a

# 查詢 CNAME 紀錄
$ dig @ns1.gandi.net www.rsync.tw cname

# 查詢 MX 紀錄
$ dig @ns1.gandi.net rsync.tw mx

# 查詢 TXT 紀錄
$ dig @ns1.gandi.net rysnc.tw txt

查詢快取伺服器 (Public DNS)

最後一步就是要查詢快取伺服器的回應資料,看看是否正確,一般所有的用戶電腦都會透過快取伺服器 (譬如8.8.8.8、168.95.1.1) 取得 DNS 的資料,所以我們要測試一下是否正確:

$ dig @8.8.8.8 www.rsync.tw a

可能發生的問題

查詢到舊資料

如果你查詢到舊的資料,其實不用太緊張,因為 DNS 有 TTL 暫存時間,在暫存時間內,都會保留資料直到 TTL (秒) 時間過去。這時候你要做的就是確認每一個權威伺服器的查詢是否都是最新的資料,然後你重複對同一個快取伺服器查詢,理論上你應該會看到 TTL 的時間越來越少,這時候就是等待 TTL (秒) 的時間過去。

但這時候你其實你可以查詢一下其他快取伺服器的回應,應該會回應最新的資料,例如你剛剛查詢的是 8.8.8.8,你可以試試看 101.101.101.101 或是 1.1.1.1。

# 對 Google 的 Public DNS 查詢
$ dig @8.8.8.8 www.rsync.tw a

# 對 APNIC 的 Public DNS 查詢
$ dig @101.101.101.101 www.rsync.tw a

# 對 Cloudflare 的 Public DNS 查詢
$ dig @1.1.1.1 www.rsync.tw a

解析失效 NXDOMAIN

如果你在上述查詢的過程中,都沒有問題,但是在 Public DNS 這些快取伺服器卻沒有回應,則有可能是錯誤是 DNSSEC 壞掉了,這時候請找你的域名註冊商取消你的 DNSKEY 金鑰。你可以用這個連結來測試一下 DNSSEC 有沒有問題。

分類
技術文章 教學 網域名稱

DNS 除錯教學系列文章(3) – DNS 紀錄

DNS 紀錄常見的有 A、MX、CNAME、NS 等,你知道怎麼正確設定嗎?

DNS 系列文章目錄

DNS 除錯教學系列文章(1) – DNS 入門
DNS 除錯教學系列文章(2) – DNS 架構
DNS 除錯教學系列文章(3) – DNS 紀錄
DNS 除錯教學系列文章(4) – dig 指令
DNS 除錯教學系列文章(5) – 常見 DNS 問題與 dig 除錯方法

DNS 紀錄是什麼?

在了解基礎與 DNS 架構之後,我們來了解一些 DNS 紀錄的類型,在不同的目的時,我們會需要用到不同的紀錄。DNS 基本上就是做一件事情,”對應“,白話一點說就是把網域名稱對應到一個 IP 位址,像這樣:

blog.rsync.tw => 1.2.3.4

基本上左邊是來源,右邊是目的,當你的來源與目的有不同需求的時候,就需使用不同的紀錄,上述的範例,來源是網域名稱,目的是 IP 位址,就要使用 A 紀錄,下表示不同的來源與目的時,該使用的紀錄:

來源位址目的位址DNS 類型
網域名稱名稱伺服器NS
網域名稱管理資料SOA
網域名稱郵件主機MX
網域名稱SSL 憑證CAA
主機名稱IPv4 位址A
主機名稱主機名稱CNAME
主機名稱文字TXT
主機名稱IPv6 位址AAAA
IP 位址主機名稱PTR

實際在設定的畫面長這樣,名稱指的就是來源,值就是目的位址,而類型就是對應的方式:

DNS 紀錄
DNS 紀錄

常見類型

NS 紀錄

NS 紀錄的用途有兩個,一個是向下授權,一個是平行授權。

向下授權就是建立一個子網域,譬如跟伺服器建立個一個 .tw 的子網域,並授權給 TWNIC 的主機:

$ dig +short rsync.tw ns
ns2.gandi.net.
ns1.gandi.net.
ns3.gandi.net.

平行授權指的是同一個網域名稱的所有名稱伺服器,都必須擁有相同的 NS 紀錄。以上數的例子來說,rsync.tw 已經授權給三台名稱伺服器,而這三台的 rsync.tw ns 紀錄必須完全一模一樣。

$ dig +short @ns1.gandi.net rsync.tw ns
ns1.gandi.net.
ns2.gandi.net.
ns3.gandi.net.
$ dig +short @ns2.gandi.net rsync.tw ns
ns3.gandi.net.
ns1.gandi.net.
ns2.gandi.net.
$ dig +short @ns3.gandi.net rsync.tw ns
ns2.gandi.net.
ns3.gandi.net.
ns1.gandi.net.

不一樣會怎樣?不會怎樣!真的~一開始都不會怎樣,你會發現網頁還是連的到,郵件還是會通,但是時間久了之後,你會覺得怪怪的,有時候會通,有時候不會通,有人跟你反應網頁連不到,但你自己測試又可以,這個 NS 名稱不一致的錯誤叫做 LAME Server。

SOA 紀錄

SOA 紀錄是網域名稱的系統管理紀錄,不過若你是使用一些代管 (像是 CloudFlare、Gandi LiveDNS) 這個紀錄你完全不需要處理。這個紀錄是在一起自架 DNS 主機的人會需要設定。他主要代表者這個網域名稱的管理者、管理主機、區域檔序號與全域性的 TTL 資料。

A/AAAA 紀錄

當你要將網域名稱對應到伺服器的 IP 位址的時後,就需要使用 A 紀錄,A 紀錄是 指向 IPv4位址,AAAA 紀錄是指向 IPv6 位址。

$ dig +short blog.rsync.tw a
gpaas15.dc2.gandi.net.
217.70.186.115
$ dig +short blog.rsync.tw aaaa
gpaas15.dc2.gandi.net.
2001:4b98:dc2:950::115

MX 紀錄

Mail Exchange(MX) 紀錄是指這個網域名稱的郵件主機紀錄,如果有人寄信給你,郵件主機會優先查詢這個網域名稱有沒有 MX 紀錄,如果有,就會連線到郵件主機,如果沒有特別設定 MX 紀錄,寄送郵件的主機會嘗試解析網域名稱的 A 紀錄,如果有 A 紀錄,就會嘗試連線主機的郵件伺服器。

{11:43}:@~]$ dig +short rsync.tw mx
10 spool.mail.gandi.net.
50 fb.mail.gandi.net.

當網域名稱有設定 MX 紀錄的時候,郵件主機就會嘗試去連線 spool.mail.gandi.net. (注意看是 FQDN)。MX 紀錄有一個特殊欄位就是 優先順序 因為通常郵件系統會做備援功能,就是一台壞掉的時候,另一台會接手接收郵件,然後等主郵件伺服器回復後,再把郵件寄回給主伺服器,所以在 MX 紀錄內,可以設定郵件主機的優先順序,數值越小的優先。寄給 rsync.tw 的信,會先送給 spool.mail.gandi.net. ,如果投遞不成功,就會轉連線到 fb.mail.gandi.net. 。

如果 rsync.tw 沒有 MX 紀錄,寄送的郵件主機會直接解析網域名稱的 A 紀錄,並嘗試連線到 217.70.184.38。

$ dig +short rsync.tw a
217.70.184.38

TXT/SPF 紀錄

TXT 類型就是文字的意思。你可以在任何紀錄中設定 TXT 紀錄,可以自訂文字的內容。

$ dig +short helloworld.rsync.tw txt
"This is my world."

你可以設定任何文字。那 SPF(Sender Policy Framework) 又是什麼呢?SPF 是用來設定認證你的郵件主機,你是否有看過那種冒用你的網域名稱來寄送垃圾郵件的?因為郵件協定當初並沒有很好的安全機制設計,後來就有人想到若我可以在網域名稱內宣告我自己的郵件主機,若不是列表中的主機寄出的信件,就是冒用的。就像是你在自己的網域名稱中宣告郵件主機的白名單。SPF 的宣告很簡單,也是文字格式,所以 SPF 就直接使用了 TXT 類型。SPF 的設定,請參考 WIKI

$ dig +short rsync.tw txt
"v=spf1 include:_mailcust.gandi.net ?all"

CNAME 紀錄

CNAME 紀錄也算是主機名稱的別名的一種,主要是當你的目的位址是主機名稱時,而不是常見的 IP 位址,你就需要使用 CNAME 來進行對應,查看 CNAME 時,需要把 +short 取消掉,比較看的清楚,我也先刪除了一些過多的資訊:

{12:25}:@~]$ dig  blog.rsync.tw 

;; ANSWER SECTION:
blog.rsync.tw.		433	IN	CNAME	gpaas15.dc2.gandi.net.
gpaas15.dc2.gandi.net.	40	IN	A	217.70.186.115

你可看到 blog.rsync.tw. 先 CNAME 到了 gpass15.dc2.gandi.net. 然後才再次對應到 217.70.186.115。使用 CNAME 有一個限制,就是同一筆紀錄之下,如果有設定 CNAME 紀錄,就不能在設定其他紀錄,例如你設定了 blog.rsync.tw. 的 CNAME,就不能設定 blog.rsync.tw. 的 A、MX、TXT 等等的紀錄。

所以常見問題是有些人會設定裸域名的 CNAME,例如我註冊了 rsync.tw ,而我想要把 rsync.tw 的網頁瀏覽者連到跟 blog.rsync.tw. 同樣的網站,所以設定了 rsync.tw CNAME blog.rsync.tw.

這時因為 rsync.tw 網域名稱本身就一定會帶有 SOA 與 NS 紀錄,會造成跟 CNAME 的衝突,這時後會造成網域名稱運作不穩定。所以如果你要設定裸域名的 CNAME,你可以用網頁轉址的方式。

PTR 紀錄

PTR 紀錄是將 IP 位址對應到主機名稱,譬如:

{12:38}:@~]$ dig -x 8.8.8.8 ptr 

;; ANSWER SECTION:
8.8.8.8.in-addr.arpa.	86371	IN	PTR	google-public-dns-a.google.com.

就會將 8.8.8.8 對應到主機名稱 google-public-dns-a.google.com.,通常你必須有 IP 位址的管理權,才會需要設定 PTR 紀錄。一般來說都是自架 DNS 並且有一段 IP 位址是歸你管的情況下,才會需要設定。

DNS 系列文章目錄

DNS 除錯教學系列文章(1) – DNS 入門
DNS 除錯教學系列文章(2) – DNS 架構
DNS 除錯教學系列文章(3) – DNS 紀錄
DNS 除錯教學系列文章(4) – dig 指令
DNS 除錯教學系列文章(5) – 常見 DNS 問題與 dig 除錯方法



分類
教學 最新文章 網域名稱

TTL 是什麼?該設定多久?

TTL 的全名叫做 Time to Live,是 DNS 解析的時候在使用的,主要的作用是設定每一筆紀錄在 DNS 快取伺服器所保留的時間我們常常在設定 DNS 紀錄的時候會有一個欄位叫做 TTL,到底要設定多少呢?這個值,如果你常常在變動 DNS 紀錄的話,有多小就調多小 (要看你的代管商最小能設定多少),反之,如果你沒有常常變動,可以調大一點,單位是秒,若你設定 1800,表示 1800 秒。所以當你變更這筆 DNS 紀錄的時候,要 1800 秒後才會全球生效!