This repository has been archived by the owner on Mar 17, 2024. It is now read-only.
-
Notifications
You must be signed in to change notification settings - Fork 106
/
dns.go
401 lines (321 loc) · 11.4 KB
/
dns.go
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
package netLayer
import (
"errors"
"net"
"net/netip"
"os"
"strings"
"sync"
"github.com/e1732a364fed/v2ray_simple/utils"
"github.com/miekg/dns"
"go.uber.org/zap"
)
var globalDnsQueryMutex sync.Mutex
var ErrRecursion = errors.New("multiple recursion not allowed")
// 判断 DNSQuery 返回的错误 是否是 Read底层连接 的错误
func Is_DNSQuery_returnType_ReadErr(err error) bool {
if err == nil {
return false
}
switch err {
case os.ErrNotExist, dns.ErrRcode, ErrRecursion:
return false
default:
return true
}
}
//筛除掉 Is_DNSQuery_returnType_ReadErr 时,err 为 net.Error.Timeout() 的情况
func Is_DNSQuery_returnType_ReadFatalErr(err error) bool {
if !Is_DNSQuery_returnType_ReadErr(err) {
return false
}
if ne, ok := err.(net.Error); ok {
if ne.Timeout() {
return false
}
return true
}
return false
}
//domain必须是 dns.Fqdn 函数 包过的, 本函数不检查是否包过。如果不包过就传入,会报错。
// dns_type 为 miekg/dns 包中定义的类型, 如 TypeA, TypeAAAA, TypeCNAME.
// conn是一个建立好的 dns.Conn, 必须非空, 本函数不检查.
// theMux是与 conn相匹配的mutex, 这是为了防止同时有多个请求导致无法对口;内部若判断为nil,会主动使用一个全局mux.
// recursionCount 使用者统一填0 即可,用于内部 遇到cname时进一步查询时防止无限递归.
//
// 如果从conn中Read后成功返回, 则可能返回如下几种错误 os.ErrNotExist (表示查无此记录), dns.ErrRcode (表示dns返回的 Rcode 不是 dns.RcodeSuccess), ErrRecursion,
// 如果不是这三个error, 那就是 从 该 conn 读取数据时出错了.
func DNSQuery(domain string, dns_type uint16, conn *dns.Conn, theMux *sync.Mutex, recursionCount int) (net.IP, error) {
m := new(dns.Msg)
m.SetQuestion((domain), dns_type) //为了更快,不使用 dns.Fqdn, 请调用之前先确保ok
c := new(dns.Client)
if theMux == nil {
theMux = &globalDnsQueryMutex
}
theMux.Lock()
r, _, err := c.ExchangeWithConn(m, conn)
theMux.Unlock()
if r == nil {
if ce := utils.CanLogErr("dns query read err"); ce != nil {
ce.Write(zap.Error(err))
}
return nil, err
}
if r.Rcode != dns.RcodeSuccess {
if ce := utils.CanLogDebug("dns query code err"); ce != nil {
//dns查不到的情况是很有可能的,所以还是放在debug日志里
ce.Write(zap.Error(err), zap.Int("rcode", r.Rcode), zap.String("value", r.String()))
}
return nil, dns.ErrRcode
}
switch dns_type {
case dns.TypeA:
for _, a := range r.Answer {
if aa, ok := a.(*dns.A); ok {
return aa.A, nil
}
}
case dns.TypeAAAA:
for _, a := range r.Answer {
if aa, ok := a.(*dns.AAAA); ok {
return aa.AAAA, nil
}
}
}
//没A和4A那就查cname在不在
for _, a := range r.Answer {
if aa, ok := a.(*dns.CNAME); ok {
if ce := utils.CanLogDebug("dns query got cname"); ce != nil {
ce.Write(zap.String("query", domain), zap.String("target", aa.Target))
}
if recursionCount > 2 {
//不准循环递归,否则就是bug;因为有可能两个域名cname相互指向对方,好坏
if ce := utils.CanLogDebug("dns query got cname but recursionCount>2"); ce != nil {
ce.Write(zap.String("query", domain), zap.String("cname", aa.Target))
}
return nil, ErrRecursion
}
return DNSQuery(dns.Fqdn(aa.Target), dns_type, conn, theMux, recursionCount+1)
}
}
return nil, os.ErrNotExist
}
// 给 miekg/dns.Conn 加一个互斥锁, 可保证同一时间仅有一个请求发生
// 这样就不会造成并发时的混乱
type DnsConn struct {
*dns.Conn
Name string //我们这里惯例,直接使用配置文件中配置的url字符串作为Name
raddr *Addr //这个用于在Conn出故障后, 重新拨号时所使用
mutex sync.Mutex
garbageMark bool
}
//dns machine维持与多个dns服务器的连接(最好是udp这种无状态的),并可以发起dns请求。
// 会缓存dns记录; 该设施是一个状态机, 所以叫 DNSMachine
// SpecialIPPollicy 用于指定特殊的 域名-ip映射,这样遇到这种域名时,不经过dns查询,直接返回预设ip
// SpecialServerPollicy 用于为特殊的 域名指定特殊的 dns服务器,这样遇到这种域名时,会通过该特定服务器查询
type DNSMachine struct {
TypeStrategy int64 // 0, 4, 6, 40, 60
defaultConn DnsConn
conns map[string]*DnsConn
cache map[string]net.IP //cache的key统一为 未经 Fqdn包装过的域名. 即尾部没有点号
SpecialIPPollicy map[string][]netip.Addr
SpecialServerPollicy map[string]string //domain -> dns server name
mutex sync.RWMutex //读写 conns, cache, SpecialIPPollicy, SpecialServerPollicy 时所使用的 mutex
}
// Dial通过 c 内部设置好的地址进行拨号,并将 c.Conn.Conn 设为 新建立好的连接
func (c *DnsConn) Dial() error {
nc, err := DialDnsAddr(c.raddr)
if err != nil {
return err
}
c.Conn.Conn = nc
return nil
}
//建立一个与dns服务器连接, 可为纯udp的dns, 或者 DoT的. 如果是DoT的, 则要求 addr.Network == "tls",
// 如果是纯udp的,要求 addr.IsUDP() == true
func DialDnsAddr(addr *Addr) (conn net.Conn, err error) {
//实测 miekg/dns 必须用 net.PacketConn, 不过本作udp最新代码已经支持了.
// 不过dns还是没必要额外包装一次, 直接用原始的udp即可.
//在 miekg/dns 遇到非 net.PacketConn 的连接时,会采用不同的办法,先从数据读取一个长度信息,然后再读其它信息,可能它没有料到 net.Conn 被包装的情况
/*
dns over tls rfc:https://datatracker.ietf.org/doc/html/rfc7858
853端口
根据
https://datatracker.ietf.org/doc/html/rfc7858#section-3.3
每个信息之前都要传2字节的信息长度
所以显然 miekg/dns 认为传入的conn不是 net.UDPConn 就是 tls.Conn
另外,miekg/dns 不支持 doh, 证据在 https://github.com/miekg/dns/pull/800
就是因为 doh完全和 dot不同,使用了不同的数据结构.
*/
if addr.IsUDP() {
conn, err = net.DialUDP("udp", nil, addr.ToUDPAddr())
} else {
conn, err = addr.Dial()
}
//todo: 以后支持DoH的话,要分离出https这个Network然后单独使用独特方法进行dial
return
}
func (dm *DNSMachine) SetDefaultConn(c net.Conn, addr *Addr) {
dm.defaultConn.Conn = new(dns.Conn)
dm.defaultConn.Conn.Conn = c
dm.defaultConn.raddr = addr
}
// 添加一个 特定的DNS服务器 , name为该dns服务器的名称. 若第一次调用, 则会设为 dm.DefaultConn
func (dm *DNSMachine) AddNewServer(name string, addr *Addr) error {
if dm.defaultConn.Conn == nil { //若未配置过 DefaultConn
dm.defaultConn = DnsConn{Conn: new(dns.Conn), raddr: addr, Name: name}
err := dm.defaultConn.Dial()
if err != nil {
return err
}
} else {
dcc := &DnsConn{Conn: new(dns.Conn), raddr: addr, Name: name}
err := dcc.Dial()
if err != nil {
return err
}
if dm.conns == nil {
dm.conns = make(map[string]*DnsConn)
}
dm.conns[name] = dcc
}
return nil
}
func (dm *DNSMachine) Query(domain string) (ip net.IP) {
switch dm.TypeStrategy {
default:
fallthrough
case 0, 4:
ip = dm.QueryType(domain, dns.TypeA)
if ip == nil {
ip = dm.QueryType(domain, dns.TypeAAAA)
}
case 6:
ip = dm.QueryType(domain, dns.TypeAAAA)
if ip == nil {
ip = dm.QueryType(domain, dns.TypeA)
}
case 40:
ip = dm.QueryType(domain, dns.TypeA)
case 60:
ip = dm.QueryType(domain, dns.TypeAAAA)
}
return
}
//传入的domain必须是不带尾缀点号的domain, 即没有包过 Fqdn
func (dm *DNSMachine) QueryType(domain string, dns_type uint16) (ip net.IP) {
var generalCacheHit bool // 若读到了 cache 或 SpecialIPPollicy 的项, 则 generalCacheHit 为 true
var theDNSServerConn *DnsConn
defer func() {
if theDNSServerConn != nil && theDNSServerConn.garbageMark {
dm.mutex.Lock()
delete(dm.conns, theDNSServerConn.Name)
if theDNSServerConn == &dm.defaultConn {
//如果DefaultConn都废了,那就糟糕
//我们选一个备用的conn,升格为defaultConn
dm.defaultConn.Conn = nil
if len(dm.conns) > 0 {
for name, c := range dm.conns {
dm.defaultConn.Conn = c.Conn
dm.defaultConn.garbageMark = false
delete(dm.conns, name)
break
}
}
//没备用的,那就只好保持 dm.defaultConn.Conn 的 nil状态, 下一次dns查询就会失败
}
dm.mutex.Unlock()
}
if generalCacheHit {
if ce := utils.CanLogDebug("[DNSMachine] hit cache"); ce != nil {
ce.Write(zap.String("domain", domain), zap.String("ip", ip.String()))
}
return
}
if len(ip) > 0 {
domain = strings.TrimSuffix(domain, ".")
if ce := utils.CanLogDebug("[DNSMachine] will add to cache"); ce != nil {
ce.Write(zap.String("domain", domain), zap.String("ip", ip.String()))
}
dm.mutex.Lock()
if dm.cache == nil {
dm.cache = make(map[string]net.IP)
}
dm.cache[domain] = ip
dm.mutex.Unlock()
}
}()
//golang的defer原理: 多个defer 调用顺序是LIFO(后入先出),defer后的操作可以理解为压入栈中
//所以实际是会先 dm.mutex.RUnlock(), 再调用 上面的 RLock, RUnlock, 所以不存在死锁导致无法return的问题
dm.mutex.RLock()
defer dm.mutex.RUnlock()
// 查找步骤:
//先从 cache找,有就直接返回
//然后,
//先查 specialIPPollicy,类似cache,有就直接返回
//
// 查不到再找 specialServerPollicy 看有没有特殊的dns服务器
// 如果有指定服务器,用指定服务器查dns,若没有,用默认服务器查
if dm.cache != nil {
if ip = dm.cache[domain]; ip != nil {
generalCacheHit = true
return
}
}
if dm.SpecialIPPollicy != nil {
if na := dm.SpecialIPPollicy[domain]; len(na) > 0 {
switch dns_type {
case dns.TypeA:
for _, a := range na {
if a.Is4() || a.Is4In6() {
aa := a.As4()
generalCacheHit = true
return aa[:]
}
}
case dns.TypeAAAA:
for _, a := range na {
if a.Is6() {
aa := a.As16()
generalCacheHit = true
return aa[:]
}
}
}
}
}
theDNSServerConn = &dm.defaultConn
if len(dm.conns) > 0 && len(dm.SpecialServerPollicy) > 0 {
if dnsServerName := dm.SpecialServerPollicy[domain]; dnsServerName != "" {
if serConn := dm.conns[dnsServerName]; serConn != nil {
theDNSServerConn = serConn
}
}
}
if theDNSServerConn.Conn == nil { //如果配置文件只配置了自定义映射, 而没配置dns服务器的话, 那么我们就无法进行实际的dns查询
if ce := utils.CanLogDebug("[DNSMachine] no server configured, return nil."); ce != nil {
ce.Write()
}
return
}
domain = dns.Fqdn(domain)
if ce := utils.CanLogDebug("[DNSMachine] start querying"); ce != nil {
ce.Write(zap.String("domain", domain), zap.String("through", theDNSServerConn.Name))
}
ip, err := DNSQuery(domain, dns_type, theDNSServerConn.Conn, &theDNSServerConn.mutex, 0)
if Is_DNSQuery_returnType_ReadFatalErr(err) {
//如果是读取的、非timeout的错误,那么我们直接认为底层连接出故障了, 我们需要重新dial
//因为 miekg/dns 包会设置4秒的timeout,所以确实要筛除timeout的情况
theDNSServerConn.Conn.Close()
err = theDNSServerConn.Dial()
if err != nil {
//再dial还是错误?那么就废了,
if ce := utils.CanLogErr("[DNSMachine] Re-Dial Dns Server Failed"); ce != nil {
ce.Write(zap.Error(err))
}
theDNSServerConn.garbageMark = true
}
//我们只是重新Dial,并不再次查询,否则就又递归了
}
return ip
}