# 10.2 python中socket的参数详解


In [1]:
from socket import *
sk = socket(family=AF_INET,type=SOCK_STREAM,proto=0,fileno=None)
print(sk)


<socket.socket fd=1288, family=AddressFamily.AF_INET, type=SocketKind.SOCK_STREAM, proto=0>


# 10.2.1 UDP协议编程


### server

In [1]:
import socket
udp_sk = socket.socket(type=socket.SOCK_DGRAM)   #创建一个服务器的套接字
udp_sk.bind(('127.0.0.1',9999))        #绑定服务器套接字
msg,addr = udp_sk.recvfrom(1024)
print(msg)
# udp_sk.sendto(b'hello client!',addr)                 # 对话(接收与发送)
udp_sk.close()                                 # 关闭服务器套接字 

b'hello server!'


### client

In [None]:
import socket
ip_port=('127.0.0.1',9999)
udp_sk=socket.socket(type=socket.SOCK_DGRAM)
udp_sk.sendto(b'hello server!',ip_port)
back_msg,addr=udp_sk.recvfrom(1024)
print(back_msg.decode('utf-8'),addr)

### 例10-1    编写UDP通信程序，发送端发送一个字符串“Hello world!”。接收端在计算机的5000端口进行接收，并显示接收内容，如果收到字符串bye（忽略大小写）则结束监听。

### 接收端代码receiver.py：

In [1]:
import socket

# 使用IPV4协议，使用UDP协议传输数据
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# 绑定端口和端口号，空字符串表示本机任何可用IP地址
s.bind(('', 5000))
while True:
    data, addr = s.recvfrom(1024)
    # 显示接收到的内容
    data = data.decode()
    print('received message:{0} from PORT {1[1]} on {1[0]}'.format(data, addr))
    if data.lower() == 'bye':
        break
s.close()


received message:hello from PORT 52165 on 127.0.0.1
received message:你好 from PORT 52174 on 127.0.0.1
received message:bye from PORT 52193 on 127.0.0.1


### 发送端代码sender.py：


In [None]:
import socket
import sys

s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# 假设127.0.0.1是接收端机器的IP地址
s.sendto(sys.argv[1].encode(), ("127.0.0.1", 5000))
s.close()

In [None]:
python test.py hello

首先启动一个命令提示符环境并运行接收端程序，这时接收端程序处于阻塞状态，接下来再启动一个新的命令提示符环境并运行发送端程序，此时会看到接收端程序继续运行并显示接收到的内容以及发送端程序所在计算机IP地址和占用的端口号。

当发送端发送字符串bye后，接收端程序结束，此后再次运行发送端程序时接收端没有任何反应，但发送端程序也并不报错。这正是UDP协议的特点，即“尽最大努力传输”，并不保证非常好的服务质量。


# 基于udp协议的socket来实现qq聊天

### server

In [None]:
import socket
ip_port=('127.0.0.1',8081)
u_sk=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)
u_sk.bind(ip_port)

while True:
    qq_msg,addr=u_sk.recvfrom(1024)
    print('来自[%s:%s]的一条消息:\033[1;42m%s\033[0m' %(addr[0],addr[1],qq_msg.decode('utf-8')))
    back_msg=input('回复消息: ').strip()

    u_sk.sendto(back_msg.encode('utf-8'),addr)

来自[127.0.0.1:49209]的一条消息:[1;42m你好[0m
回复消息: hello
来自[127.0.0.1:49209]的一条消息:[1;42m你在哪？[0m
回复消息: 郑州


### client

In [None]:
import socket
bufsize = 1024
u_sk=socket.socket(socket.AF_INET,socket.SOCK_DGRAM)

qq_name_dic={
    '罗盛运':('127.0.0.1',8081),
    '罗德华':('127.0.0.1',8081),
    '刘永贵':('127.0.0.1',8081),
    '周曾吕':('127.0.0.1',8081),
}


while True:
    qq_name=input('请选择聊天对象: ').strip()
    while True:
        msg=input('请输入消息,回车发送,输入q结束和他的聊天: ').strip()
        if msg == 'q':break
        if not msg or not qq_name or qq_name not in qq_name_dic:continue
        u_sk.sendto(msg.encode('utf-8'),qq_name_dic[qq_name])

        back_msg,addr=u_sk.recvfrom(bufsize)
        print(addr)
        print('来自[%s:%s]的一条消息:\033[1;41m%s\033[0m' %(addr[0],addr[1],back_msg.decode('utf-8')))

u_sk.close()

# 时间服务器

### server

strftime() 函数接收以时间元组，并返回以可读字符串表示的当地时间，格式由参数format决定。

In [None]:
from socket import *
from time import strftime

ip_port = ('127.0.0.1', 9888)
bufsize = 1024

tcp_server = socket(AF_INET, SOCK_DGRAM)
tcp_server.setsockopt(SOL_SOCKET,SO_REUSEADDR,1)
tcp_server.bind(ip_port)

while True:
    msg, addr = tcp_server.recvfrom(bufsize)
    print('===>', msg)

    if not msg:
        time_fmt = '%Y-%m-%d %X'
    else:
        time_fmt = msg.decode('utf-8')
    back_msg = strftime(time_fmt)

    tcp_server.sendto(back_msg.encode('utf-8'), addr)

tcp_server.close()

===> b'%Y %m %d'
===> b'%m %d %Y'


### client

In [None]:
from socket import *
ip_port=('127.0.0.1',9888)
bufsize=1024

tcp_client=socket(AF_INET,SOCK_DGRAM)

while True:
    msg=input('请输入时间格式(例%Y %m %d)>>: ').strip()
    tcp_client.sendto(msg.encode('utf-8'),ip_port)

    data=tcp_client.recv(bufsize)
    print(data)

# 10.2.2 TCP编程


### server

In [1]:
import socket
sk = socket.socket()
sk.bind(('127.0.0.1',9999))  #把地址绑定到套接字
sk.listen()                           #监听链接
conn,addr = sk.accept()      #接受客户端链接
ret = conn.recv(1024)        #接收客户端信息
print(ret)                           #打印客户端信息
# conn.send(b'hello client!')             #向客户端发送信息
conn.close()                   #关闭客户端套接字
sk.close()                      #关闭服务器套接字(可选)


b'hello server!'


### client

In [None]:
import socket
sk = socket.socket()                   # 创建客户套接字
sk.connect(('127.0.0.1',9999))    # 尝试连接服务器
sk.send(b'hello server!')
ret = sk.recv(1024)                    # 对话(发送/接收)
print(ret)
sk.close()                                   # 关闭客户套接字

### 例10-2  TCP通信程序。模拟机器人聊天软件原理，服务端提前建立好字典，然后根据接收到的内容自动回复。


### 客户端代码chatclient.py： 


In [None]:
import socket
import sys

# 服务端主机IP地址和端口号
HOST = '127.0.0.1'
PORT = 50007
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
try:
    # 连接服务器
    s.connect((HOST, PORT))
except Exception as e:
    print('Server not found or not open')
    sys.exit()

while True:
    c = input('Input the content you want to send:')
    # 发送数据
    s.sendall(c.encode())
    # 从服务端接收数据
    data = s.recv(1024)
    data = data.decode()
    print('Received:', data)
    if c.lower() == 'bye':
        break
# 关闭连接
s.close()


### 服务端代码chatserver.py


In [1]:
import socket
from os.path import commonprefix

words = {'how are you?': 'Fine,thank you.',
         'how old are you?': '38',
         'what is your name?': 'Dong FuGuo',
         "what's your name?": 'Dong FuGuo',
         'where do you work?': 'University',
         'bye': 'Bye'}
HOST = ''
PORT = 50007
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 绑定socket
s.bind((HOST, PORT))
# 开始监听一个客户端连接
s.listen(1)
print('Listening on port:', PORT)
conn, addr = s.accept()
print('Connected by', addr)
# 开始聊天
while True:
    data = conn.recv(1024).decode()
    if not data:
        break
    print('Received message:', data)
    # 尽量猜测对方要表达的真正意思
    m = 0
    key = ''
    for k in words.keys():
        # 删除多余的空白字符
        data = ' '.join(data.split())
        # 与某个“键”非常接近，就直接返回
        if len(commonprefix([k, data])) > len(k) * 0.7:
            key = k
            break
        # 使用选择法，选择一个重合度较高的“键”
        length = len(set(data.split()) & set(k.split()))
        if length > m:
            m = length
            key = k
    # 选择合适的信息进行回复
    conn.sendall(words.get(key, 'Sorry.').encode())
conn.close()
s.close()



Listening on port: 50007
Connected by ('127.0.0.1', 51235)
Received message: how are you?
Received message: who are you?
Received message: I am ...


ConnectionResetError: [WinError 10054] 远程主机强迫关闭了一个现有的连接。

启动一个命令提示符环境并运行服务端程序，服务端开始监听；启动一个新的命令提示符环境并运行客户端程序，服务端提示连接已建立；在客户端输入要发送的信息后，服务端会根据提前建立的字典来自动回复。服务端每次都在固定的端口进行监听，而客户端每次建立连接时可能会使用不同的端口。如果服务端程序没有运行，那么客户端就无法建立连接，当然也无法发送任何信息，这正是TCP协议区别于UDP协议的地方。


# 黏包现象

### 1、什么是黏包？

### 同时执行多条命令之后，得到的结果很可能只有一部分，在执行其他命令的时候又接收到之前执行的另外一部分结果，这种显现就是黏包。简单来说就是当发送多条命令时，我们接收不到所有信息，只有当再发送下一条消息时之前未接收到的消息才发过来。下面用代码来看一下效果。

### 基于tcp协议的黏包

### server

In [None]:
import socket

sk = socket.socket()

sk.bind(('127.0.0.1', 8080))
sk.listen()
conn, addr = sk.accept()
while True:
    cmd = input('请输入您的消息：')
    if cmd == 'q':
        conn.send(b'q')
    conn.send(cmd.encode('gbk'))
    res = conn.recv(1024).decode('gbk')
    print(res)

conn.close()
sk.close()

### client

In [None]:
import socket
import subprocess

sk = socket.socket()
sk.connect(('127.0.0.1',8080))
while True:
    cmd = sk.recv(1024).decode('gbk')
    if cmd == 'q':
        break
    res = subprocess.Popen(cmd,shell=True,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
    sk.send(res.stdout.read())
    sk.send(res.stderr.read())

sk.close()

### 输出情况：

In [None]:
请输入您的消息：dir
 驱动器 C 中的卷是 Windows 
 卷的序列号是 788E-35E9

 C:\Users\shewe\Desktop 的目录

2020/04/30  07:12    <DIR>          .
2020/04/30  07:12    <DIR>          ..
2020/04/30  06:28    <DIR>          .ipynb_checkpoints
2020/03/23  23:36           942,015 1.0能源区块链的发展现状：架构、应用与发展趋势.docx
2020/04/03  14:24             1,310 70_毁伤仿真系统(孔德峰）.lnk
2020/03/02  13:33               870 Start Tor Browser.lnk
2020/03/02  13:33    <DIR>          Tor Browser
2020/04/30  07:12             4,263 Untitled.ipynb
2020/04/17  10:27             1,271 _2020年国家重点研发.lnk
2020/04/17  00:07             1,277 _2020年郑州市重大专项.lnk
2020/04/29  23:34    <DIR>          上课
2020/02/14  11:07               256 坚果云.lnk
2020/04/18  17:24    <DIR>          应用
2020/04/29  17:17           129,124 微信图片_20200429171659.jpg
2020/02/15  09:50             1,231 有道云笔记.lnk
2020/04/23  12:15           730,092 涌现计算综述_李劲.pdf
2020/02/10  14:24             1,226 疫情期间文件.lnk
请输入您的消息：dir

2020/02/07  13:11             1,060 百度网盘.lnk
2020/04/01  10:49           177,422 路绪红_第二版 .docx
2020/01/24  00:07         2,173,664 零样本学习研究进展.pdf
2020/04/22  23:01           318,987 霍丽娟第一稿0407.docx
              15 个文件      4,484,068 字节
               6 个目录 82,966,528,000 可用字节

请输入您的消息：dir
 驱动器 C 中的卷是 Windows 
 卷的序列号是 788E-35E9

 C:\Users\shewe\Desktop 的目录

2020/04/30  07:28    <DIR>          .
2020/04/30  07:28    <DIR>          ..
2020/04/30  06:28    <DIR>          .ipynb_checkpoints
2020/03/23  23:36           942,015 1.0能源区块链的发展现状：架构、应用与发展趋势.docx
2020/04/03  14:24             1,310 70_毁伤仿真系统(孔德峰）.lnk
2020/03/02  13:33               870 Start Tor Browser.lnk
2020/03/02  13:33    <DIR>          Tor Browser
2020/04/30  07:28             4,835 Untitled.ipynb
2020/04/17  10:27             1,271 _2020年国家重点研发.lnk
2020/04/17  00:07             1,277 _2020年郑州市重大专项.lnk
2020/04/29  23:34    <DIR>          上课
2020/02/14  11:07               256 坚果云.lnk
2020/04/18  17:24    <DIR>          应用
2020/04/29  17:17           129,124 微信图片_20200429171659.jpg
2020/02/15  09:50             1,231 有道云笔记.lnk
2020/04/23  12:15           730,092 涌现计算综述_李劲.pdf
2020/02/10  14:24             1,226 疫情期间文件.lnk
请输入您的消息：dir

2020/02/07  13:11             1,060 百度网盘.lnk
2020/04/01  10:49           177,422 路绪红_第二版 .docx
2020/01/24  00:07         2,173,664 零样本学习研究进展.pdf
2020/04/22  23:01           318,987 霍丽娟第一稿0407.docx
              15 个文件      4,484,640 字节
               6 个目录 82,965,917,696 可用字节
 驱动器 C 中的卷是 Windows 
 卷的序列号是 788E-35E9

 C:\Users\shewe\Desktop 的目录

2020/04/30  07:28    <DIR>          .
2020/04/30  07:28    <DIR>          ..
2020/04/30  06:28    <DIR>          .ipynb_checkpoints
2020/03/23  23:36           942,015 1.0能源区块链的发展现状：架构、应用与发展趋势.docx
2020/04/03  14:24             1,310 70_毁伤仿真系统(孔德峰）.lnk
2020/03/02  13:33               870 Start Tor Browser.lnk
2020/03/02  13:33    <DIR>          Tor Browser
2020/04/30  07:28             4,835 Untitled.ipynb
2020/04/17  10:27             1,271 _2020年国家重点研发.lnk
2020/04/17  00:07             1,277 _2020年郑州市重大专项.lnk
2020/04/29  23:34    <DIR>          上课
请输入您的消息：cd

2020/02/14  11:07               256 坚果云.lnk
2020/04/18  17:24    <DIR>          应用
2020/04/29  17:17           129,124 微信图片_20200429171659.jpg
2020/02/15  09:50             1,231 有道云笔记.lnk
2020/04/23  12:15           730,092 涌现计算综述_李劲.pdf
2020/02/10  14:24             1,226 疫情期间文件.lnk
2020/02/07  13:11             1,060 百度网盘.lnk
2020/04/01  10:49           177,422 路绪红_第二版 .docx
2020/01/24  00:07         2,173,664 零样本学习研究进展.pdf
2020/04/22  23:01           318,987 霍丽娟第一稿0407.docx
              15 个文件      4,484,640 字节
               6 个目录 82,965,848,064 可用字节
 驱动器 C 中的卷是 Windows 
 卷的序列号是 788E-35E9

 C:\Users\shewe\Desktop 的目录

2020/04/30  07:28    <DIR>          .
2020/04/30  07:28    <DIR>          ..
2020/04/30  06:28    <DIR>          .ipynb_checkpoints
2020/03/23  23:36           942,015 1.0能源区块链的发展现状：架构、应用与发展趋势.docx
2020/04/03  14:24             1,310 70_毁伤仿真系统(孔德峰）.lnk
202
请输入您的消息：.
0/03/02  13:33               870 Start Tor Browser.lnk
2020/03/02  13:33    <DIR>          Tor Browser
2020/04/30  07:28             4,835 Untitled.ipynb
2020/04/17  10:27             1,271 _2020年国家重点研发.lnk
2020/04/17  00:07             1,277 _2020年郑州市重大专项.lnk
2020/04/29  23:34    <DIR>          上课
2020/02/14  11:07               256 坚果云.lnk
2020/04/18  17:24    <DIR>          应用
2020/04/29  17:17           129,124 微信图片_20200429171659.jpg
2020/02/15  09:50             1,231 有道云笔记.lnk
2020/04/23  12:15           730,092 涌现计算综述_李劲.pdf
2020/02/10  14:24             1,226 疫情期间文件.lnk
2020/02/07  13:11             1,060 百度网盘.lnk
2020/04/01  10:49           177,422 路绪红_第二版 .docx
2020/01/24  00:07         2,173,664 零样本学习研究进展.pdf
2020/04/22  23:01           318,987 霍丽娟第一稿0407.docx
              15 个文件      4,484,640 字节
               6 个目录 82,965,848,064 可用字节
C:\Users\shewe\Desktop

请输入您的消息：.
'.' 不是内部或外部命令，也不是可运行的程序
或批处理文件。


### 上面就发生了黏包的现象。注意：由于udp是面向报文等传输。所以udp永远不会出现黏包现象。

### 2、黏包发生的原因

当发送端缓冲区的长度大于网卡的MTU时，tcp会将这次发送的数据拆成几个数据包发送出去。 
MTU是Maximum Transmission Unit的缩写。意思是网络上传送的最大数据包。MTU的单位是字节。 大部分网络设备的MTU都是1500。如果本机的MTU比网关的MTU大，大的数据包就会被拆开来传送，这样会产生很多数据包碎片，增加丢包率，降低网络速度。

### 面向流的通信特点和Nagle算法：
TCP（transport control protocol，传输控制协议）是面向连接的，面向流的，提供高可靠性服务。收发两端（客户端和服务器端）都要有一一成对的socket，因此，发送端为了将多个发往接收端的包，更有效的发到对方，使用了优化方法（Nagle算法），将多次间隔较小且数据量小的数据，合并成一个大的数据块，然后进行封包。这样，接收端，就难于分辨出来了，必须提供科学的拆包机制。 即面向流的通信是无消息保护边界的。 对于空消息：tcp是基于数据流的，于是收发的消息不能为空，这就需要在客户端和服务端都添加空消息的处理机制，防止程序卡住。
而udp是基于数据报的，即便是你输入的是空内容（直接回车），也可以被发送，udp协议会帮你封装上消息头发送过去。 
可靠黏包的tcp协议：tcp的协议数据不会丢，没有收完包，下次接收，会继续上次继续接收，己端总是在收到ack时才会清除缓冲区内容。数据是可靠的，但是会粘包。

# 黏包现象的解决方案

### 方案一：黏包现象的本质在于，接收端不知道发送端将要传送的字节流的长度，所以解决粘包的方法就是围绕，如何让发送端在发送数据前，把自己将要发送的字节流总大小让接收端知晓，然后接收端来一个死循环接收完所有数据。

![jupyter](./粘包解决方案.png)

### server

In [None]:
import socket,subprocess
ip_port=('127.0.0.1',8080)
s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
s.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)

s.bind(ip_port)
s.listen(5)

while True:
    conn,addr=s.accept()
    print('客户端',addr)
    while True:
        msg=conn.recv(1024)
        if not msg:break
        res=subprocess.Popen(msg.decode('utf-8'),shell=True,\
                            stdin=subprocess.PIPE,\
                         stderr=subprocess.PIPE,\
                         stdout=subprocess.PIPE)
        err=res.stderr.read()
        if err:
            ret=err
        else:
            ret=res.stdout.read()
        data_length=len(ret)
        conn.send(str(data_length).encode('utf-8'))
        data=conn.recv(1024).decode('gbk')
        if data == 'recv_ready':
            conn.sendall(ret)
    conn.close()

### client

In [None]:
import socket

s=socket.socket(socket.AF_INET,socket.SOCK_STREAM)
res=s.connect_ex(('127.0.0.1',8080))

while True:
    msg=input('>>: ').strip()
    if len(msg) == 0:continue
    if msg == 'quit':break

    s.send(msg.encode('utf-8'))
    length=int(s.recv(1024).decode('utf-8'))
    s.send('recv_ready'.encode('utf-8'))
    send_size=0
    recv_size=0
    data=b''
    while recv_size < length:
        data+=s.recv(1024)
        recv_size+=len(data)


    print(data.decode('gbk'))
s.close()

### 方案一存在的问题：程序的运行速度远快于网络传输速度，所以在发送一段字节前，先用send去发送该字节流长度，这种方式会放大网络延迟带来的性能损耗。

# 10.3.1  简单嗅探器实现


### 例10-3  网络嗅探器程序。下面的代码运行60秒钟，然后输出本机所在局域网内非本机发出的数据包，并统计不同主机发出的数据包数量。


### 嗅探器程序需要管理员权限。

In [None]:
import socket
import threading
import time

activeDegree = dict()
flag = 1

def main():
    global activeDegree
    global flag
    
    HOST = socket.gethostbyname(socket.gethostname())
    s = socket.socket(socket.AF_INET, socket.SOCK_RAW)
    s.bind((HOST, 0))
    s.ioctl(socket.SIO_RCVALL, socket.RCVALL_ON)   # 接收所有包

    while flag:
        data, addr = s.recvfrom(65565)             # 接收一个数据包
        host = addr[0]
        activeDegree[host] = activeDegree.get(host, 0) + 1
        if addr[0] != '10.2.1.3':                  # 过滤指定IP地址的消息
            print(data, addr)
            
    s.ioctl(socket.SIO_RCVALL, socket.RCVALL_OFF)  # 关闭混杂模式
    s.close()
    
t = threading.Thread(target=main)
t.start()
time.sleep(60)
flag = 0
t.join()
for item in activeDegree.items():
    print(item)


### 10.3.2  多进程端口扫描器


In [None]:
import socket
import multiprocessing
import sys


def ports(ports_service):
    # 获取常用端口对应的服务名称
    for port in list(range(1, 100)) + [143, 145, 113, 443, 445, 3389, 8080]:
        try:
            ports_service[port] = socket.getservbyport(port)
        except socket.error:
            pass


def ports_scan(host, ports_service):
    ports_open = []
    try:
        sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    except socket.error:
        print('socket creation error')
        sys.exit()

    for port in ports_service:
        try:
            sock.connect((host, port))  # 尝试连接指定端口
            ports_open.append(port)  # 记录打开的端口
            sock.close()
        except socket.error:
            pass

    return ports_open


if __name__ == '__main__':
    # 要扫描的端口号
    ports_service = dict()
    ports(ports_service)

    # 创建进程池，允许最多8个进程同时运行
    pool = multiprocessing.Pool(processes=8)
    net = '127.0.0.'
    results = dict()
    # 设置要扫描的主机IP地址范围
    for host_number in map(str, range(1, 5)):
        host = net + host_number
        # 创建一个新进程，同时记录其运行结果
        results[host] = pool.apply_async(ports_scan, (host, ports_service))
        print('starting ' + host + '...')
    # 关闭进程池，close()必须在join()之前调用
    pool.close()
    # 等待进程池中的进程全部执行结束
    pool.join()

    # 打印输出结果
    for host in results:
        print('=' * 30)
        print(host, '.' * 10)
        # result[host]的值是个结果对象，需要使用get()获取其中的数据
        for port in results[host].get():
            print(port, ':', ports_service[port])


# 扩展与提高


### 1.端口映射原理与实现


### sockMiddle.py

In [None]:
import sys
import socket
import threading

def middle(conn, addr):
    '''conn是面向客户端的连接,addr是客户端地址'''
    # 面向服务器的Socket
    sockDst = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    try:
        sockDst.connect((ipServer, portServer))
    except:
        print('Server not started.')
        sys.exit()
    
    while True:
        data = conn.recv(1024).decode()
        print('收到客户端消息：'+data)
        if data == '不要发给服务器':
            conn.send('该消息已被代理服务器过滤'.encode())
            print('该消息已过滤')
        elif data.lower() == 'bye':
            print(str(addr)+'客户端关闭连接')
            break
        else:
            sockDst.send(data.encode())
            print('已转发服务器')
            data_fromServer = sockDst.recv(1024).decode()
            print('收到服务器回复的消息：'+data_fromServer)
            if data_fromServer == '不要发给客户端':
                conn.send('该消息已被代理服务器修改'.encode())
                print('消息已被篡改')
            else:
                conn.send(b'Server reply:'+data_fromServer.encode())
                print('已转发服务器消息给客户端')
        
    conn.close()
    sockDst.close()

def main():
    sockScr = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    sockScr.bind(('', portScr))
    sockScr.listen(200)
    print('代理已启动')
    
    while True:
        try:
            conn, addr = sockScr.accept()
            t = threading.Thread(target=middle, args=(conn, addr))
            t.start()
            print('新客户：'+str(addr))
        except:
            pass
        
if __name__ == '__main__':
    try:
        # (本机IP地址,portScr)<==>(ipServer,portServer)
        # 代理服务器监听端口
        portScr = int(sys.argv[1])
        # 服务器IP地址与端口号
        ipServer = sys.argv[2]
        portServer = int(sys.argv[3])
        main()
    except:
        print('Sth error')


### sockMiddle_client.py

In [None]:
import sys
import socket

def main():
    sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    sock.connect((ip, port))
    
    while True:
        data = input('What do you want to ask:')
        sock.send(data.encode())
        print(sock.recv(1024).decode())
        if data.lower() == 'bye':
            break
    sock.close()

if __name__ == '__main__':
    try:
        #代理服务器的IP地址和端口号
        ip = sys.argv[1]
        port = int(sys.argv[2])
        main()
    except:
        print('Sth error')


### sockMiddle_server.py

In [None]:
import sys
import socket
import threading

# 回复消息，原样返回
def replyMessage(conn):
    while True:
        data = conn.recv(1024)
        conn.send(data)
        if data.decode().lower() == 'bye':
            break
    conn.close()

def main():
    sockScr = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    sockScr.bind(('', port))
    sockScr.listen(200)
    
    while True:
        try:
            conn, addr = sockScr.accept()
            # 只允许特定主机访问本服务器
            if addr[0] != onlyYou:
                conn.close()
                continue
            # 创建并启动线程
            t = threading.Thread(target=replyMessage, args=(conn,))
            t.start()        
        except:
            print('error')

if __name__ == '__main__':
    try:
        # 获取命令行参数，服务端口和代理服务器IP地址
        port = int(sys.argv[1])
        onlyYou = sys.argv[2]
        print('Server started...')
        main()
    except:
        print('Must give me a number as port, and an agent IP address')
        


# FTP通信原理与实现


### ftpServer.py

In [None]:
import socket
import threading
import os
import struct

# 用户账号、密码、主目录
# 也可以把这些信息存放到数据库中
users = {'zhangsan':{'pwd':'zhangsan1234',
                     'home':r'c:\python 3.5'},
         'lisi':{'pwd':'lisi567',
                 'home':'c:\\'}}

def server(conn, addr, home):
    print('新客户端：'+str(addr))
    
    # 进入当前用户主目录
    os.chdir(home)
    
    while True:
        data = conn.recv(100).decode().lower()
        # 显示客户端输入的每一条命令
        print(data)
        
        # 客户端退出
        if data in ('quit', 'q'):
            break
        
        # 查看当前文件夹的文件列表
        elif data in ('list', 'ls', 'dir'):
            files = str(os.listdir(os.getcwd()))
            files = files.encode()
            conn.send(struct.pack('I', len(files)))
            conn.send(files)
            
        # 切换至上一级目录
        elif ''.join(data.split()) == 'cd..':
            cwd = os.getcwd()
            newCwd = cwd[:cwd.rindex('\\')]
            # 考虑根目录的情况
            if newCwd[-1] == ':':
                newCwd += '\\'
            # 限定用户主目录
            if newCwd.lower().startswith(home):
                os.chdir(newCwd)
                conn.send(b'ok')
            else:
                conn.send(b'error')
                
        # 查看当前目录
        elif data in ('cwd', 'cd'):
            conn.send(str(os.getcwd()).encode())
            
        elif data.startswith('cd '):
            # 指定最大分隔次数，考虑目标文件夹带有空格的情况
            # 只允许使用相对路径进行跳转
            data = data.split(maxsplit=1)
            if len(data) == 2 and  os.path.isdir(data[1]) \
               and data[1] != os.path.abspath(data[1]):
                os.chdir(data[1])
                conn.send(b'ok')
            else:
                conn.send(b'error')
                
        # 下载文件
        elif data.startswith('get '):
            data = data.split(maxsplit=1)
            # 检查文件是否存在
            if len(data) == 2 and os.path.isfile(data[1]):
                # 确认文件存在
                conn.send(b'ok')
                # 读取文件内容
                with open(data[1], 'rb') as fp:
                    content = fp.read()
                # 先发送文件字节总数量，然后再发送数据
                conn.send(struct.pack('I', len(content)))
                conn.send(content)
            else:
                conn.send(b'no')
        #无效命令
        else:
            pass
            
    conn.close()
    print(str(addr)+'关闭连接')

#创建Socket，监听本地端口，等待客户端连接
sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
sock.bind(('', 10800))
sock.listen(5)
print('Server started....')

while True:
    conn, addr = sock.accept()
    #验证客户端输入的用户名和密码是否正确
    userId, userPwd = conn.recv(1024).decode().split(',')
    if userId in users and users[userId]['pwd'] == userPwd:
        conn.send(b'ok')
        #为每个客户端连接创建并启动一个线程，参数为连接、客户端地址、客户主目录
        home = users[userId]['home']
        t = threading.Thread(target=server, args=(conn,addr,home))
        t.daemon = True
        t.start()
    else:
        conn.send(b'error')


### ftpClient.py

In [None]:
import socket
import sys
import re
import struct
import getpass


def main(serverIP):
    sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    sock.connect((serverIP, 10800))

    userId = input('请输入用户名：')
    # 使用getpass模块的getpass()方法获取密码，不回显
    userPwd = getpass.getpass('请输入密码：')
    message = userId + ',' + userPwd
    sock.send(message.encode())
    login = sock.recv(100)
    # 验证是否登录成功
    if login == b'error':
        print('用户名或密码错误')
        return

    # 整数编码大小
    intSize = struct.calcsize('I')

    while True:
        # 接收客户端命令，其中##>是提示符
        command = input('##> ').lower().strip()
        # 没有输入任何有效字符，提前进入下一次循环，等待用户继续输入
        if not command:
            continue

        # 向服务端发送命令
        command = ' '.join(command.split())
        sock.send(command.encode())

        # 退出
        if command in ('quit', 'q'):
            break

        # 查看文件列表
        elif command in ('list', 'ls', 'dir'):
            loc_size = struct.unpack('I', sock.recv(intSize))[0]
            files = eval(sock.recv(loc_size).decode())
            for item in files:
                print(item)

        # 切换至上一级目录
        elif ''.join(command.split()) == 'cd..':
            print(sock.recv(100).decode())

        # 查看当前工作目录
        elif command in ('cwd', 'cd'):
            print(sock.recv(1024).decode())

        # 切换至指定文件夹
        elif command.startswith('cd '):
            print(sock.recv(100).decode())

        # 从服务器下载文件
        elif command.startswith('get '):
            isFileExist = sock.recv(2)
            # 文件不存在
            if isFileExist != b'ok':
                print('error')

            # 文件存在，开始下载
            else:
                print('downloading.', end='')
                size = struct.unpack('I', sock.recv(intSize))[0]
                data = b''
                while True:
                    if size == 0:
                        break
                    elif size > 4096:
                        temp = sock.recv(4096)
                        data += temp
                        size -= len(temp)
                    else:
                        temp = sock.recv(size)
                        data += temp
                        size -= len(temp)

                with open(command.split()[1], 'wb') as fp:
                    fp.write(data)
                print('ok')

        # 无效命令
        else:
            print('无效命令')
    sock.close()


if __name__ == '__main__':
    if len(sys.argv) != 2:
        print('Usage:{0} serverIPAddress'.format(sys.argv[0]))
        exit()

    serverIP = "127.0.0.1" # sys.argv[1]
    if re.match(r'^\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}$', serverIP):
        main(serverIP)
    else:
        print('服务器地址不合法')
        exit()


# SQLite代理原理与实现


### sqliteServer.py

In [None]:
##
# 服务器程序，接收代理服务器转发来的SQL指令，并返回结果
##

import sqlite3
import socket
import struct


def getData(sql):
    '''通过给定的SQL SELECT语句返回结果'''
    with sqlite3.connect(r'database.db') as conn:
        cur = conn.cursor()
        cur.execute(sql)
        result = cur.fetchall()
    return result


def doSql(sql):
    '''适用于DELETE/UPDATE/INSERT INTO语句，返回影响的记录条数'''
    with sqlite3.connect(r'database.db') as conn:
        cur = conn.cursor()
        result = cur.execute(sql)
    return result.rowcount


# 创建socket对象，默认使用IPV4+TCP
sockServer = socket.socket()
sockServer.bind(('', 3030))
sockServer.listen(1)

print('Server Started.....')
while True:
    # 接收客户端连接
    try:
        conn, addr = sockServer.accept()
    except:
        continue

    sql = conn.recv(1024).decode('gbk').lower()

    if sql.startswith(('update', 'delete', 'insert')):
        try:
            # 首先发送要发送的字节总数量
            # 然后再发送真实数据
            result = str(doSql(sql)).encode('gbk')
            conn.send(struct.pack('i', len(result)))
            conn.send(result)
        except:
            message = b'error'
            conn.send(struct.pack('i', len(message)))
            conn.send(message)
    elif sql.startswith('select'):
        try:
            result = str(getData(sql)).encode('gbk')
            conn.send(struct.pack('i', len(result)))
            conn.send(result)
        except:
            message = b'error'
            conn.send(struct.pack('i', len(message)))
            conn.send(message)


### sqliteAgent.py

In [None]:
##
# 代理服务器，在SQLite数据库服务器和客户端之间进行指令和数据的转发
# 这样可以把数据库和程序放到两个服务器上进行分离
##

import socket
from threading import Thread
import struct

sockServer = socket.socket()
sockServer.bind(('',5050))
sockServer.listen(50)

def agent(conn):
    # 接收客户端发来的指令，并进行过滤
    sql = conn.recv(1024)
    if not sql.decode('gbk').startswith(('select', 'delete', 'insert','update')):
        message = b'not a sql statement'
        conn.send(struct.pack('i', len(message)))
        conn.send(message)
        return
    else:
        sockClient = socket.socket()
        # 尝试连接服务器
        try:
            sockClient.connect(('10.2.1.3', 3030))
        except:
            message = b'Server not alive'
            conn.send(struct.pack('i', len(message)))
            conn.send(message)
            return
            
        # 向服务程序转发SQL语句
        sockClient.send(sql)

        # 数据量大小，使用sturct序列化一个整数需要4个字节
        size = sockClient.recv(4)
        conn.send(size)

        size = struct.unpack('i', size)[0]
        while True:
            if size == 0:
                break
            elif size > 4096:
                # 注意，虽然设置缓冲区大小为4096，
                # 并且待接收的数据也大于4096，
                # 但仍不能保证本次一定能接收4096字节的数据
                data = sockClient.recv(4096)
                conn.send(data)
                size -= len(data)
            else:
                data = sockClient.recv(size)
                conn.send(data)
                size -= len(data)
        sockClient.close()
    conn.close()

print('Agent started......')
while True:
    conn, _ = sockServer.accept()
    Thread(target=agent, args=(conn,)).start()
    


### sqliteClient.py


In [None]:
##
# 模拟客户端，向SQLite代理服务器发送指令并接收数据
##

import sqlite3
import socket
import struct

while True:
    sql = input('输入一个要执行的SQL语句：\n')
    # 没有输入，进入下一次循环
    if sql.strip() == '':
        continue
    
    # 输入exit或quit，退出客户端
    if sql in ('exit', 'quit'):
        break

    # 建立socket，尝试连接
    sockClient = socket.socket()
    try:
        sockClient.connect(('10.2.1.3', 5050))        
    except:
        print('代理服务器异常，请检查')
    else:
        # 发送远程SQL语句
        sockClient.send(sql.encode('gbk'))
        size = sockClient.recv(4)
        size = struct.unpack('i', size)[0]
        
        data = b''
        while True:
            if size == 0:
                break
            elif size > 4096:
                # 注意断包和粘包
                # 虽然设置了4096，但是不一定能够接收4096字节，即使缓冲区的数据远大于4096
                t = sockClient.recv(4096)
                data += t
                size -= len(t)
            else:
                t = sockClient.recv(size)
                data += t
                size -= len(t)
        data = data.decode('gbk')
        try:
            data = eval(data)
        except:
            pass
        sockClient.close()
        print(data)


# 10.4.1 网页内容读取与域名分析


### 10.4.1 网页内容读取与域名分析


In [None]:
import urllib.request 
fp = urllib.request.urlopen(r'https://news.sina.com.cn/c/xl/2020-04-29/doc-iirczymi9087377.shtml')
# print(fp.read(10000))
print(fp.read(10000).decode())
fp.close()


### 使用GET方法提交参数并访问页面（Python 3.x）

In [None]:
>>> import urllib.request
>>> import urllib.parse
>>> params = urllib.parse.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
>>> url = "http://www.musi-cal.com/cgi-bin/query?%s" % params
>>> with urllib.request.urlopen(url) as f:
        print(f.read().decode('utf-8'))


### 使用POST方法提交参数并访问页面（Python 3.x）

In [None]:
>>> import urllib.request
>>> import urllib.parse
>>> data = urllib.parse.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
>>> data = data.encode('ascii')
>>> with urllib.request.urlopen("http://requestb.in/xrbl82xr", data) as f:
       print(f.read().decode('utf-8'))


### 使用HTTP代理访问指定网页（Python 3.x）

In [None]:
>>> import urllib.request
>>> proxies = {'http': 'http://proxy.example.com:8080/'}
>>> opener = urllib.request.FancyURLopener(proxies)
>>> with opener.open("http://www.python.org") as f:
    f.read().decode('utf-8')


### 在Python程序中使用下面的代码调用浏览器打开指定网页

In [None]:
import webbrowser
webbrowser.open('http://www.163.com')
