# 第一章 走进Python的精彩世界

## 1.1 Python语言介绍

### Python语言的概述
- 编程语言排行榜（TIOBE-2022年8月）
![](img/tiobe_rank.png)

- 编程语言流行度（IEEE SPECTRUM 2021）
![](img/ieee.png)

近日，IEEE Spectrum发布了2020年的IEEE Spectrum编程语言排行榜。

Python连续第四年夺冠。Java和C语言分列第二和第三。

为了进行编程语言流行度的分析，IEEE Spectrum编程语言排行榜综合了八个来源的11个指标，通过加权和组合来进行排行的。

这八个来源分别是CareerBuilder，GitHub，Google，Hacker News，IEEE，Reddit，Stack Overflow和Twitter。

其11个指标分别是：

1. 谷歌搜索的每种语言的点击次数。

2. 谷歌趋势报告每种语言的索引。

3. 推特上每种语言的点击次数。

4. GitHub每种语言创建的新存储库数量。

5. GitHub每种语言的活动存储库数量。

6. Stack Overflow提及的每种语言的问题数量。

7. Reddit的所有subreddit上测量了提及每种语言的帖子数。

8. Hacker News提及每种语言的帖子数量。

9. CareerBuilder上提及该语言的新职位空缺（少于30天的职位）的数量。

10. IEEE求职站点上对不同编程语言的需求数量。

11. IEEE Xplore数字图书馆提及的每种语言的文章数量。

上述数值均为1年时间内的数值。

与其它榜单不同的是，IEEE Spectrum编程语言排行榜可以让用户自己选择各个加权和组合的权重，来得到多种多样的排序结果。

### Python语言的诞生
Guido van Rossum，Python语言之父，Python名字的由来:<span class="burk">Monty Python</span>喜剧团体
![](img/guido.png)  
1.1989年的圣诞节期间，吉多*范罗苏姆为了在阿姆斯特丹打发时间，决心开发一个新的解释程序，作为ABC语言的一种继承。

2.ABC是由吉多参加设计的一种教学语言，就吉多本人看来，ABC这种语言非常优美和强大，是专门为非专业程序员设计的。但是ABC语言并没有成功，
究其原因，吉多认为是非开发造成的。吉多决心在Python中避免这一错误，并获取了非常好的效果。

3.之所以选中Python（蟒蛇）作为程序的名字，是因为他是BBC电视剧--蒙提*派森的飞行马戏团（Monty Python’s Flying Circus）的爱好者。  
![](img/蟒蛇.png)

4.1991年，第一个Python解释器诞生，它是用C语言实现的，并能够调用C语言的库文件。  
![](img/Python历史.png)

### Python语言的设计目标
1.一门简单直观的语言并与主要竞争者一样强大  
2.开源，以便任何人都可以为它做贡献  　　　
3.代码像纯英语那样容易理解  
4.适用于短期开发的日常任务  

### Python语言的哲学
![](img/py.png)


同一样问题，用不同的语言解决，代码量差距还是很多的，一般情况下Python是Java的1/5，所以说:**人生苦短，我用Python。**

### Python的优点
- 简单、易学
- 免费、开源
- 面向对象
- **丰富的库**
- 可扩展性

### Python2和Python3

## 1.2 编程环境

### 程序的编写和运行环境

In [1]:
# 一段代码
n = 10
s = 0
for i in range(1, n+1):
    s += i
print("结果是：", s)

结果是： 55


- 演示代码在交互环境运行（单句执行）：命令行
- 演示文本编辑器编辑程序，并用Python解释器执行
- 演示代码在集成环境（IDE）中运行：VS Code或PyCharm
- 演示代码在Jupyter notebook中运行：推荐的方式

### Jupyter notebook的介绍
- 文字和代码共同展现
- 代码和结果共同展现
- 代码即文档和笔记
- 数据科学的最佳搭档
- 文学编程

## 1.3 Python程序

In [2]:
# 第一个程序
inchStr = input("请输入英寸数：")
# 1英寸=2.54厘米
cm = eval(inchStr) * 2.54
print("{} inch = {} cm".format(inchStr, cm))

请输入英寸数：24
24 inch = 60.96 cm


## 1.4 实战演练 
摄氏温bai度与华氏温度的关系式  
>华氏度 = 32°F（华氏温标单位）+ 摄氏度 × 1.8  
>摄氏度 = (华氏度 - 32°F) ÷ 1.8

- 华氏温标：dao华伦海特把冰、水、氯化铵和氯化钠的混合物的熔点定为零度，以0°F表示之，把冰的熔点定为32°F，把水的沸点定为212°F，在32→212的间隔内均分180等分，这样，参考点就有了较为准确的客观依据。这就是现在仍在许多国家使用的华氏温标，华氏温标确定之后，就有了华氏温度(指示数)。

- 摄氏温标：摄耳修司( A·Celsiua)用水银作测温质，以冰的熔点为零度(标以0℃)，以水的沸点为100度(标以100℃)。他认定水银柱的长度随温度作线性变化，在0度和100度之间均分成100等份，每一份也就是每一个单位叫1摄氏度。这种规定办法就叫摄氏温标。

In [None]:
# 实战演练：上网找出华氏温度和摄氏温度的关系。从键盘输入华氏温度，转换输出摄氏温度


## 1.5 演示一个爬虫

In [10]:
import re
import requests
from bs4 import BeautifulSoup
import pandas as pd

headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'}
contents = ''
for i in range(10):
    url = 'https://movie.douban.com/top250?start=' + str(i*25) + '&filter='
    page = requests.get(url, headers=headers)
    page.raise_for_status()
    page.encoding = page.apparent_encoding
    contents += page.text
soup = BeautifulSoup(contents, "lxml")

#电影中文名
names = []
for tag in soup.find_all(attrs={'class':'title'}):
    if not tag.get_text().startswith(u'\xa0/\xa0'):
        names.append(tag.get_text())

#电影评分
scores = []
for tag in soup.find_all(attrs={'class':'rating_num'}):
    scores.append(float(tag.get_text()))

#评价人数
rates = []
for tag in soup.find_all(attrs={'class':'star'}):
    rtag = tag.find_all('span')[-1]
    rates.append(int(rtag.string[:-3]))
#print(len(rates))

df = pd.DataFrame({'电影名称':names,'评分':scores,'评价人数':rates})
df

Unnamed: 0,电影名称,评分,评价人数
0,肖申克的救赎,9.7,2115000
1,霸王别姬,9.6,1567370
2,阿甘正传,9.5,1597344
3,这个杀手不太冷,9.4,1785061
4,泰坦尼克号,9.4,1550143
5,美丽人生,9.5,996330
6,千与千寻,9.4,1661776
7,辛德勒的名单,9.5,812636
8,盗梦空间,9.3,1523728
9,忠犬八公的故事,9.4,1060169
