## 人工智能编程基础（试学班）

## 项目：我的微信好友

在这个notebook文件中，有些模板代码已经提供给你，但你还需要实现更多的功能来完成这个项目。除非有明确要求，你无须修改任何已给出的代码。以**'(练习)'**开始的标题表示接下来的代码部分中有你需要实现的功能。这些部分都配有详细的指导，需要实现的部分也会在注释中以'TODO'标出。请仔细阅读所有的提示。

除了实现代码外，你还**需要**回答一些与项目及代码相关的问题。每个需要回答的问题都会以 **'问题 X'** 标记。请仔细阅读每个问题，并且在问题后的 **'回答'** 部分写出完整的答案。我们将根据 你对问题的回答 和 撰写代码实现的功能 来对你提交的项目进行评分。

>**提示：**Code 和 Markdown 区域可通过 **Shift + Enter** 快捷键运行。此外，Markdown可以通过双击进入编辑模式。

---

### 让我们开始吧

在这个项目中，你将通过开源的微信个人号接口 [itchat](http://itchat.readthedocs.io/zh/latest/) 来实现 Python 调用微信好友数据，并做一些有趣的统计和分析，最终分享给你的好友 :P

### 项目内容

我们将这个notebook分为不同的步骤，你将完成以下5个任务：

**Task 0 - 登陆微信，并通过向文件传输助手发送打招呼信息**

**Task 1 - 统计你的微信好友的男女比例**

**Task 2 - 分析微信好友的地域分布**

**Task 3 - 生成微信好友的签名词云图**

**Task 4 - 对签名进行情感分析**

## Task 0. 登陆并发送打招呼信息

### 登陆
在这一个章节中，我们已经为你导入`itchat`这个包，并调用`login()`函数登陆网页微信，试试看运行以下代码，并扫描二维码以登陆网页微信。

In [None]:
# 导入 itchat 这个包，以便于在之后可以调用其中所提供的函数
import itchat

# 调用login()函数以登录网页微信
itchat.login()

### 打个招呼吧

在这个章节中，我们将调用`itchat`的`send()`函数向文件传输助手`filehelper`发送一个打招呼信息吧！

#### 练习: 
 - 将想要发送的信息内容赋值给`message`

In [None]:
### TODO：将消息内容赋值给message并运行代码块给你的文件传输助手发送消息

message = None

In [None]:
# 发送消息
itchat.send(message, 'filehelper')

打开手机微信端的文件传输助手，看看是否收到了这条信息，并回答以下问题。

**问题0**: message 的变量类型是什么？

**回答**：（请在这里填写你的回答）

## Task 1. 好友男女比例

In [None]:
# 获取好友列表
dataset = itchat.get_friends(update=True)[0:]

根据我们希望探索的问题，需要从数据集中取出以下几个部分：
- NickName：微信昵称
- Sex：性别，1表示男性，2表示女性
- Province：省份
- City：城市
- Signature：微信签名

In [None]:
# 数据预处理 取出需要的特征
def preprocess_data(dataset):

    data = [{'NickName': item['NickName'], 
            'Sex': item['Sex'], 
            'Province': item['Province'], 
            'City': item['City'], 
            'Signature': item['Signature']} for item in dataset]
    
    return data
pre_data = preprocess_data(dataset)

#### 练习
* 打印`pre_data`的数据类型
* 打印`pre_data`中的第一条数据，以及其数据类型。
* 打印`pre_data`中第一条数据的微信昵称

In [None]:
### TODO：打印pre_data的数据类型


In [None]:
### TODO：打印第一条数据及数据类型


In [None]:
### TODO：打印第一条数据的微信昵称


**问题1**: pre_data的数据类型是什么？pre_data中第一条数据的数据类型呢？这两种数据类型的优缺点分别是什么？

回答：（请在这里填写你的回答）

In [1]:
# 导入数据可视化所需要的包
import matplotlib.pyplot as plt
%matplotlib inline

#### 练习：
- 统计好友性别，分为男性、女性与未知三种，赋值到已经定义好的`sex`字典中

提示：
- `pre_data`中1表示男性、2表示女性；
- 数据需要从第1条开始计算，因为第0条是自己。

In [None]:
sex = {
    'male': 0,
    'female': 0,
    'unknown': 0
}

# TODO：统计好友性别








print("我的好友中共有", male,"位男性、", female, "位女性，", "有", unknown, "位好友未填写。")

plt.figure(figsize=(8,5), dpi=80)
plt.axes(aspect=1) 
plt.pie([sex['male'], sex['female'], sex['unknown']],
        labels=['Male','Female','Unknown'],
        labeldistance = 1.1,
        autopct = '%3.1f%%',
        shadow = False,
        startangle = 90,
        pctdistance = 0.6 
)

plt.legend(loc='upper left',)
plt.title(u"%s Wechat Friends' Sex Ratio" % pre_data[0]['NickName'])
plt.show()

## Task 2. 好友地域分布
练习：
- 使用`list`中`append()`方法将好友省份添加至`province`中，注意要去除空的字符串

In [None]:
### TODO：将好友所在省份（不为空）添加到 province 中
province = []







In [None]:
import pinyin
province = [pinyin.get(i, format="strip", delimiter="") for i in province if i != '']

In [None]:
import pandas as pd
province = pd.DataFrame(province)
province.columns = ['Province']
province['Number of Friends'] = 1
province.groupby('Province').sum().sort_values('Number of Friends', ascending=False)[:10].plot.bar()

## Task 3. 生成好友个性签名词云图

练习：
* 使用`print()`语句打印出自己的个性签名

In [None]:
### TODO：打印自己的个性签名





In [None]:
import re
import os 
import numpy as np

In [None]:
### 不用修改以下代码，直接运行即可

tList = []
for i in pre_data:
    signature = i["Signature"].replace(" ", "").replace("span", "").replace("class", "").replace("emoji", "")
    rep = re.compile("1f\d.+")
    signature = rep.sub("", signature)
    if len(signature) > 0:
        tList.append(signature)
    
text = "".join(tList)


import jieba
wordlist_jieba = jieba.cut(text, cut_all=True)
wl_space_split = " ".join(wordlist_jieba)


from wordcloud import WordCloud
import PIL.Image as Image

alice_coloring = np.array(Image.open("wechat.jpg")))

my_wordcloud = WordCloud(background_color="white", max_words=2000, mask=alice_coloring,
                         max_font_size=40, random_state=42,).generate(wl_space_split)

plt.imshow(my_wordcloud)
plt.axis("off")
plt.show()

my_wordcloud.to_file(os.path.join(d, "wechatfriends_wordcloud.png"))

## Task 4. 对好友签名进行情感分析

在这部分内容中，我们调用了[SnowNLP](https://github.com/isnowfy/snownlp)的情感分析，它是一个python写的类库，可以方便的处理中文文本内容，不用我们实现其中具体的代码。

在这里，我们希望了解到好友签名所表达出来的情感是积极的，还是中立、负面的，比如说在以下例子中，我们对"这个商品我非常喜欢，颜色很合我意！"这句话进行了预处理，并通过训练好的模型预测其的情感。

在这里，我们简单地假设大于0.66表示积极，低于0.33表示消极，其他表示中立。

运行以下代码试试看！

In [8]:
from snownlp import SnowNLP

text = "这个商品我非常喜欢，颜色很合我意！"
sentiment = SnowNLP(text).sentiments

print(sentiment)

0.6851400314498396


接下来，我们将好友的签名进行文本预处理，并尝试统计其中积极、中立、消极的个数。

练习：
* 统计sentiments中大于0.66的个数
* 统计sentiments中大于等于0.33且小于等于0.66的个数
* 统计sentiments中小于0.33的个数

In [None]:
setiments = []
for i in tList:
    setiments.append(SnowNLP(i).sentiments) 

### TODO：统计sentiments中大于0.66的个数


### TODO：统计sentiments中大于等于0.33且小于等于0.66的个数


### TODO：统计sentiments中小于0.33的个数



In [None]:
labels = [u'Negative',u'Neutral',u'Positive']
values = (negative,neutral,positive)
plt.xlabel(u'Sentiment Analysis')
plt.ylabel(u'Number')
plt.xticks(range(3),labels)
plt.bar(range(3), values)

plt.title('Sentiment Analysis of Friends signature')
plt.show()

In [None]:
itchat.logout()

**注意: 当你写完了所有的代码，并且回答了所有的问题。你就可以把你的 iPython Notebook 导出成 HTML 文件。你可以在菜单栏，这样导出File -> Download as -> HTML (.html)把这个 HTML 和这个 iPython notebook 一起做为你的作业提交。**