# 天气查询程序探索

## 按照功能写函数模块

In [8]:
def get_data():
    """
    获取本地的天气信息文档
    """
    
    pass

def inquiry_weather():
    """
    用户输入城市名，可以返回天气数据
    """

    pass

def request_help():
    """
    用户输入指令可以获取榜之文档和退出程序的交互
    """

    print_history()
    pass

def print_history():
    """
    退出程序前打印所有的查询历史
    """

    pass

get_data()
inquiry_weather()
request_help()

## 读取本地的天气文件

#### 首先想到的思路是利用LPTHW里提到的ex15的方式去读写文件，即用`argv`传入文件名的方式，但是由于不在同一文件夹下报错说找不到文件，于是加上路径去运行,结果报错如下，语法错误，描述是unicode编码错误

In [1]:
def get_data():
    """
    获取本地的天气信息文档
    """
    w = open('C:\Users\Administrator\Py101-004\Chap1\\resource\weather_info.txt')
    print (w.read())

get_data()

SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape (<ipython-input-1-1c5fbdf9d50c>, line 5)

#### 谷歌后发现是写路径的问题，\在python中起转义字符的作用，解决方案是在路径前加r表示原始字符，或者用双斜杠符号

In [3]:
def get_data():
    """
    获取本地的天气信息文档
    """
    w = open(r'C:\Users\Administrator\Py101-004\Chap1\\resource\weather_info.txt')
    print (w.read())

get_data()

UnicodeDecodeError: 'gbk' codec can't decode byte 0xb4 in position 9: illegal multibyte sequence

#### 谷歌搜索，发现是因为读取txt文件里的中文字符时，遇见编码问题，将文件改成以utf8的方式编码后可运行。具体文档可见 [Processing Text Files in Python ](http://python-notes.curiousefficiency.org/en/latest/python3/text_file_processing.html#unicode-basics)

In [4]:
def get_data():
    """
    获取本地的天气信息文档
    """
    w = open(r"C:\Users\Administrator\Py101-004\Chap1\resource\weather_info.txt", encoding = 'utf8')
    f = w.read()

    f_list = f.split("\n")
    print (f_list[0])

    pass

get_data()

北京,晴


#### 还有一个疑问是，我在函数里写了docstrings，可是在运行函数时并未显示，难道是我的格式不对，还是这个只是为了阅读代码方便。后来发现是要去打印才行。输入print(get_data.__doc__)就可以了。查阅文档[python风格规范](http://zh-google-styleguide.readthedocs.io/en/latest/google-python-styleguide/python_style_rules/#comments)，还可以加入参数值和返回值。以下代码为测试用例。

In [7]:
def get_data():
    """
    获取本地的天气信息文档，读取并打印出第一行数据
    
    Args:
        无
    Return:
        无
    """
    w = open(r"C:\Users\Administrator\Py101-004\Chap1\resource\weather_info.txt", encoding = 'utf8')
    f = w.read()

    f_list = f.split("\n")
    print (f_list[0])

    pass

get_data()
print (get_data.__doc__)

北京,晴

    获取本地的天气信息文档，读取并打印出第一行数据
    
    Args:
        无
    Return:
        无
    


#### 但是实际上这个函数应该是返回一个dict，然后根据用户输入的key（城市名字），返回相应的value(天气情况)

In [5]:
import re

def get_data():
    '''
    Get the local weather data.

    return:
        a dict contains the weather info
    '''
    # 读取本地路径下的txt文件
    w = open(r"C:\Users\Administrator\Py101-004\Chap1\resource\weather_info.txt", encoding = 'utf8')
    f = w.read()

    # 利用re模块可以根据多个符号进行文本分割，并且打印测试
    f_list = re.split(",|\n", f)
    print (f_list[0], f_list[1])

    # 定义空列表，存放相应的城市和天气信息
    city = []
    weather_info = []
    weather = {}

    # 按照顺序将城市和天气信息存放到相应的数据类型中
    for i in range (len(f_list)):

        if (i == 0) or (i % 2 == 0):
            city.append(f_list[i])
        elif i % 2 != 0:
            weather_info.append(f_list[i])
        else:
            continue

        # 定义可查询的字典
        weather = {city: weather_info}

    print (weather.get("石家庄", 0))
    
get_data()

北京 晴


TypeError: unhashable type: 'list'

#### 谷歌后发现list类型不能作为字典的key导入（hash），尝试改成其他的类型

In [6]:
import re

def get_data():
    '''
    Get the local weather data.

    return:
        a dict contains the weather info
    '''
    # 读取本地路径下的txt文件
    w = open(r"C:\Users\Administrator\Py101-004\Chap1\resource\weather_info.txt", encoding = 'utf8')
    f = w.read()

    # 利用re模块可以根据多个符号进行文本分割，并且打印测试
    f_list = re.split(",|\n", f)
    print (f_list[0], f_list[1])

    # 定义空列表，存放相应的城市和天气信息
    city = []
    weather_info = []
    weather = {}

    # 按照顺序将城市和天气信息存放到相应的数据类型中
    for i in range (len(f_list)):

        if (i == 0) or (i % 2 == 0):
            city.append(f_list[i])
        else:
            weather_info.append(f_list[i])

    # print (city[0], weather_info[0])
    # print (city[1], weather_info[1])
    # print (city[2], weather_info[2])
    # print (city[3], weather_info[3])

    # 定义可查询的字典
    for i in range (len(city)):
        weather = {city[i]: weather_info}

    print (weather.get("石家庄", 0))

get_data()

北京 晴
0


#### 这种方式还是不行，没有真正导入。回到LPTHW，字典创建新元素的语法是 stuff[1] = "WOW"这种，而不是像赋予变量一样的直接赋值 

In [None]:
    for i in range (len(city)-1):
        c = city[i]
        d = weather_info[i]
        weather[c] = d
    # print (len(city))
    # print (len(weather_info))
    print (weather.get("石家庄", 0))

#### 改成这种方式后成功运行。这里说明下为什么是len(city)-1,因为报错 IndexError: list index out of range 后来测试发现 city的长度是2559 而weather_info的长度是2558，在for循环里超出范围。 这是因为按照，和\n来分割，文件里最后一行是空的

## 编写主函数，提交V1.0版本 

之后便是按照功能要求实现循环，主要有以下问题，探索了较长时间：

1. 打印格式化字符串时，因为format 写成了 fotmate ,导致报错str没有该类属性，还以为又是数据类型不支持，网上搜索也没效果，最后发现是拼写错误
2. 储存用户的数据，因为是在while循环里，到其中的else语句时没有定义，应该先在循环外面定义为空列表，这样为全局变量，这样在局部作用域如循环中赋值后，在外部调用仍保留数据。如同猜数字程序里返回AB值的判断
3. 探索最长的时间应该是写实现功能的while循环语句。因为一开始的思维就是错的，定义了打印历史这个函数。实际上在功能演示时，打印历史后还出出现让用户继续输入指令的提示，那就表示还在这个循环里面，因此不可能跳出循环，所以必须在循环内部里面实现打印功能。

In [None]:
# -*- coding:utf-8 -*-
import re

def get_data():
    '''
    Get the local weather data.

    return:
        a dict contains the weather info
    '''
    # 读取本地路径下的txt文件
    w = open(r"C:\Users\Administrator\Py101-004\Chap1\resource\weather_info.txt", encoding = 'utf8')
    f = w.read()

    # 利用re模块可以根据多个符号进行文本分割，并且打印测试
    f_list = re.split(",|\n", f)

    # 定义空列表，存放相应的城市和天气信息
    city = []
    weather_info = []
    weather = {}

    # 按照顺序将城市和天气信息存放到相应的数据类型中
    for i in range (len(f_list)):

        if (i == 0) or (i % 2 == 0):
            city.append(f_list[i])
        else:
            weather_info.append(f_list[i])

    # 建立可查询的字典
    for i in range (len(city)-1):
        weather[city[i]] = weather_info[i]

    return weather

def inquiry_weather():
    """
    用户输入城市名，可以返回天气数据
    """
    c = get_data()

    guest_data = []
    print_data = []
    
    # 与用户进行交互
    while True:
        a = str(input("请输入指令或您要查询的城市名:"))

        if a == "help":
            help()
        elif a == "history":
            for i in range(len(guest_data)):
                print (guest_data[i], print_data[i])
        elif a == "quit":
            break
        else:
            # 根据用户输入获取用户需要天气数据
            b = c[a]
            print ("{0}的天气状况为：{1}".format(a, b))

            # 储存用户的查询数据
            guest_data.append(a)
            print_data.append(b)

def help():
    print ("""
    输入城市名，查询该城市的天气；
    输入 help，打印帮助文档；
    输入 history，获取查询历史；
    输入 quit，退出天气查询系统。
    """)

inquiry_weather()

## 根据[教练反馈](https://github.com/AIHackers/Py101-004/issues/74)修改，提交V1.1版本

### 代码风格规范问题

1. 主函数写到main()函数里，而且在脚本最后调用(The main functionality should be in a main() function.)
2. 使用(__name__)，方便测试设置，这样作为模块导入时可以不运行main()函数（In Python, pydoc as well as unit tests require modules to be importable. Your code should always check if __name__ == '__main__' before executing your main program so that the main program is not executed when the module is imported.)
3. 参考资料[Google Python Style Guide](https://google.github.io/styleguide/pyguide.html?showone=Main#Main),有时间得好好看看

In [None]:
if __name__ == '__main__':
    main()

### 文件读取问题

1. 读取文件后没有关闭文件，这是为了防止程序出现异常后一直打开文件。可以用with..as..语句优雅地实现。这个语句可以执行调用的函数并且无论出现什么异常，都会在离开时执行exit。参考资料[ 理解Python中的with…as…语法](http://blog.csdn.net/zly9923218/article/details/53404849)；
2. 读取文件路径时，写相对路径会更加灵活，运用os.path模块来实现。熟悉3个函数的用法：os.getced() os.path.dirname(path) os.path.join()。
3. 读取文件有同学用readline()循环读取再分割，可能没有re模块来的方便

In [None]:
    root_dir = os.path.dirname(os.getcwd())
    rel_dir = os.path.join(root_dir, 'resource', 'weather_info.txt')
    with open(rel_dir, 'r', encoding = 'utf8') as w:
        f = w.read()

1. 用re的方式不一定好，参考[沥川的代码](https://github.com/Hugo1030/Py101-004/blob/master/Chap1/project/weather_info.py)里面用readline()，再循环读入到字典中，要快捷很多 
2. 看沥川的代码，没有把读取文件封装成函数，这样的会需要把本地数据读取下来存到字典里
3. 实际上只有用户输入数据后才需要查阅，但是也意味着每一次用户查阅都要重复打开文本，造成效率低下
4. [scoot教练](https://github.com/AIHackers/Py101-004/issues/42#issuecomment-325548784)对Vwan的问题解答提到对于python而言内存优于速度
5. 判断用户输入是否为正确输入时，必须先把获取到字典再去调用查询。先要在main（）的开头去运行一遍，所以还不如不封装成函数

#### 遇到readline()问题

In [2]:
# -*- coding:utf-8 -*-
import os

weather_dic = {}
history_dic = {}

# 读取本地文件，分割字符，将内容存入字典
root_dir = os.path.dirname(os.getcwd())
rel_dir = os.path.join(root_dir, 'resource', 'weather_info.txt')
with open(rel_dir, 'r', encoding = 'utf8') as w:
    for info in w.readline():
        print(info)

北
京
,
晴




1. readline()是只读取文件的第一行，因此遍历的是第一行
2. 改成readlines(),则是正确的
3. readlines() 方法用于读取所有行(直到结束符 EOF)并返回列表，该列表可以由 Python 的 for... in ... 结构进行处理。[参考](http://www.runoob.com/python/file-readlines.html)
4. 但是在运行中会包含末尾的换行符，于是用strip()来去除每行头尾空白

In [None]:
import os

weather_dic = {}
history_dic = {}

# 读取本地文件，分割字符，将内容存入字典
root_dir = os.path.dirname(os.getcwd())
rel_dir = os.path.join(root_dir, 'resource', 'weather_info.txt')
with open(rel_dir, 'r', encoding = 'utf8') as w:
    for info in w.readlines():
        info = info.strip()  # 去掉尾部的换行符号 
        city, weather = info.split(",")
        weather_dic[city] = weather

### 命名覆盖问题

1. 主要是不要用python的内置函数去命名。把help()改成了help_doc()
2. 定义变量名称最好不要用字母，否则会看不懂，并且注意有联系的变量命名最好有关联
3. 全局变量和局部变量的定义需要注意

### 列表和字典操作前都需要定义，而变量和元组不需要

In [None]:
    weather_data = get_data()
    user_data = []
    print_data = []

## 根据[ch1任务难点](https://github.com/AIHackers/Py101-004/issues/42#issuecomment-325548784)提示，探索csv的使用，编写V1.2版本

1. 使用open打开csv文件，是否还需要关闭，是否可以继续使用with...as..语句
2. 使用csv.read()函数返回read对象
3. 将read对象转换成list，便于访问
4. 将list转换成字典

In [None]:
def get_data():
    root_dir = os.path.dirname(os.getcwd())
    rel_dir = os.path.join(root_dir, 'resource', 'weather_info.csv')
    w_file = open(rel_dir, 'r', encoding = 'utf8')
    w_reader = csv.reader(w_file)
    w_data = list(w_reader)
    weather = {}

    # 两种方式都可以将list写入字典中，第二种更简洁
    # for i in range (len(w_data)):
    #     weather[w_data[i][0]] = w_data[i][1]
    for city, weather_info in w_data:
        weather[city] = weather_info
    return weather

get_data()

代码更加简洁：
1. 储存用户的两个数据，城市和天气，在list里面用括号括起来，储存元祖数据，而非单一数据
2. 打印更加简洁，对于列表习惯用for语句来循环遍历打印

In [None]:
while True:
        user_input = str(input("请输入指令或您要查询的城市名:"))
        if user_input == "help":
            help_doc()
        elif user_input == "history":
            for i in user_data:
                print(i[0], i[1])
        elif user_input == "quit":
            exit(0)
        else:
            c = get_data(user_input)
            user_data.append([user_input, c])