# 答疑安排


1. 作业一讲解
2. 典型问题讲解
3. 参考书籍


**希望大家多在评论区留言**

**希望大家多在群里交流**


* 不建议使用代码分享网站提交

> 作业要求

> 将2012_2021.csv文件中的数据，整理到excel中； 要求：
>> + 根据年份创建对应的sheet，
>> + 将年份对应的数据保存到对应的sheet中，
>> + **使用面向对象实现**
>> + 文件打开编码格式：utf-8-sig

## 存在问题

1. 面向对象的思维还不够熟悉
2. 库语句使用不熟，自己定义自己实现
3. 自己实现硬代码过多，命名比较另类

## 作业讲解

## 面向对象概念理解

下面我用一个简单的例子来讲解面向对象的概念和应用。

假设我们要建模一个图书馆的系统，其中有两个类：`图书`和`图书馆`。`图书`类具有属性如书名、作者、出版日期等，还有方法如借阅、归还等操作。`图书馆`类包含多个图书对象，并提供查询图书、借阅图书、归还图书等功能。

首先，我们创建一个`Book`类来表示图书：

```python
class Book:
    def __init__(self, title, author, publish_date):
        self.title = title
        self.author = author
        self.publish_date = publish_date
        self.status = "available"
    
    def borrow(self):
        if self.status == "available":
            self.status = "borrowed"
            print("Successfully borrowed the book:", self.title)
        else:
            print("The book is not available for borrowing.")
    
    def return_book(self):
        if self.status == "borrowed":
            self.status = "available"
            print("Successfully returned the book:", self.title)
        else:
            print("The book has not been borrowed.")
```

接下来，我们创建一个`Library`类来表示图书馆：

```python
class Library:
    def __init__(self):
        self.books = []
    
    def add_book(self, book):
        self.books.append(book)
        print("Successfully added book:", book.title)
    
    def borrow_book(self, book_title):
        for book in self.books:
            if book.title == book_title:
                book.borrow()
                return
        print("The book", book_title, "is not found in the library.")
    
    def return_book(self, book_title):
        for book in self.books:
            if book.title == book_title:
                book.return_book()
                return
        print("The book", book_title, "is not found in the library.")
    
    def display_books(self):
        print("Books in the library:")
        for book in self.books:
            print(book.title)
```

现在我们可以使用这两个类来模拟图书馆的操作：

```python
# 创建几本图书
book1 = Book("Python入门教程", "张三", "2020-01-01")
book2 = Book("Java编程基础", "李四", "2019-05-15")
book3 = Book("数据结构与算法", "王五", "2020-03-10")

# 创建图书馆
library = Library()

# 将图书添加到图书馆中
library.add_book(book1)
library.add_book(book2)
library.add_book(book3)

# 显示所有图书
library.display_books()

# 借阅一本图书
library.borrow_book("Python入门教程")

# 再次显示所有图书
library.display_books()

# 归还已借阅的图书
library.return_book("Python入门教程")

# 再次显示所有图书
library.display_books()
```

在上面的例子中，我们使用了面向对象的思想，将数据和操作封装到了对应的类中，通过创建对象来调用类的方法。这样可以使代码更加结构化，模块化和可维护性更好，也更加符合现实世界的事物和行为。

## python命名规则

在Python中，命名有一些规则和约定，以下是一些常见的规则和示例：

1. 变量名和函数名：
   - 只能包含字母、数字和下划线，不能包含空格和特殊字符。
   - 开头必须是字母或下划线，不能以数字开头。
   - 区分大小写，比如`my_var`和`My_Var`是不同的变量名。
   - 应该具有描述性，能够清晰地表示变量或函数的用途。
   - 尽量避免使用Python的关键字和内置函数名作为变量或函数名。
   
   示例：
   ```python
   age = 25
   name = "John"
   
   def calculate_sum(a, b):
       return a + b
   ```

2. 类名：
   - 遵循和变量名类似的规则。
   - 通常首字母大写，采用驼峰命名法（每个单词首字母大写，无下划线）。
   
   示例：
   ```python
   class Circle:
       def __init__(self, radius):
           self.radius = radius
   ```

3. 常量名：
   - 通常使用全大写字母，单词间用下划线分隔。
   - 常量是不可变的值，约定不应在代码中修改。

   示例：
   ```python
   PI = 3.14159
   MAX_VALUE = 100
   ```

4. 模块名：
   - 模块是一组相关的变量、函数和类的集合。
   - 通常使用全部小写字母，如果名称较长，可以用下划线分隔。

   示例：
   ```python
   import math
   import my_module
   ```

总而言之，良好的命名规范可以增加代码的可读性和可维护性，建议根据上述规则给变量、函数、类和模块选择清晰且有意义的名称。

# 先行知识点讲解

* **open**

在Python中，`open()`函数用于打开文件，并返回一个文件对象。它可以用于读取、写入和追加文件。下面是一些`open()`函数的示例：

1. 以只读模式打开文件：
```python
file = open("example.txt", "r")
```

2. 以写入模式打开文件：
```python
file = open("example.txt", "w")
```

3. 以追加模式打开文件：
```python
file = open("example.txt", "a")
```


在这些示例中，"example.txt"是要操作的文件名。第二个参数是模式，可以是：
- "r"：只读模式（默认值）
- "w"：写入模式，如果文件不存在则会创建新文件，如果文件已存在则会覆盖原内容
- "a"：追加模式，在文件末尾添加内容
- 更多模式请参考Python文档。

打开文件后，可以使用文件对象执行读取或写入操作。完成操作后，应该使用`file.close()`方法关闭文件，以释放系统资源。

* **if**


在Python中，if语句是一种条件执行的控制流语句。它允许根据给定条件的真假来选择性地执行不同的代码块。基本的if语句的语法如下：

```python
if 条件:
    # 条件为真时执行的代码块
else:
    # 条件为假时执行的代码块
```

下面是一个简单示例，根据用户输入的年龄输出不同的结果：

```python
age = int(input("请输入您的年龄："))

if age >= 18:
    print("您已成年，可以投票。")
else:
    print("您未成年，不能投票。")
```

在上述示例中，if语句检查用户输入的年龄是否大于或等于18。如果条件成立，则打印"您已成年，可以投票"；否则，打印"您未成年，不能投票"。

除了基本的if语句之外，还可以使用if-elif-else结构来处理多个条件。例如：

```python
num = int(input("请输入一个整数："))

if num > 0:
    print("这是一个正数。")
elif num < 0:
    print("这是一个负数。")
else:
    print("这是零。")
```

在上述示例中，根据用户输入的整数，输出相应的结果。

在Python中，还可以使用条件表达式（三元运算符）来简化if语句的书写。条件表达式的语法如下：

```python
x = [value_if_true] if [condition] else [value_if_false]
```

下面是一个示例：

```python
age = 20
message = "已成年" if age >= 18 else "未成年"
print(message)
```

在上述示例中，根据年龄age的条件，将相应的字符串赋值给message变量，并打印出来。


* **DataFrame**

一、创建DataFrame
假设我们有如下一组数据：学生姓名、年龄和成绩。

| 学生姓名 | 年龄 | 成绩 |
|----------|------|------|
| 张三     | 20   | 80   |
| 李四     | 21   | 90   |
| 王五     | 19   | 70   |

我们可以使用Pandas的DataFrame来表示这个数据集。首先，我们需要导入Pandas库。

```python
import pandas as pd
```

然后，我们可以使用字典来创建DataFrame，其中字典的每个键表示列名，对应的值表示该列的数据。

```python
data = {'学生姓名': ['张三', '李四', '王五'],
        '年龄':   [20, 21, 19],
        '成绩':   [80, 90, 70]}
df = pd.DataFrame(data)
```

二、查看DataFrame的内容

我们可以使用head()方法查看DataFrame的前几行数据，默认为前5行。

```python
df.head()
```

输出结果如下：

```
学生姓名  年龄  成绩
0  张三    20  80
1  李四    21  90
2  王五    19  70
```

三、访问DataFrame的列

我们可以通过列名来访问DataFrame中的列。

```python
df['学生姓名']
```

输出结果如下：

```
0    张三
1    李四
2    王五
Name: 学生姓名, dtype: object
```

四、添加和修改DataFrame的列

我们可以使用赋值语句来添加和修改DataFrame的列。

```python
df['性别'] = ['男', '男', '女']
df['成绩'] = [90, 95, 85]
```

此时，DataFrame的内容如下：

```
学生姓名  年龄  成绩  性别
0  张三    20  90  男
1  李四    21  95  男
2  王五    19  85  女
```

五、删除DataFrame的列

我们可以使用drop()方法来删除DataFrame的列。

```python
df = df.drop('性别', axis=1)
```

此时，DataFrame的内容如下：

```
学生姓名  年龄  成绩
0  张三    20  90
1  李四    21  95
2  王五    19  85
```

六、按条件筛选DataFrame的行

我们可以使用布尔表达式来筛选DataFrame的行。

```python
df[df['年龄'] > 20]
```

输出结果如下：

```
学生姓名  年龄  成绩
1  李四    21  95
```

同时在Pandas中，我们可以通过布尔表达式按照条件筛选DataFrame的行。

1. 使用布尔表达式筛选：我们可以使用布尔表达式直接在DataFrame中使用来筛选符合条件的行。

```python
df[df['年龄'] > 20]
```

上述代码筛选出年龄大于20岁的行。

2. 使用多个条件筛选：我们可以使用多个条件组合进行筛选，使用括号将不同条件组合起来。

```python
df[(df['年龄'] == '21') & (df['成绩'] > 90)]
```

上述代码筛选出年龄为21且成绩大于90的行。

3. 使用isin()方法筛选：如果我们想筛选出某一列中的多个值，可以使用isin()方法。

```python
df[df['学生姓名'].isin(['张三', '李四'])]
```

上述代码筛选出学生姓名为张三或李四的行。

4. 使用query()方法筛选：Pandas提供了query()方法来进行更复杂的条件筛选。

```python
df.query('年龄 == "21" and 成绩 > 90')
```

上述代码筛选出年龄为21且成绩大于90的行。

5. 使用where()方法筛选：我们可以使用where()方法来将不符合条件的行的值替换成NaN。

```python
df.where(df['成绩'] > 90)
```

上述代码将不符合条件的行的成绩替换成NaN。

需要注意的是，以上方法均返回一个新的DataFrame，原始的DataFrame不会发生改变。如果希望修改原始DataFrame，可以使用inplace=True参数。

```python
df.query('年龄 == "21" and 成绩 > 90', inplace=True)
```

以上就是按条件筛选DataFrame的行的几种常见方法，根据实际情况选择合适的方法来筛选出满足条件的行。

七、对DataFrame进行排序

我们可以使用sort_values()方法对DataFrame进行排序。

```python
df.sort_values('成绩', ascending=False)
```

输出结果如下：

```
学生姓名  年龄  成绩
1  李四    21  95
0  张三    20  90
2  王五    19  85
```

以上就是Pandas库中DataFrame的基本用法。通过DataFrame，我们可以灵活地对二维数据进行操作，包括创建、查看、访问、添加、修改、删除、筛选和排序等。

# 作业讲解

In [1]:
# 其中一种解决方法

import csv
import openpyxl

class DataToExcel:

    def __init__(self, filename):
        self.filename = filename
        self.wb = openpyxl.Workbook()
        csvfile = open(self.filename, newline='', encoding='utf-8-sig')
        self.data = csv.DictReader(csvfile)

    def sort_to_new_excel(self,field_name,output_filename):
        for data_dict in self.data:
            field = data_dict.get(field_name)
            if field not in self.wb.sheetnames:
                self.wb.create_sheet(field)
                self.wb[field].append(list(data_dict.keys()))
            self.wb[field].append(list(data_dict.values()))
        del self.wb['Sheet']
        self.wb.save(output_filename)

my_task = DataToExcel('1686117568248-题目1数据.csv')
my_task.sort_to_new_excel('年份','mydata.xlsx')

In [3]:
# pandas的一种解决方法

import pandas as pd

class DataToExcel:
    '''
    作用
    参数
    返回值
    '''
    def __init__(self, filename):
        self.filename = filename
        self.df = pd.read_csv(self.filename, encoding='utf-8-sig')
        

    def sort_to_new_excel(self,field_name,output_name):
        self.year_list = self.df[field_name].unique()
        with pd.ExcelWriter(output_name) as writer:
            for year in self.year_list:
                year_df = self.df[self.df[field_name] == year]
                year_df.to_excel(writer, sheet_name=str(year), index=None)


my_task = DataToExcel('1686117568248-题目1数据.csv')
my_task.sort_to_new_excel('年份','my_data.xlsx')

# 拓展知识

## 官方文档

https://docs.python.org/zh-cn/3/

## csv模块

https://docs.python.org/zh-cn/3/library/csv.html?highlight=csv

## openpyxl 文档

https://www.osgeo.cn/openpyxl/api/openpyxl.html

## workbook模块

https://www.osgeo.cn/openpyxl/api/openpyxl.packaging.workbook.html


## pandas 文档

https://pandas.pydata.org/pandas-docs/stable/index.html

## dataframe模块

https://pandas.pydata.org/pandas-docs/stable/reference/frame.html#dataframe

## 推荐参考书籍

1 Python编程 从入门到实践 第3版（图灵出品） https://item.jd.com/11993134.html
![image.png](attachment:image.png)

2 流畅的Python（第2版）（图灵出品）https://item.jd.com/13888566.html
![image-2.png](attachment:image-2.png)

## 官方文档

https://docs.python.org/zh-cn/3/

## csv模块

https://docs.python.org/zh-cn/3/library/csv.html?highlight=csv

## openpyxl 文档

https://www.osgeo.cn/openpyxl/api/openpyxl.html

## workbook模块

https://www.osgeo.cn/openpyxl/api/openpyxl.packaging.workbook.html


## pandas 文档

https://pandas.pydata.org/pandas-docs/stable/index.html

## dataframe模块

https://pandas.pydata.org/pandas-docs/stable/reference/frame.html#dataframe


