# pandas读取不同数据源的数据

In [None]:
import pandas as pd

In [None]:
# 设置每列最大宽度（比如 100）
pd.set_option('display.max_colwidth', 100)

# 设置显示的最大列数（比如 20）
pd.set_option('display.max_columns', 20)

# 设置显示宽度（比如 1000）
pd.set_option('display.width', 1000)


# 文本文件的读取

## 读取文本文件

### 使用read_table读取文件

In [None]:
musicdata0 = pd.read_table('./pd_data/musicdata.csv', sep=',', encoding='gbk')

In [None]:
print(len(musicdata0))  #信息表的长度为

In [None]:
print(musicdata0)

### 使用read_csv读取文件

In [None]:
musicdata1 = pd.read_csv('./pd_data/musicdata.csv', encoding='gbk')

In [None]:
print(len(musicdata1))  #信息表的长度为

In [None]:
print(musicdata1)

### 更改参数后重新读取文本文件

In [None]:
musicdata2 = pd.read_table('./pd_data/musicdata.csv', sep = ';', encoding='gbk')  #修改隔符为;

In [None]:
print(musicdata2) 

In [None]:
musicdata3 = pd.read_csv('./pd_data/musicdata.csv', sep=',', header=None, encoding='gbk')  #修改header为None 

In [None]:
print(musicdata3)

In [None]:
musicdata4 = pd.read_csv('./pd_data/musicdata.csv', sep=',', encoding='utf-16')

报错：UnicodeError: UTF-16 stream does not start with BOM

表示你尝试读取一个 UTF-16 编码的文件，但该文件没有以 BOM（Byte Order Mark）开头。BOM 是 UTF-16 文件开头的特殊标记，用于指示字节顺序（大端或小端）。没有 BOM 时，Python 无法确定如何解码这个文件。

## 文本文件的写入

### 使用to_vsc方法将数据写入csv文件

In [None]:
import os #导入os库

In [None]:
print(os.listdir('./pd_tmp')) 

In [None]:
musicdata0.to_csv('./pd_tmp/musicdataInfo0.csv', sep=';', index=False) 

In [None]:
print(os.listdir('./pd_tmp'))

# 读写excel文件

## excel文件的读取

In [None]:
musicdata5 = pd.read_excel('./pd_data/musicdata.xlsx')

In [None]:
print(len(musicdata5))

In [None]:
print(musicdata5)

## excel文件的写入

In [None]:
print(os.listdir('./pd_tmp')) 

In [None]:
musicdata0.to_excel('./pd_tmp/musicdata0.xlsx')

In [None]:
print(os.listdir('./pd_tmp')) 

# 读写数据库

In [None]:
from sqlalchemy import create_engine

## 连接mysql数据库

In [None]:
engine = create_engine('mysql+pymysql://bigdata:bigdata@192.168.8.246:3303/testdb?charset=utf8')

In [None]:
print(engine)

## 读取数据库中的数据

### 使用read_sql_query函数查看testdb中的数据表数目

In [None]:
musicadatalist0 = pd.read_sql_query('show tables', con=engine)

In [None]:
print( musicadatalist0)

### 使用read_sql_table函数读取音乐行业收入信息表

In [None]:
musicdata6 = pd.read_sql_table('musicdata', con=engine)

In [None]:
print(len(musicdata6))  #信息表的长度

In [None]:
print(musicdata6)

### 使用read_sql函数读取音乐行业收入信息表

In [None]:
musicdata7 = pd.read_sql('musicdata', con=engine)

In [None]:
print(len(musicdata7))

In [None]:
print(musicdata7)

## 数据库数据写入

### 使用to_sql()方法存储musicData0

In [None]:
musicdata0.to_sql('test1', con=engine, index=False, if_exists='replace')

In [None]:
musicadatalist1 = pd.read_sql_query('show tables', con=engine)

In [None]:
print(musicadatalist1)