这是一个用于记录个人学习**《利用 Python 进行数据分析》**一书的代码笔记仓库。所有 Jupyter Notebook 文件旨在复现书中的关键概念、代码示例,并进行扩展练习,以便深入理解数据清洗、数据转换和数据分析的核心技术。
本仓库基于以下图书的学习和实践:
| 属性 | 内容 |
|---|---|
| 书名 | 利用 Python 进行数据分析(原书第 3 版) |
| 原作名 | Python for Data Analysis: Data Wrangling with pandas, NumPy, and Jupyter |
| 作者 | Wes McKinney (pandas 库的创始人) |
| 译者 | 陈松 |
| 出版年 | 2023-10 |
| ISBN | 9787111726722 |
| 页数/定价 | 502页 / 149.00元 |
本仓库的 Notebook 文件将按照原书的章节结构进行组织和命名,以方便查找。项目重点涵盖了 NumPy 和 pandas 两个 Python 核心库的深入应用。
| 章节 | 核心主题 | 学习笔记内容 |
|---|---|---|
| 第 2 章 | Python 语言基础 | 基础数据结构、控制流、函数、文件操作等。 |
| 第 3 章 |
|
|
| 章节 | 核心主题 | 学习笔记内容 |
|---|---|---|
| 第 5 章 |
|
|
| 第 6 章 | 数据加载、存储与文件格式 | 读取 |
| 第 7 章 | 数据清洗与准备 | 缺失值处理 ( |
| 第 8 章 | 数据规整:聚合、合并与重塑 | 层次化索引、数据合并 ( |
| 第 9 章 | 绘图与可视化 | 使用 |
| 第 10 章 | 数据聚合与分组操作 |
|
| 章节 | 核心主题 | 学习笔记内容 |
|---|---|---|
| 第 11 章 | 时间序列 | 时间日期数据类型、频率转换、重采样、移动窗口函数。 |
| 第 12 章 | 建模工具介绍 | 深入 |
本仓库中的
-
克隆仓库:
git clone git@github.com:novak-zhc/Python-for-DataAnalysis-Projects.git
-
创建 Conda 环境:
推荐使用
$\text{Anaconda}$ 或$\text{Miniconda}$ 创建隔离环境,并安装pandas,numpy,jupyter等核心依赖。 -
启动环境:
conda activate <环境名>
-
打开 Notebook:
在 VS Code 中直接打开
$\text{.ipynb}$ 文件,或在终端中运行jupyter notebook。
欢迎查阅和交流!