Skip to content

Official Python code repository for the book Data-Driven: Practical Machine Learning. Contains complete source code for all chapters, including data preprocessing, model training, evaluation, deployment scripts, and real-world project implementations.

Notifications You must be signed in to change notification settings

monkeyongithub/ml-book-code

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 

Repository files navigation

ml-book-code

《数据驱动:机器学习实战之道》官方配套代码仓库


📖 图书简介

  • 书名:数据驱动:机器学习实战之道
  • 作者:一个处女座的程序猿
  • 出版时间:2025 年中
  • 写作耗时:5 年沉淀,原稿 70 万字,出稿约 35 万字

⭐︎ 本书五大特色

  1. 理论与实践结合
    • 每一章节不仅剖析概念,更配有可运行的 Python 脚本,助你“学——跑——改”。
  2. 内容全面系统
    • 从数据科学生命周期(CRISP‑DM、TDSP)到模型监控与优化,一次性构建完整知识体系。
  3. 丰富实战案例
    • 案例涵盖从数据采集与清洗到可视化(直方图、热力图、三维图、动态图)的完整演示,五大流程阶段的端到端实战——包括 EDA(缺失值/异常值检测与可视化)、数据工程(对齐、缺失值处理、特征构造与归一化)、模型训练与推理(分类、回归、聚类及超参调优)、部署与监控(REST API 上线与 A/B 测试)、优化与反思(正则化对比、数据增强、多模型融合、分布式加速)——所有示例均附带数据下载或自动获取脚本、详细注释及运行说明,确保可零门槛复现与扩展。
  4. 代码规范易读
    • 统一的 .py 脚本风格与详细注释,零基础也能快速上手。
  5. 前沿技术覆盖
    • 最新训练方法、部署工具与优化策略,紧跟业界发展。

📚 章节概要

第一部分:数据科学技术实战

  1. 第 1 章:数据科学技术简介
    • 数据价值洞察、CRISP‑DM vs TDSP 流程对比
  2. 第 2 章:数据可视化
    • 从直方图/条形图到三维动态图的 Python 实现
  3. 第 3 章:完整项目流程
    • 数据采集、清洗、不平衡处理、特征筛选全流程实战

第二部分:机器学习流程五大阶段

  1. 第 4 章:探索性数据分析(EDA)
    • 数据载入、缺失值/异常值检测与可视化
  2. 第 5 章:数据工程
    • 数据清洗、特征构造、归一化/编码化/向量化
  3. 第 6 章:模型训练与推理
    • 分类/回归/聚类算法示例,评估指标与超参调优
  4. 第 7 章:发布、部署与监控
    • A/B 测试、API 集成、在线监控工具实战
  5. 第 8 章:项目反思与优化
    • 正则化对比、数据增强、多模型融合、分布式优化与代码性能提升

About

Official Python code repository for the book Data-Driven: Practical Machine Learning. Contains complete source code for all chapters, including data preprocessing, model training, evaluation, deployment scripts, and real-world project implementations.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published