Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

【第一版出版事宜】 #88

Closed
47 of 68 tasks
pzhaonet opened this issue Jul 11, 2020 · 14 comments
Closed
47 of 68 tasks

【第一版出版事宜】 #88

pzhaonet opened this issue Jul 11, 2020 · 14 comments

Comments

@pzhaonet
Copy link
Collaborator

pzhaonet commented Jul 11, 2020

msg-outline
《现代统计图形》2020 新修版大纲

@yihui@XiangyunHuang 委托,我来接管《现代统计图形》一书的出版事宜。修订方案如下。

修订原则和步骤

  • 基本原则:审校文字与格式。如无必要,现有文字不做改动,尽最大可能保持原貌。项目的 issues 里有很多好主意,只是难以近期落实,只得作为远期目标,将来时机成熟后以第二版的形式面世。所以,计划出版的第一版书稿将以稳定版(v1.4)为出发点,也就是分支 edition1,尽量落实 issues 里容易实现的想法。

  • 以下为进度表。已打叉:已完成;未打叉的斜体:正在进行中;未打叉的正体:尚未开工。

  • 开头:

    • 新建分支。
    • 通读全书,跟 @yihui 原稿对照,审校文字、标点符号,更新软件、包的版本信息,更新函数用法。
    • 段首空格,福尔摩斯楷书,标签加上章节号,代码返回结果的宽度。
  • 调整全书结构:

    • 新结构
      • 第一部分:史话(经典图形,作图工具,现代案例)
      • 第二部分:图库(一维数据图库,二维数据图库,高维数据图库,矩阵数据图库)
      • 第三部分:系统(R 基础作图,ggplot2 ,其他作图系统,作图原则)
  • 增改内容:

    • 风玫瑰图。
    • 疫情地图。
    • 论坛热度。
    • 为新增章节添加《福尔摩斯》引文。
    • 更新所有交叉引用。
    • “工具”更新 R 语言介绍,增加 ggplot2 的简单介绍。
    • 重写 R 基础作图一章
    • 重写 ggplot2 一章
    • 所有插图的 ggplot 版,并提供代码。Q-Q 图的 ggplot2 实现(参考【第四章 图库】修订中 #52
    • 所有 qplot 用 ggplot 替换掉 #86
    • 数据每节的结构调整为:案情简介,探案历程,探案手段。
    • 图库每节的结构调整为:概述,示例,作图方法。
    • 为所有案例增加数据表格,添加标题和短标题
    • 误差线
    • 3d 饼图
    • 统计词话乱码 更新统计词话数据案例的代码和数据 yihui/MSG#31
    • 更为详尽的代码注释
    • 把书里所有的作图代码全部写进包里 把书里所有的作图代码全部写进包里 yihui/MSG#35
    • 删掉 “R 入门”等与图形无关的章节,突出”图形“主题
  • 文字和格式调整:

    • sample() 增加 set.seed
    • 尽量把超级链接和数据来源说明移至脚注
    • 去掉 usage(),只显示其输出结果
    • 多图插入采用 patchwork 包 #86
    • 茎叶图的标签
    • 段首"其中"之前不空格 \noindent
    • 代码宽度适应页码
    • 示例数据表不用终端打印格式,改用表格展示
    • 函数参数释义用列表展示
    • R 包名称如 ggplot2 用星号加粗
    • 文字段落中含有函数名称、参数、数据集,及其各个变量名称,如 barplot 或 barplot(...) 应该放在一对反引号里
    • 全书代码环境中参数 help.search('analysis of variance') 单引号全部改为双引号,要统一
    • 福尔摩斯段首空格
    • 调整所有图片大小至最佳
    • 隐藏索引页
    • 箭头赋值号改为等号
    • 去掉 if 和 for 后面的空格
  • 收尾:

    • 制作书的主页,配二维码。
    • 前言:导读和体例。
    • 测试文中所有网址。
    • 逐字通读电子版。
    • 逐字通读打印版。
    • 更新“序言” 和 “后记”、“致谢”。
  • 可选内容

关于 ggplot2

关于书稿需要增加 ggplot2 篇幅(摘自我发给出版社的邮件):

其实该书稿有个分支,叫做"现代统计图形之极乐净土",是在原书稿基础上做的一个尝试,即把原书稿篇幅最大的第4章“图库”里的基础作图全部用 ggplot2 重做一遍,已经大部分完成。曾经想过是不是可以把本书全盘 ggplot 化,可是,本书实质是系统介绍“R 基础作图”(例如第3章“元素”),如果全盘替换,则需要用第 5.1 节“ggplot2 图形”来代替第3章,要修订的工作量很大。同时,我意识到,本书让人读起来过瘾的部分正是对基础作图的讲解。全盘替换的话,此书恐怕会面目全非,而市面上会损失一本很多人期待的基础作图参考书。

基础作图是本书亮点,ggplot2 不可小觑,两者应该兼顾。

关于目标读者群和修订的指导思想

从作者角度,@yihui

估计有相当一部分人到时候买这本书纯粹是为了怀旧了或者满足一下“活久见”的心愿。

以下摘自我发给出版社的邮件:

此书虽是以 R 语言为载体,然而其中的思想完全不限于 R 语言,是“通过 R 基础作图来呈现统计思想”。在以前的讨论中,我提出一个想法,就是"图形为体,R语言为用",把书稿里所有"术"的内容删掉,只论"道",以便让更大的读者群从书中受益。或者说,把此书的灵魂作为芭比娃娃的身体,而外在表现无论是 R 语言还是别的什么作图工具,都是芭比娃娃的衣服。每换一套衣服,都可以出一本书。不过,大概是这个想法太过激进,实现起来难度大,要修订的工作量太多,就仅仅作为谈资丢在那里了。

综合上面的考虑,此书的目标读者群是:

  1. (主要)有一定 R 语言基础、想进一步学习作图的 base-R 用户。
  2. (主要)有一定的 R 基础作图经验、想加深理解的 R 语言用户。
  3. (次要)有一定的 R 基础作图经验、想学习 ggplot2 和其他作图包的用户。
  4. (次要)有一定的 ggplot2 作图经验、想学习基础作图和其他作图包的用户。
  5. (次要)没有 R 语言经验、希望了解统计作图的用户。

如果说原书稿的灵魂是“通过 R 基础作图来呈现统计思想”,那么此次修订,将书稿的灵魂将调整为:“通过 R 基础作图和 ggplot2 作图来呈现统计思想”。

关于开源

开源社区为本书的写作贡献灵感和素材,出版社为本书的出版贡献人力和物力。二者需要平衡。方案如下:

  1. 本书的书稿源文本(.Rmd)在 GitHub 上开源。欢迎大家提交 PR。
  2. 在印刷版面世、出版社收回成本之前,本书暂不提供网页版的成品浏览或 pdf 版的成品下载。请大家理解和支持。

欢迎大家补充。众口难调,大家的意见不一定会采纳,但是一定会被慎重考虑。

@tcgriffith
Copy link

好奇一个问题,话说国内的出版社允许内容开源吗?

@liechi
Copy link

liechi commented Jul 11, 2020

我看了现在版本的书稿,对第一版书稿有以下建议:

  1. 我觉得本书应该把这类读者也纳入主要目标,即不了解 R,但有展示数据的需求的人。希望他们能通过本书了解如何用图形展示数据,以及在这个过程中 R 能做什么,从而看罢主动入坑。我想这个目标可以通过适当更新图库一章(算是诱饵吧)的内容来达成。
  2. “图库”一章里,我不知道益辉介绍图形的顺序是否有学理上的逻辑,我建议按使用频率来排序,比如小提琴图,克利夫兰点图的介绍可以适当提前;对于常用图形的介绍,分析和举例,内容可以更翔实些。
  3. 第六章“数据”和“图形”应该是紧密相连的。按我个人的经验推想,恐怕很多人都是收集数据,继而考虑该用什么图形来展示,所以我觉得“数据”一章可以离“图库”近一些,甚至在介绍图形之前;其内容也可再丰富些。

基本上每本介绍 R 的书都会介绍如何用 R 作图,但系统地介绍统计图形的书却比较稀少,我想图形介绍上多花点笔墨是值得的。

建议容易写稿难,若有不合理处,请直接忽略:)

@pzhaonet
Copy link
Collaborator Author

pzhaonet commented Jul 11, 2020

@tcgriffith 可以商量。国内的书价跟国外发达国家比起来相对较低,加上读书习惯和盗版问题,国内的出版社生存不易。

@liechi 建议很好,有些说到我心里去了,答复如下:

  1. 这一类读者其实是算在我列的第 5 类。有些犹豫是不是列在主要读者里,所以就列在次要读者了。如果列为主要读者,那么第二章的 R 简介恐怕是一种困扰,假如读者按章节顺序读的话。这仍然是前面讨论过的术道平衡问题。我担心顾此失彼。
  2. 图库一章的顺序按 @yihui 的说法是:

从第 4.1 节到 4.27 节的所有图形都是基于 graphics 包所作,其后的图形均来自于其它函数包。图形的介绍顺序大致按函数的字母序,但直方图、箱线图和散点图等常见图形放在前面,而饼图被有意安排在最后。

我觉得这个顺序不太方便理解,而且这篇幅太长,而且全程无尿点,最后容易憋坏,而全书的章数显得较少。我有个初步想法是把这一章拆成几章。考虑过按频率排序和分章,例如分“常用图库”、“特殊图库”、“罕见图库”三章,不过这样的划分标准会引起吐槽,各个专业的看法肯定不同。目前我倾向于按照“数据”一章的数据类型表来分为“一维图库”,“二维图库”,“高维图库”,“矩阵图库”四章,每章下面按分类数据、连续数据、混合数据来介绍。然而这样带来的问题是破坏了每章标题都是两个字的“笑傲江湖”风。我在考虑是不是改成“射雕”风,标题都是四个字。已更新至“修订步骤”。
3. 这个建议很好,数据一章可以放在图形前面,刚好给上一条建议我的解决方案来领路。已更新至“修订步骤”。

@liechi
Copy link

liechi commented Jul 11, 2020

@pzhaonet 第一条我想不必太过担心,可以在序言里作些说明,菜放在那里,每样都可口,但读者还是可以自己挑着吃;我也觉得图库一章或许会过长,拆分是个好主意;章目起名可从长计议。

@jonie-y
Copy link

jonie-y commented Jul 11, 2020

@pzhaonet @liechi
其实我认可liechi的观点,另外zhaonet对liechi的回复我的观点是,其实第五章系统,太薄弱了,plotly和ggplot2就那么一点篇幅。太少了。

个人认为,每个系统都可以单独出来成章,另外,echarts也可以加上。

每个系统(或者说包),本来语法就不同,参数也不同。最好单独成章建图库,不然tranditional device说的再详细,对grid device的帮助也有限。

如果太简洁,读着是没有买的必要的。

菜放在那里,每样都可口

这个挺好。

我最近几天在搞这个书的编译,如果弄好了,我就开始更新plotly了。当然如果没计划扩充内容,我就不搞了。

@pzhaonet
Copy link
Collaborator Author

pzhaonet commented Jul 12, 2020

@jonie-y 写啊,强烈欢迎写啊!这个项目放了快一年了,总共没几个贡献,@XiangyunHuang 列了很多扩充任务,随时欢迎推送新内容到适当的分支!

不过,本分支仅针对出版,有的情况需要做一些妥协。

"每个系统都可以单独出来成章"的愿望是好的,我个人是很希望看到这样一本书的,但面对的实际问题是:

  1. 原稿在文字上是很讲究的,文学可读性很强。如果扩充的内容太多,扩充的部分对写作水平要求自然也很高,时间和人力上不现实。很有可能导致此书的出版再度遥遥无期,甚至烂尾。
  2. 上一条导致的另一个结果是可能写的速度赶不上技术发展的速度。等写完了,可能有新的技术出现了,追不上。
  3. 篇幅太大,出版不便。从出版成本和市场考虑,这种书一般 300 页左右为宜,目前的篇幅已经够了。

回到前面讨论多次的术道问题,我发现在序言里其实已经说明了:

对本书来讲,统计作图的(计算机)技术本身即为“器”,而数据处理以及统计图形的灵活应用则为“道”。本书的写作目的正是希望能够基于“器”的练习和启发,让读者在统计数据处理和分析中真正得“道”。

上帝的归上帝,凯撒的归凯撒,先用最简单的思路把此书的第一版出版。这并不妨碍诸位往书稿里增加内容——将来可以出第二版嘛,或者电子版放在网上也很好。

@jonie-y
Copy link

jonie-y commented Jul 13, 2020

@pzhaonet 现在出版的是edition1分支吗?我该往哪个分支推送更新啊?

能不能列一下现在的各个分支的目的和接受修订的大概范围,另外,如果两个分支都可以接受同样的推送,我是不是需要多个分支都要申请pull request。比如plotly更新。

谢谢。

@pzhaonet
Copy link
Collaborator Author

pzhaonet commented Jul 13, 2020

@jonie-y 是的,准备出版的是edition1分支,修订任务和进度见一楼。任何“大改和新增”部分的任务都可以领取,但务必提前打好招呼,免得重复劳动。plotly 属于“新增交互式图形<#57>。

edition1分支是精准面对国内印刷出版的,因此会针对 pdf 做特殊考虑,并且篇幅上有限制,文字上要慎重,没法随心所欲甩开膀子写,务必注意这一点。

受篇幅限制,plotly 点到为止,简介即可。若要系统全面介绍,可能推送到 development 比较合适,这个请咨询 @XiangyunHuang

@XiangyunHuang
Copy link
Owner

@pzhaonet 我把 <issues/57> 改为 #57 了这样方便直接链过去看

@jonie-y 我们聚焦在 edition1 分支上开发,目的是尽快达到出版要求,改动很大的主题适当删减

@pzhaonet
Copy link
Collaborator Author

原来加 issues 的链接居然如此简单.......

@pzhaonet
Copy link
Collaborator Author

  1. 我觉得本书应该把这类读者也纳入主要目标,即不了解 R,但有展示数据的需求的人。希望他们能通过本书了解如何用图形展示数据,以及在这个过程中 R 能做什么,从而看罢主动入坑。我想这个目标可以通过适当更新图库一章(算是诱饵吧)的内容来达成。
  2. “图库”一章里,我不知道益辉介绍图形的顺序是否有学理上的逻辑,我建议按使用频率来排序,比如小提琴图,克利夫兰点图的介绍可以适当提前;对于常用图形的介绍,分析和举例,内容可以更翔实些。
  3. 第六章“数据”和“图形”应该是紧密相连的。按我个人的经验推想,恐怕很多人都是收集数据,继而考虑该用什么图形来展示,所以我觉得“数据”一章可以离“图库”近一些,甚至在介绍图形之前;其内容也可再丰富些。

昨天我才发现,这些问题早在 2011 年都被广泛深入讨论过了,有些与我们现在的讨论雷同啊:

@yihui
Copy link
Collaborator

yihui commented Jul 24, 2020

所以这本书稿可能更适合放在我那个库底下,不过既然这边已经热火朝天开工了,就不再搬了。当初我也支持湘云开新库,因为我实在背不动这口锅了。

@pzhaonet
Copy link
Collaborator Author

我还给书的宣传主页的项目开了 issues,本来是想用作印刷版专门的平台的......弄这么多,这是何苦来哉,我关了罢,有你们两个的 issues 就够了。

@pzhaonet
Copy link
Collaborator Author

pzhaonet commented Mar 27, 2021

最近大半年,将书稿提交到出版社,经过了初审、修改、复审、修改等步骤,或急或缓做了一些事情,未来还有一些事情,均列在这里:

  • 按出版社建议,删减某些章节,仅放在网上供读者阅读。
  • 修改某些敏感词。
  • 解决部分引用图片可能存在的版权问题。
  • 书中的图字能用中文的,建议尽量用中文。
  • 表格的汉化。
  • 关于代码中的注释,能用中文的建议用中文。
  • 按出版社要求,书中不能出现超级链接,全部删除,整理到网上供读者查阅。
  • 个别文字和数据的修订。
  • 签署出版合同。
  • 邀请和搜集推荐语。
  • 更新宣传网站 msg2020.pzhao.org。
  • 作者个人简介。
  • 排版后再度审核。
  • 更新 MSG 包里的插图编号。
  • 更新 R 区洛阳铲的数据 https://sciwis.shinyapps.io/rchive/

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

6 participants