参考书版本为2019年05月第1次印刷,在这之后的印刷版本有可能进行过修订,愿本书越来越完善。
-
贝叶斯估计与极大似然估计在思想上有很大的不同,代表着统计学中频率学派和贝叶斯学派对统计的不同认识
,这里贝叶斯估计对应了贝叶斯学派,而极大似然估计对应的是频率派,应该把贝叶斯学派和频率学派换一下顺序。 -
$X=(x_{ij}){m\times n}$应该是$X=[x{ij}]_{m\times n}$ -
输入空间是欧氏空间$X\sube \mathbf R^d$其实这里用$X\sube \mathbf R^m$表示是不是更好一点,不容易乱,后面的空间都是$m$维,对应的还有$P_{247}$中$\mathbf R^d, \mathbf R^{d'}$ -
关于KNN提出的年限,实际上这个文献是1967年的,而书中说是1968年提出的。 -
参考文献4,应该是1404.1100不是14016.1100 -
精确率和召回率的定义(1.41)和(1.42) $$ P=\frac{TP}{TP+FP}\ R=\frac{TP}{TP+FN} $$ -
定义,(1.44) $$ F_1=\frac{2TP}{2TP+FP+FN} $$ -
这部分在第一章$P_8$的无监督学习部分定义是$x \in \mathcal{X}, z \in \mathcal{Z}$ -
公式14.6中,转置符号用了斜体 转置应该是和其他转置一样,是正体 -
算法14.2中描述的输出$C^\cdot$应该是$C^$, 因为算法描述中最后输出的是$C^$ -
算法14.1, 输入:n个样本组成的样本集合及样本之间的距离
,其中样本之间的距离不应该是输入条件。 -
公式D.2上面一行,$R^n$中与$Y$中的每一向量正交的向量集合,应该是$\mathbf R^n$ -
关于张成,在第二小节之上的一行$span{v_1,v_2,\cdots,v_n}=V$用的是{},前面定义的是$span(v_1,v_2,\cdots,v_n)$,用() -
公式D.1中$R^n$应为$\mathbf{R}^n$ -
$V_1=[\begin{array}&\nu_1&\nu_2&\cdots&\nu_r\end{array}]$$V_2=[\begin{array}&\nu_{r+1}&\nu_{r+2}&\cdots&\nu_n\end{array}]$,这部分定义用的是$\nu$,而后面用到的时候用的都是$v$,比如公式15.8, 15.12, 15.15 -
公式15.14下面那行,$U_1$的列向量构成了一组标准$\color{red}正交集$ -
图15.1中标记的$\Sigma$ 应该是$\mit\Sigma$ -
公式15.25中$(a_{ij})^2$看起来不是很习惯,完全可以用$a_{ij}^2$表示,类似的还有$P_{293}$中总结的第7点 -
应该是$p=\min (m,n)$ -
第6点,奇异值$\sigma_i$应该是$\sigma_j$ -
第6点,从$AA^\mathrm{T}$的特征值这句,虽然$A^\mathrm{T}A$和$AA^\mathrm{T}$的特征值是一样的,但是不太理解这里为什么写成$AA^\mathrm{T}$,不知道是不是笔误。 -
求方差贡献率$\sum\limits_{i=1}^k\eta_i$达到预定值的主成分个数$k$,这个应该是累计方差贡献率 -
公式16.52,16.53, 以及$X^{\prime\mathbf{T}}X$,后面$X^{\prime}=\frac{1}{\sqrt{n-1}}X^\mathbf{T}$中的$X^\mathbf{T}$应该是$X^\mathrm{T}$ -
样本矩阵$\mit \boldsymbol{X}$,应该是$X$。或者说,写成$X$才和其他表达是一致的。 -
17.1节最后一句, 这一结果完全从话题-文本矩阵的信息中获得
应该是单词-文本矩阵
吧 -
这个例子并没有按照书中其他例子的格式编号,$P_{330}$中的表格,也没有表格编号和标题。下面截断奇异值分解的结果,其实应该算是个图。