home..

watermellon book

[toc] —-

chap1 绪论

1.1 引言

1.2 基本术语


1.3 假设空间

1.4 归纳偏好

? 要解决的问题:如何在版本空间中进行选择 ? –> 归纳偏好 inductive bias:机器学习算法在学习过程中对某种类型假设的偏好

chap1 习题

1.1

编号 色泽 根蒂 声音 好瓜?
1 青绿 蜷缩 浊响
2 乌黑 稍蜷 沉闷

上述表格对应的版本空间?假设三个attributes都只有三种书上给出的取法?

:thinking: | 编号 | 色泽 | 根蒂 | 声音 | | —- | —- | —- | —- | | 1 | 青绿 | 蜷缩 | 浊响 | | 2 | * | 蜷缩 | 浊响 | | 3 | 青绿 | * | 浊响 | | 4 | 青绿 | 蜷缩 | * | | 5 | * | * | 浊响 | | 6 | 青绿 | * | * | | 7 | * | 蜷缩 | * | 这里假定不包含非A的操作。

1.2

每个attribute:$3+3+1=7$,$777+1$

1.3

选择假设使得训练错误累计最小。

chap2 模型评估与选择

2.1 经验误差与过拟合

2.2 评估方法

2.2.1 留出法

把数据集分成两个互斥集合——训练集$S$ 和测试集$T$

2.2.3 自助法(bootstrapping)

适用于数据集较小,无法有效划分训练集和测试集的时候

2.2.4 调参与最终模型

validation set: 模型评估与选择中用于评估测试的数据集

2.3 性能度量 (performance measure)

给定样例$D={(\textbf{x}_1,y_1),…,(\textbf{x}_m,y_m)}$,需要量化f(x)与y的差别。

2.3.1 错误率与精度

对样例$D$,

2.3.2 查准率、查全率与 F1

问题:

  1. 检索出的信息中有多少比例是用户感兴趣的?
  2. 用户感兴趣的信息中有多少被检索出来了?

–> 查准率 precision查全率 recall 下面这个表叫 二分类混淆矩阵

</table> * **查准率 precision** \[P=\frac{TP}{TP+FP}\] * **查全率 recall** \[R=\frac{TP}{TP+FN}\] * 通常查准率和查全率是矛盾的,一个高一个就低 * **PR图** 根据learner的预测结果对样例进行排序,排在前面的是learner认为“最可能”是正例的样本,排在最后的是learner认为“最不可能”是正例的样本。按此顺序逐个把样本作为正例进行预测按此顺序逐个把样本作为正例进行预测,则每次可以计算出当前的查全率、查准率 --> P是纵轴,R是横轴,则可以作出PR图。
过(0,1)和(1,0) * **通过PR图判断learner的性能:** * 若一个学习器的P-R曲线被另一个学习器完全“包住”,则可断言后者性能优于前者 --> 若有交叉? * **平衡点 Break-Even Point (BEP)** “查准率=查全率”时的取值,越高越好 * **F1度量** \[F_1=\frac{2\times P\times R}{P+R}=\frac{2\times TP}{样例总数+TP-TN}\] 基于P和R的`调和平均`定义: \[\frac{1}{F_1}=\frac{1}{2}(\frac{1}{P}+\frac{1}{R})\] * 更一般地,**$F_{\beta}$** \[\frac{1}{F_{\beta}}=\frac{1}{1+\beta^2}(\frac{1}{P}+\frac{\beta^2}{R})\] $\beta>1$时,查全率有更大影响; $\beta<1$时,查准率有更大影响。 * 多个二分类混淆矩阵的情况 例如多次训练/测试,或在多个训练集上训练/测试 * **宏查准率 macro-P**、**宏查全率macro-R**、**宏F1** 在多个二分类混淆矩阵上计算出P、R,然后取平均。 \[macro-P=\frac{1}{n}\sum_{i=1}^{n}P_i\] \[macro-R=\frac{1}{n}\sum_{i=1}^{n}R_i\] \[macro-F_1=\frac{2\times macroP\times macroR}{macroP+macroR}\] * **微查准率 micro-P**、**微查全率micro-R**、**微F1** ### 2.3.3 ROC 与 AUC to be continued # chap3 线性模型 ## 3.1 基本形式 给定由d个属性描述的示例$\textbf{x}=(x_1,…,x_d)$,线性模型试图学得一个通过属性线性组合来预测的函数, \[f(\bm{x})=w_1x_1+w_2x_2+…+w_dx_d+b\] 向量形式写作: \[f(\bm{x})=\bm{w}^T\bm{x}+b\] ## 3.2 线性回归 \[D=\{(\bm{x_1},y_1),…,(\bm{x_m},y_m)\}\] 我们要找一个$f(x_i)$
真实情况</th> 预测结果</th> </tr >
正例 反例
正例 TP(真正例) FN(假反例)
反例 FP(假正例) TN(真反例)
© 2023 huyi   •  Powered by Soopr   •  Theme  Moonwalk