Machine_Learning_Cheatsheet.pdf
核心章节
- 机器学习基础概念
- 定义(目标函数建模 Y = f(X) + e)
- 参数化与偏差-方差权衡
- 欠拟合与过拟合
- 监督学习 vs 无监督学习
- 优化方法
- 普通最小二乘法(OLS)
- 梯度下降(批量/随机)
- 最大似然估计(MLE)
- 线性算法
- 非线性算法
- 分类与回归树(CART)
- 朴素贝叶斯分类器
- K-近邻(KNN)
- 支持向量机(SVM)
- 集成算法
- Bagging与随机森林
- Boosting与AdaBoost
关键子章节
通用章节
- 数据预处理原则(标准化、离群值处理)
- 模型评估指标(Gini指数、SSE)
- 算法选择标准(线性/非线性权衡)
算法专项章节
- 表示形式(如SVM的分离超平面、逻辑回归的Sigmoid函数)
- 学习过程(如CART的递归二分、AdaBoost的权重更新)
- 变体与改进(如多项式SVM核、高斯朴素贝叶斯)
- 优缺点对比(如随机森林的抗过拟合能力 vs KNN的维度灾难)
- 典型应用场景(如LDA用于客户流失预测、SVM用于图像识别)