机器学习笔记
latest

数据处理和数据可视化

  • 数据可视化
  • 数据预处理

特征

  • 特征选择
  • 特征工程 —— 时间
  • 特征工程——文本
  • 特征工程——图像特征

优化与评估

  • 参数调优
  • 模型评估——分类
  • 模型评估——回归

算法

  • 总览

Tips

  • Tips
机器学习笔记
  • Docs »
  • 机器学习笔记
  • Edit on GitHub

机器学习笔记¶

本人学习机器学习的笔记,重点记录对一些概念的简单理解,不会太涉及具体的代码实现以及数学推导。 目前包含的的图书有

  • 实用机器学习(Real-World Machine Learning) ISBN 978-7-111-56922-0
  • 将随着自己的学习逐步添加

数据处理和数据可视化¶

  • 数据可视化
    • 马赛克图(Mosaic plots)
    • 盒图(Box plots)
    • 密度图(Density plots)
    • 散点图(Scatter plots)
  • 数据预处理
    • 缺失数据处理

特征¶

  • 特征选择
    • 平衡特征集数量的实用方法
    • 前向选择
    • 反向消除
    • 特征选择的可视化方法
  • 特征工程 —— 时间
    • 时间日期基础特征
    • 经典时间序列(每xx, xx内)
    • 点过程(也称事件流)
  • 特征工程——文本
    • 词袋模型
    • 主题建模
    • 内容拓展
  • 特征工程——图像特征
    • 简单特征
    • 提取物体和形状

优化与评估

  • 参数调优
    • 强力网络搜索(grid search)
  • 模型评估——分类
    • 混淆矩阵(Confusion matrix)
    • ROC曲线与AUC指标
  • 模型评估——回归
    • 指标
    • 检验残差

算法¶

  • 总览

Tips¶

  • Tips
    • 对数概率
Next

© Copyright 2018, 被秒的BOSS. Revision 39e51d5f.

Built with Sphinx using a theme provided by Read the Docs.