• feature-engineering
  • Introduction
  • 特征工程系统
    • 特征使用方案
    • 特征获取方案
    • 特征监控方案
  • 数据预处理
    • 数据观察
    • 数据清洗
    • 数据整理
  • 特征构建
    • 特征组合
    • 映射数据到新空间
    • 衍生变量和特征构造
  • 特征提取
    • 稀疏表示
    • 特征hash
    • 线性特征降维——PCA
    • 线性特征降维——ICA
    • 线性特征降维——LDA
    • 线性特征降维——MDS
    • 线性特征降维——MF
    • 线性特征降维——SAE
    • 线性特征降维——FM
    • 非线性特征降维——LLE
    • 非线性特征降维——SNE
    • 非线性特征降维——聚类
    • 非线性特征降维——神经网络
  • 特征选择
    • Filter
    • Wrapper
    • Embedded
  • 特征学习
    • FeatureTools
    • AutoML
    • Feature Learning
Powered by GitBook

数据预处理

Chapter 02 数据预处理

一般的数据挖掘的流程如下图所示:

temp

在进行机器学习模型的训练之前,我们需要对采集到的数据进行预处理。预处理通常分为以下三个部分:

  • 数据观察
  • 数据清洗
  • 数据整理

参考资料

1.https://blog.csdn.net/qq_39303465/article/details/79221254

2.https://wenku.baidu.com/view/baa6346043323968011c92a7.html

3.http://www.cnblogs.com/fengfenggirl/p/iForest.html

4.https://zr9558.com/2016/06/13/outlierdetectionone/

5.https://www.applysquare.com/topic-cn/ShiBHw1ny/

6.https://www.jianshu.com/p/5af3c66e0410?utm_campaign=maleskine

7.http://pyodps.readthedocs.io/zh_CN/latest/df-sort-distinct-apply-zh.html

8.https://blog.csdn.net/zutsoft/article/details/51498026

9.https://www.cnblogs.com/sirkevin/p/5741853.html

10.https://blog.csdn.net/GeekLeee/article/details/75314982

results matching ""

    No results matching ""