标签: 数据预处理

数据处理之重采样(过采样与欠采样)

重采样(Resampling) 是处理数据不平衡问题的核心技术之一,通过调整训练数据中不同类别的样本比例,使模型更关注少数类。 重采样的两类核心方法 过采样(Oversampling) 目标:增加少数类样本数量,平衡类…

数据, 术→技巧 ·

时序分析中的差分变换

差分变换(Difference Transformation)是一种数学工具,用于处理时间序列数据,尤其是在时间序列分析和信号处理中。差分变换的核心目的在于去除数据中的趋势和季节性成分,使得一个非平稳时间序列变得平稳。平稳性…

数据, 术→技巧 ·