如何选择使用resetting还是normalizing?哪个更好?

3 min read

在数据预处理中,Resetting 和 Normalizing 都是很重要的步骤,但它们的目的不同。具体选择哪一个取决于你的需求和数据类型。

在 Resetting 中,我们通过对数据进行一些预设操作,将其转换为特定的数据范围。这是为了消除量纲不同的影响,以便在处理数据时更易于比较和分析。Resetting 不会改变数据的分布和形态。

而在 Normalizing 中,我们通过将数据转换到一个统一的分布来减少数据的影响和噪声,使数据的分布更加平滑和连续。这有助于减少模型中过拟合的可能性,并提高模型在新数据上的泛化性能。

具体选择哪一个方法取决于你的数据类型和具体需求。如果你的数据集有很多异常值或噪声,那么 Normalizing 会比 Resetting 更加有效,它可以使你的数据更加平滑。但如果你想要比较不同维度之间的数据,那么 Resetting 可能更加合适,因为它可以消除数据之间的量纲影响。