sklearn中怎么实现数据缩放功能

今天就跟大家聊聊有关sklearn中怎么实现数据缩放功能，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

创新互联建站主营高邑网站建设的网络公司,主营网站建设方案,APP应用开发,高邑h5微信小程序定制开发搭建,高邑网站营销推广欢迎高邑等地区企业咨询

一、数据缩放

你的预处理数据集中可能包含各种各样、不同比例的特征字段，比如美元、千克、价格，有的特征列数值范围在100以内，有的却达到几百万，差异很大。

很多机器学习模型不希望有这样大的差异，如果数据集各个属性之间的数值差异越小，则模型表现的会越好。这里不一概而论，具体原因小伙伴们自行探索下。

方法1：数据归一化

数据归一化是指将原始数据缩放到0和1之间。

对于依赖于值的大小的模型，这种对输入属性的缩放很管用。比如在K近邻模型的距离测量和回归系数的准备。

接下来用都知道的鸢尾花数据集演示数据归一化：

# 对鸢尾花数据集进行数据归一化处理.
from sklearn.datasets import load_iris
from sklearn import preprocessing
# 加载数据
iris = load_iris()
print(iris.data.shape)
# 分离原始数据集，分为自变量和因变量
X = iris.data
y = iris.target
# 归一化处理
normalized_X = preprocessing.normalize(X)

方法2：数据标准化

数据标准化是指：将数据缩放，改变每个属性的分布，使其平均值为0，标准差为1。

诸如高斯过程等依赖于特征分布的模型，对特征进行标准化是非常有用的。

依然用鸢尾花的例子：

# 对鸢尾花数据集进行数据标准化处理.
from sklearn.datasets import load_iris
from sklearn import preprocessing
# 加载数据
iris = load_iris()
print(iris.data.shape)
# 分离原始数据集，分为自变量和因变量
X = iris.data
y = iris.target
# 标准化处理
standardized_X = preprocessing.scale(X)

看完上述内容，你们对sklearn中怎么实现数据缩放功能有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注创新互联行业资讯频道，感谢大家的支持。

本文题目：sklearn中怎么实现数据缩放功能
分享网址：https://www.cdcxhl.com/article24/gecice.html

成都网站建设公司_创新互联，为您提供网站建设、自适应网站、移动网站建设、建站公司、网站制作、标签优化

声明：本网站发布的内容（图片、视频和文字）以用户投稿、用户转载内容为主，如果涉及侵权请尽快告知，我们将会在第一时间删除。文章观点不代表本网站立场，如需处理请联系客服。电话：028-86922220；邮箱：631063699@qq.com。内容未经允许不得转载，或转载时需注明来源：创新互联

猜你还喜欢下面的内容