博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[Python][MachineLeaning]Python Scikit-learn学习笔记1-Datasets&Estimators
阅读量:6642 次
发布时间:2019-06-25

本文共 916 字,大约阅读时间需要 3 分钟。

Scikit-learn官网:

Datasets

标准的数据集格式为一组多维特征向量组成的集合。数据集的标准形状(shape)为二维数组(samples, features),其中samples表示数据集大小,features表示其中特征向量的维数。

使用时可使用shape方法查看数据集

>>> from sklearn import datasets>>> iris = datasets.load_iris()>>> data = iris.data>>> data.shape(150, 4)

表示iris数据集含有150个数据样本,每个数据样本为一个4维的特征向量。

 

对于不具有标准形状的数据集,需要对其进行处理,将其转换为形状标准的数据集以进行处理。

以Scikit自带的digits数据集为例,其保存的是1797个8x8的灰度值图像

>>> digits = datasets.load_digits()>>> digits.images.shape(1797, 8, 8)

需要利用reshape函数将其中的每幅图像都表示为一个64维的特征向量

>>> data = digits.images.reshape((digits.images.shape[0], -1))

 

 

Estimators objects

estimator是一个宽泛的概念,它可以是分类器(classification)、回归器(regression)、聚类算法(clustering algorithm)或者特征提取器。

所有的estimator对象都提供fit方法来接受数据

>>> estimator.fit(data)

 

estimator的参数都可以在初始化时直接指定

>>> estimator = Estimator(param1=1, param2=2)>>> estimator.param11

利用estimator根据训练集进行拟合所得的参数都以_结尾

>>> estimator.estimated_param_

转载于:https://www.cnblogs.com/shelvenzhou/p/3844750.html

你可能感兴趣的文章
Leetcode | Sort Colors
查看>>
video.js播放rtmp流2
查看>>
类欧几里得算法
查看>>
2013 Multi-University Training Contest 5 部分解题报告
查看>>
IP TCP HTTP Socket的区别
查看>>
adb shell中的am pm命令
查看>>
js函数
查看>>
压缩图片的算法
查看>>
Struts2 源码分析-----Hello world
查看>>
人生不可能完美因此我们要学会讲究着过
查看>>
ruby 基础知识(一)
查看>>
【java】Map、Set、List不同数据结构的各种不同循环迭代的效率对比,使用场景...
查看>>
Android屏幕适配索引
查看>>
Java排序算法 堆排序
查看>>
微软与百度合作:win10搜索引擎默认百度
查看>>
h5小球走迷宫小游戏源码
查看>>
ASP.NET中处理自定义错误的最佳方式
查看>>
'utf-8' codec can't decode byte 0xd0 in position 0问题
查看>>
【评分】第四次作业--项目选题报告(团队)
查看>>
C Primer Plus 第3章 数据和C 编程练习
查看>>