机器学习Sklearn简介及安装(数据集说明)

机器学习Sklearn简介及安装(数据集说明)


scikit-learn(sklearn),是用python实现的机器学习算法库。sklearn可实现数据预处理、分类、回归、降维、模型选择等常用的机器学习算法。sklearn是基于NumPy、SciPy、matplotlib的。

一、安装

pip install scikit-learn -i https://pypi.tuna.tsinghua.edu.cn/simple/

二、数据集说明

序号 数据集名称 调用方式 数据描述
1 鸢尾花数据集 Load_iris() 用于多分类任务的数据集
2 波士顿房价数据集 Load_boston() 用于回归任务的经典数据集
3 糖尿病数据集 Load_diabetes() 用于回归任务的经典数据集
4 手写数字数据集 Load_digits() 用于多分类任务的数据集
5 乳腺癌数据集 Load_breast_cancer() 经典的用于二分类任务的数据集
6 体能训练数据集 Load_linnerud() 经典的用于多变量回归任务的数据集

发表回复

您的电子邮箱地址不会被公开。