scikit-learn(sklearn),是用python实现的机器学习算法库。sklearn可实现数据预处理、分类、回归、降维、模型选择等常用的机器学习算法。sklearn是基于NumPy、SciPy、matplotlib的。
一、安装
pip install scikit-learn -i https://pypi.tuna.tsinghua.edu.cn/simple/
二、数据集说明
序号 | 数据集名称 | 调用方式 | 数据描述 |
1 | 鸢尾花数据集 | Load_iris() | 用于多分类任务的数据集 |
2 | 波士顿房价数据集 | Load_boston() | 用于回归任务的经典数据集 |
3 | 糖尿病数据集 | Load_diabetes() | 用于回归任务的经典数据集 |
4 | 手写数字数据集 | Load_digits() | 用于多分类任务的数据集 |
5 | 乳腺癌数据集 | Load_breast_cancer() | 经典的用于二分类任务的数据集 |
6 | 体能训练数据集 | Load_linnerud() | 经典的用于多变量回归任务的数据集 |