sklearn 是 scikit-learn 的简写,它是一款基于 python 编程语言的开源机器学习库。它具有各种分类,回归和聚类算法,包括支持向量机,随机森林,梯度提升,k-means 和 DBSCAN 等,并且可以与 python 数值库 NumPy 及科学库 SciPy 进行互操作。
sklearn 发展历史
这个 scikit-learn 项目最初是作为 scikits.learn 开始的,最初由 David Cournapeau 在2007年开发的 Google Summer of Code 的一个项目。它的名字来源于它是一个“SciKit”(SciPy 工具包)的概念,它是 SciPy 的一个单独开发和分布的第三方扩展。原始代码库后来被其他开发人员重写。2010年,来自法国计算机科学与自动化研究所(INRIA)的 Fabian Pedregosa,Gael Varoquaux,Alexandre Gramfort 和 Vincent Michel 领导了该项目并于2010年2月1日首次公开发布。
版本历史:
- 2018年9月25日,scikit-learn 0.20.0 发布。值得注意的是,0.20 是最后一个支持 Python 2.7 和 Python 3.4 的版本。0.21 版本开始需要 Python 3.5 或者更高的 Python 版本。
- 2017年10月,scikit-learn 0.19.1 发布。
- 2017年7月,scikit-learn 0.19.0 发布。
- 2017年6月,scikit-learn 0.18.2 发布。
- 2016年9月,scikit-learn 0.18.0 发布。
- 2015年11月,scikit-learn 0.17.0 发布。
- 2015年3月,scikit-learn 0.16.0 发布。
- 2014年7月,scikit-learn 0.15.0 发布。
- 2013年8月,scikit-learn 0.14 发布。
sklearn 特点
- 简单高效的数据挖掘和数据分析工具。
- 建立在 NumPy,SciPy 和 matplotlib上。
- 开源软件,可商业使用,基于 BSD 开源授权许可协议。