scikit-learn

AI

scikit-learnはPythonのオープンソース機械学習ライブラリである。サポートベクターマシン、ランダムフォレスト、Gradient Boosting、k近傍法、DBSCANなどを含む様々な分類、回帰、クラスタリングアルゴリズムを備えており、Pythonの数値計算ライブラリのNumPyとSciPyとやり取りするよう設計されている。

Scikit-learnプロジェクトはDavid CournapeauによるGoogle Summer of Codeプロジェクト、scikits.learnとして始まった。名前は「Scikit」 (SciPy Toolkit) つまり独立して開発・配布されるScipyのサードパーティ拡張であることを示している 。オリジナルのコードベースは他の開発者に後に書き換えられた。様々なScipy Toolkitのうち、scikit-learnとscikit-imageは2012年11月に「well-mantained and popular (よくメンテナンスされており、広く使われている)」と評されている。

2015年以降、scikit-learnは活発に開発されており、INRIA、Telcom ParisTech、そして (Google Summer of Codeを通して) 部分的にGoogleの援助を受けている 。Evernoteはscikit-learnを使用しており、ライブラリのナイーブベイズ分類器でユーザーの投稿から食べ物のレシピであるものを判別している 。またMendeleyはscikit-learnのSGD回帰アルゴリズムを用いて推薦システムを構築している。

scikit-learnのAPIは、wiseRFと呼ばれる非フリーなランダムフォレスト実装を提供するwise.io に採用されている 。wise.ioのビジネスパートナーであるContinuum IOは、データスループットがscikit-learn実装の7.5倍に上昇したと述べている 。これを受けてscikit-learnの開発者らはメモリ使用以外の部分で、wise.ioに並ぶよう実装を最適化したと主張している。

scikit-learn: machine learning in Python — scikit-learn 1.1.3 documentation
タイトルとURLをコピーしました