Hadoopとは?

AI

Hadoopとは、大規模データの蓄積・分析を分散処理技術によって実現するオープンソースのミドルウェアです。 Apacheプロジェクトの元で、Hortonworks社、米国Yahoo!社、Cloudera社といった初期から参加していた企業に加えて、 Intel社、Microsoft社などより多くの企業のメンバーによって開発が続けられています。

分散処理技術「Hadoop」とは:NTTデータのHadoopソリューション
分散処理技術「Hadoop」とは、Hadoop登場の背景、Hadoopの特長、Hadoopを構成するコンポーネントを紹介します。

Apache Hadoopは大規模データの分散処理を支えるオープンソースのソフトウェアフレームワークであり、Javaで書かれている。Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。HadoopはGoogleのMapReduceおよびGoogle File System(GFS)論文に触発されたものである。

HadoopはApacheのトップレベルプロジェクトの1つであり、世界規模の開発貢献者コミュニティによって開発され、使用されている。

日本Hadoopユーザー会
オープンソースの並列分散処理ミドルアウェア Apache Hadoopのユーザー会です。Apache Hadoopだけでなく、Apache HiveやApache SparkなどのHadoopのエコシステムに関するテーマも扱います。勉強会や...
タイトルとURLをコピーしました