データサイエンスとは
データサイエンスとは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う。
データサイエンスを、統計的、計算的、人間的視点から俯瞰することができよう。それぞれの視点がデータサイエンスを構成する本質的な側面であるが、これらの3つの視点の有機的結合こそがデータサイエンスという学問の神髄である(Blei and Smyth, 2017[1])。これまでのデータ解析における現場の知識の重要性に対する認識不足が、データサイエンスという学問に対する幅広い誤解の源泉であると考えられる。
データサイエンスは、はっきりとした応用の文脈をもち、超領域性の様相を呈していて、また研究成果に対しては明確な社会的説明責任が求められ、さらに、研究成果の質的保証のためには従来の座学的基準以外に質のコントロールのための追加の基準が必要とされる。データサイエンスの有効な推進のためには組織の異種混合性も重要である。これらの要件を満たす科学はギボンズらが主張するモード2科学の一種として認識することが出来る。
データサイエンスで使用される手法は多岐にわたり、分野として数学、統計学、計算機科学、情報工学、パターン認識、機械学習、データマイニング、データベース、可視化などと関係する。
データサイエンスの研究者や実践者はデータサイエンティストと呼ばれる。
データサイエンスの応用としては、生物学、医学、工学、経済学、社会学、人文科学などが挙げられる。
データサイエンスが重要である理由
データサイエンス、AI、機械学習の重要性に気付いた企業が増え続けています。業種や規模にかかわらず、ビッグデータの時代に競争力を維持したいと考える組織は、データサイエンス機能を効率的に開発し、実装していかなければ、周囲に後れをとる可能性があります