pandasは、プログラミング言語Pythonにおいて、データ解析を支援する機能を提供するライブラリである。特に、数表および時系列データを操作するためのデータ構造と演算を提供する。PandasはBSDライセンスのもとで提供されている。
データ分析で頻出のPandas基本操作 - Qiita
はじめに機械学習や深層学習が人気の昨今ですが、それらのモデルの精度に最もクリティカルに影響するのはインプットするデータの質です。データの質は、データを適切に把握し、不要なデータを取り除いたり、必要…
pandasの特長
データ操作のための高速で効率的なデータフレーム (DataFrame) オブジェクト
メモリ内のデータ構造とその他のフォーマットのデータ間で相互に読み書きするためのツール群。フォーマット例: CSV、テキストファイル、Excel、SQLデータベース、HDF5フォーマットなど
かしこいデータのアライメントおよび統合された欠損値処理
データセットの柔軟な変形およびピボット
ラベルに基づいたスライス、fancyインデクシング、巨大なデータセットのサブセット取得
データセットに対するsplit-apply-combine操作を可能にするエンジンが提供するpowerful groupを使ったデータの集計および変換
高性能なデータセットのマージと結合
時系列データ: 日付範囲生成、周波数変換、移動窓を用いた統計値や線形回帰、シフトと遅延、など
パフォーマンスのための高度な最適化。重要なコードはCythonまたはC言語で実装されている。
pandasに関する情報 | note.nkmk.me
pandasに関して学んだ情報一覧。