pandas

pandas

【実践編】pandasで都道府県別・男女別売上を集計する

はじめに実務におけるデータ分析では、「都道府県ごと」「男女別」などのカテゴリごとの集計は頻出です。Excelのピボットテーブルで行っていた処理を、Pythonとpandasで再現できれば、作業効率は劇的にアップします。本記事では、panda...
pandas

【pandas中級編④】groupbyの集計パターン大全(aggで複数指標)

はじめにpandasの groupby() は、カテゴリごとの集計処理に欠かせない関数です。「性別ごとに平均を出したい」「学年ごとに最大点数と最小点数を同時に知りたい」など、実務でもっともよく使われるデータ分析手法の一つです。この記事では、...
pandas

【pandas中級編③】pivot_tableの使い方をやさしく解説(Excel派必見!)

はじめにExcelでおなじみの「ピボットテーブル」。pandasでも、同様の機能が pivot_table() を使うことで簡単に実現できます。グループごとの平均や合計を見たい男女別・年齢別などでクロス集計したい行と列で集計を並べて、見やす...
pandas

【pandas中級編②】列の追加・削除・名前変更・順序変更まとめ

はじめにpandasを使ったデータ処理では、「列の操作」がとても重要です。機械学習や統計処理に進む前に、データを“整える”作業=前処理が必要になりますが、その多くが「列の追加・削除・並べ替え・名前変更」といった作業です。たとえば:余分な列を...
pandas

【pandas中級編①】mergeとconcatで複数の表をつなげる方法まとめ

はじめに複数のデータを1つにまとめたいとき、pandasには主に2つの方法があります。merge() … SQLのJOINのように横方向で結合するconcat() … 縦や横に「そのまま並べる」ようなイメージ「似ているようで、まったく使いど...
pandas

【初心者向け】pandasの使い方をわかりやすく解説|データフレームの基本操作まとめ(最後に問題付き)

第1章:はじめに ~pandasって何?なぜ使うの?~Pythonでデータ分析や統計処理を始めようとしたとき、最初にぶつかる壁は「表形式のデータをどう扱えばいいのか?」ということです。たとえば、CSVファイルやエクセルのような行と列のデータ...
numpy

【5分で理解】Pythonモジュール・ライブラリの使い方【pandas・numpy入門】

はじめにPythonの魅力のひとつは、豊富なモジュールやライブラリを使って、簡単に強力な機能を追加できることです。特に、データ分析では pandas や numpy といったライブラリは必須です。この記事では、Python初心者向けにモジュ...