統計学入門

matplotlib

【保存・装飾・共有に便利】matplotlibでグラフのデザインを整える&画像として出力する方法

Pythonで作成したグラフをレポートやブログに使うとき、「ちょっと見づらい」「もう少し整えたい」と感じたことはありませんか?この記事では、matplotlibでグラフのデザインを美しく整え、画像として保存するためのテクニックを紹介します。...
matplotlib

【Python実践可視化】pandas × matplotlib で効率よくグラフを描こう|初心者向けに徹底解説

データ分析でよく使われるpandasには、実はグラフ描画機能も内蔵されています。この記事では、pandasのplot()メソッドとmatplotlibを組み合わせて、実データから手軽に、かつカスタマイズ性の高いグラフを描く方法を紹介します。...
matplotlib

【Pythonグラフ入門】ヒストグラムと箱ひげ図でデータの分布を可視化しよう

データの「ばらつき」や「外れ値」「中央値」など、全体の特徴を視覚的に把握するには、ヒストグラムや箱ひげ図(ボックスプロット)が非常に有効です。この記事では、matplotlibを使って、ヒストグラムと箱ひげ図を描く方法と、それぞれの使いどこ...
matplotlib

【Pythonグラフ作成】複数グラフを1つの画面に描く|subplotの使い方をやさしく解説

データ分析やレポート作成の中で「複数のグラフを1つの画面に並べて比較したい」と感じたことはありませんか?そんなときに便利なのが、subplot(サブプロット)機能です。この記事では、Pythonの可視化ライブラリ matplotlib を使...
matplotlib

【Python可視化】散布図とカスタマイズの基本|見やすいグラフを描くためのポイント

データ分析において「関係性」を見たいときに便利なのが散布図(scatter plot)です。特に、2つの変数の相関を直感的に理解するのに役立ちます。今回は、matplotlib を使った散布図の描き方と、色・サイズ・透明度などのカスタマイズ...
matplotlib

【Python初心者向け】matplotlibでグラフを描く基本|折れ線・棒グラフの描き方

Pythonでデータ分析を始めたなら、データの“見える化”は欠かせません。データがどのように分布しているのか、時間とともにどう変化しているのかを視覚的に把握できれば、分析の理解が一気に深まります。そんなときに役立つのが、Pythonのグラフ...
python

【超初心者向け】Pythonとは?データ分析で使われる理由をわかりやすく解説

はじめに「Pythonってよく聞くけど、実際なにがすごいの?」「データ分析を始めるならPythonって言われたけど、なぜ?」そんな疑問を持っている方へ。この記事では、Pythonがデータ分析の現場で選ばれている理由を、初心者の方にもわかりや...
JMP

【PythonでPCA】主成分分析を使ってデータを2次元に可視化する 画像あり|統計自主学習補足

はじめにこの記事は、主成分分析(PCA)とは?次元削減の基本を初心者向けにやさしく解説|統計自主学習⑮の補足として、Pythonを使ってPCAを実際に実装してみる内容です。この記事では、PCAによる次元削減データを2次元に圧縮して可視化する...
JMP

【Pythonで外れ値検出】IQR法とZスコア法を実装して実データで試してみた|統計自主学習補足

はじめにこの記事は、【統計自主学習④】外れ値を統計的に検出する方法 ― IQR法とZスコア法をわかりやすく解説の補足として、実際にPythonを使って外れ値検出を実装してみる内容です。「理論はわかったけど、実際にどうやってコードにするの?」...
JMP

教師なし学習の応用編:異常検知・次元削減の世界をやさしく解説|統計自主学習⑱

はじめにこれまでクラスタリングなど教師なし学習(Unsupervised Learning)の基本を学んできました。今回はさらに一歩踏み込んで、教師なし学習の実践的な応用例を紹介します。この記事では、異常検知(Anomaly Detecti...
JMP

クラスタ数はどう決める?エルボー法とシルエット分析を初心者向けにやさしく解説|統計自主学習⑰

はじめに前回の記事では、クラスタリング(k-means法など)を使ってデータをグループ分けする方法を学びました。クラスタリングとは?教師なし学習の基本をやさしく解説しかし、実際にクラスタリングをする際に必ず悩むのが「クラスタ数(k)をいくつ...
JMP

クラスタリングとは?教師なし学習の基礎とk-meansの使い方|統計自主学習⑯

はじめにこれまでの記事では、教師あり学習(分類・回帰)を中心に学んできました。ひとつ前の記事 主成分分析(PCA)で次元削減!データの本質を捉える方法今回は新たなテーマ、「教師なし学習(unsupervised learning)」に挑戦し...
JMP

主成分分析(PCA)とは?次元削減の基本と使い方をやさしく解説|統計自主学習⑮

はじめにデータ分析や機械学習では、「特徴量(説明変数)が多すぎる」問題に直面することがよくあります。特徴量が多いと、モデルが複雑になりすぎる計算コストが増える過学習しやすくなるこれを防ぐための基本的なテクニックが、「次元削減(Dimensi...
JMP

ハイパーパラメータとは?グリッドサーチ・ランダムサーチの使い方を初心者向けに解説|統計自主学習⑭

はじめに機械学習モデルを作成するとき、「どんなモデルを選ぶか」だけでなく、「そのモデルの設定をどうするか」も非常に重要なポイントです。このモデル設定を調整する作業が、「ハイパーパラメータチューニング」です。この記事では、ハイパーパラメータと...
JMP

過学習とは?バイアス・バリアンス問題をやさしく理解|統計自主学習⑬

はじめに機械学習モデルを作成するとき、必ず直面する重要な課題が「過学習(オーバーフィッティング)」です。また、モデルの性能を正しく理解するためには、「バイアス・バリアンスのトレードオフ」についても知っておく必要があります。この記事では、過学...
JMP

混同行列・F1スコアとは?分類問題の評価指標をわかりやすく解説|統計自主学習⑫

はじめに機械学習で分類問題を扱うとき、「モデルの精度ってどうやって測るの?」と疑問に思ったことはありませんか?単に「正しく分類できた割合(精度)」を見るだけでは、本当に良いモデルかどうか判断できない場合があります。この記事では、混同行列(C...
JMP

単回帰分析と重回帰分析とは?回帰の基本を実例つきで解説|統計自主学習⑪

はじめにこれまでの学習では、機械学習モデルの概要やデータの前処理について理解を深めてきました。次のステップとして重要になるのが、「回帰分析」です。回帰分析は、あるデータ(特徴量)から別のデータ(目的変数)を数値的に予測するための基本的な手法...
統計

【初心者向け】統計学入門・データ分析基礎をマスター!統計自主学習シリーズまとめ

― 基本統計量から外れ値対応、機械学習モデルまで一気に理解!統計を独学で学びたい方へ。この【統計自主学習シリーズ】では、基礎から応用まで、初心者にもわかりやすくステップアップできる内容をまとめています。それぞれの記事で、実例や図を交えながら...