統計学入門

JMP

線形回帰・ロジスティック回帰・KNN・SVM・決定木・ランダムフォレストとは?基本6モデルを初心者向けに解説|統計自主学習⑩

はじめに機械学習にはさまざまなアルゴリズムが存在しますが、最初に押さえておきたい基本的なモデルがいくつかあります。この記事では、特に使用頻度の高い線形回帰ロジスティック回帰k近傍法(KNN)SVM(サポートベクターマシン)決定木ランダムフォ...
JMP

標準化・正規化で精度が上がる理由とは?機械学習実例つきで解説|統計自主学習⑨

はじめに機械学習や統計モデルを使う際、「データを標準化・正規化すると精度が上がる」とよく言われます。しかし、なぜそんな効果があるのでしょうか?単なる形式的な前処理だと思ってしまうと、その重要性を見逃してしまうかもしれません。この記事では、標...
JMP

正規性の検定とは?標準化・正規化までまとめて解説|統計自主学習⑧

はじめにデータ分析や機械学習に取り組むとき、「このデータは正規分布に従っているだろうか?」という疑問が出てくることがあります。また、アルゴリズムによっては、分析前にデータのスケールを揃えるために標準化や正規化を行う必要もあります。この記事で...
JMP

外れ値を見つける統計手法!IQR法とZスコア法を初心者向けに解説|統計自主学習④

はじめにデータ分析をしていると、「なんだか極端な値があるな」と感じることがあります。こうした外れ値は、分析結果に大きな影響を与えることもあるため、できるだけ早い段階で発見して対応することが重要です。では、外れ値はどのように見つければよいので...
JMP

外れ値の対応方法を徹底解説!除外・修正・検討ポイント|統計自主学習③

はじめにデータ分析を進める中で、外れ値(Outlier)に出会うことは珍しくありません。箱ひげ図を使ったり、統計的な手法を用いることで、通常のデータから大きく外れた値を発見できることがあります。では、外れ値を見つけたらどうすればいいのでしょ...
JMP

【箱ひげ図とは】データのばらつきを一目で把握する方法|統計自主学習②

箱ひげ図 読み方|外れ値や分布をパッと理解する方法はじめにデータを分析する際、「平均」や「中央値」といった代表値だけでは、全体のばらつきや極端な値(外れ値)までは見えてきません。そんなときに役立つのが箱ひげ図(Box plot)です。箱ひげ...
JMP

量的データ・質的データとは?分類と違いを基礎から学ぶ|統計自主学習⑥

はじめにデータ分析の第一歩は、目の前のデータがどのような性質を持っているかを正しく見極めることです。特に重要なのは、「量的データ」か「質的データ」かという分類です。この2つは、単にデータの見た目が違うだけでなく、使える統計手法や分析方法にも...
JMP

相関係数とは?因果関係との違いをわかりやすく解説|統計自主学習⑤

はじめにデータ分析や統計において、相関係数と因果関係はしばしば混同されがちですが、両者は異なる概念です。相関係数は、2つの変数間の関係の強さや方向性を数値で表す指標です。一方で、因果関係は、一方の変数がもう一方に直接的な影響を与える関係を指...
JMP

正規分布とは?現実世界と機械学習での使われ方・特徴まとめ|統計自主学習⑦

・・・・・・はじめに正規分布は、統計やデータ分析において非常に重要な概念です。私たちが日常で観察する多くのデータ(例えば身長や試験の点数など)は、正規分布に近い形で分布しています。正規分布はデータが平均値を中心に左右対称に広がる特徴を持ち、...
JMP

【統計初心者向け】平均・中央値・最頻値・分散・標準偏差をまとめて解説|統計自主学習①

はじめに統計の基本を押さえることは、データを正しく読み解く第一歩です。本記事では、データの中心傾向を表す「平均値・中央値・最頻値」と、データのばらつきを示す「分散・標準偏差」について、初心者にもわかりやすく実例を交えながら解説します。平均や...