2020年12月19日 / 最終更新日時 : 2024年8月28日 馬場真哉 データ分析入門 分散分析の基礎 この記事では、分散分析と呼ばれる検定手法について解説します。特に一元配置分散分析の解説となります。 分散分析の理論と、ソフトウェアを使った実行方法を解説します。 まず分散分析の基本事項を整理してから、分散分析で用いられる […]
2019年12月19日 / 最終更新日時 : 2021年1月5日 馬場真哉 99.情報 R言語ではじめるプログラミングとデータ分析:サポートページ 『R言語ではじめるプログラミングとデータ分析』のサポートページです。 この記事では、書籍の特徴などの紹介をしています。 本書に使用したサンプルデータとRコードは、すべてGitHubから参照できます。 R言語 […]
2019年6月10日 / 最終更新日時 : 2023年7月29日 馬場真哉 99.情報 RとStanではじめる ベイズ統計モデリングによるデータ分析入門:サポートページ 『RとStanではじめる ベイズ統計モデリングによるデータ分析入門』のサポートページです。 この記事では、書籍の特徴などの紹介をしています。 本書に使用したサンプルデータとR,Stanのコードは、すべてGitHubから参 […]
2018年4月4日 / 最終更新日時 : 2020年12月27日 馬場真哉 99.情報 Pythonで学ぶあたらしい統計学の教科書の紹介 Pythonで学べる統計学の入門書を執筆しました。 「Pythonで学ぶあたらしい統計学の教科書」というタイトルです。 この記事では「Pythonで学ぶあたらしい統計学の教科書」の紹介をします。 サンプルコードやデータは […]
2017年7月20日 / 最終更新日時 : 2017年7月20日 馬場真哉 データ分析入門 主成分分析の考え方 最終更新:2017年7月20日 主成分分析は、多種類のデータを要約するための強力なツールです。 この記事では、主成分分析の考え方・計算の方法、そしてR言語を用いた実装方法について説明します。 まずは、主成分分析とは何者で […]
2017年7月18日 / 最終更新日時 : 2020年12月27日 馬場真哉 データ分析入門 t検定の考え方 t検定について、その考え方や計算の仕組みについて説明します。 マニュアルとして手順を覚えるのではなく「なぜその指標を計算するのか」という理由を理解するようにして下さい。マニュアルとして覚えてしまうと、応用がききません。 […]
2017年7月13日 / 最終更新日時 : 2020年12月27日 馬場真哉 データ分析入門 カイ二乗検定 最終更新:2020年12月27日 χ二乗検定(カイ二乗検定・χ2検定)について、その考え方や計算の仕組みについて説明します。 また、より正確な検定とされる「Fisherの正確確率検定」の実行方法や、データの誤った集計がも […]
2016年5月14日 / 最終更新日時 : 2019年3月19日 馬場真哉 理論から始める確率・統計 統計的仮説検定の基礎 統計的仮説検定とは、標本を使って、母集団に関する判断を下す手法だといえます。 今回は、ある特定の確率分布に、データが「従っていない」ことを(少し遠回しに)判断することを試みます。 例えば、手持ちのデータの期待値が0ではな […]
2016年5月14日 / 最終更新日時 : 2019年3月19日 馬場真哉 理論から始める確率・統計 推定の基礎 データから確率分布を推定するのが、統計解析の第一歩です。 確率分布を推定するためには、例えば正規分布だと、期待値と分散という2つのパラメタを推定できれば良いのでした。 期待値くらい簡単に計算できそうですが、ここではもう少 […]
2016年5月14日 / 最終更新日時 : 2019年3月19日 馬場真哉 理論から始める確率・統計 確率密度関数と正規分布 ここでは統計学の難所、確率密度関数について説明します。 確率密度関数の意味と使い方をぜひ学んでください。 目次 1.確率密度関数とは何か 2.なぜ確率密度関数が必要か 補足:確率と確率密度 3.正規分布 4 […]