Pythonで学べる統計学の入門書を執筆しました。
「Pythonで学ぶあたらしい統計学の教科書」というタイトルです。

この記事では「Pythonで学ぶあたらしい統計学の教科書」の紹介をします。
サンプルコードやデータは出版社さんのサイトからダウンロードできます

 


Pythonで学ぶあたらしい統計学の教科書

 
出版社さんへのリンク
(詳細な情報はこちらを参照してください)
 

 

基本情報

出版社  : 翔泳社
著者   : 馬場真哉(このサイト、Logics of Blueの管理人です)
タイトル : Pythonで学ぶあたらしい統計学の教科書

2018年4月19日発売。
出版社さんへのリンク

 

書籍の特徴

この本はPythonで学べる統計学の入門書です。
確率変数や確率分布という用語がなぜデータ分析に必要となるのかといった基礎の基礎から、区間推定や統計的仮説検定、そして統計モデルや機械学習とのつながりまで、少しずつステップアップしていくような構成になっています。

Pythonを使ったデータ分析に興味がある方はもちろん、高度な教科書の副読本として、あるいは機械学習を学ぶ前の基礎固めとしてもお使いいただけると思っています。

 

書籍の内容

第1部で統計学の基礎を学びます。数量データとカテゴリデータの違いや階級・ヒストグラムといった基本事項から説明します。

第2部でPythonの基礎を学びます。基本的な構文やnumpy、pandasの簡単な解説があります。

第3部でPythonを用いたデータ分析を学びます。データの集計やseabornを使った図示、標本分布のシミュレーションから始まり、scipy.statsを用いた区間推定や統計的仮説検定までを学びます。

第4部で統計モデルの基礎を学びます。線形モデルの構築方法の概要や、最尤法や最小二乗法といった理論を学びます。

第5部でstatsmodelsパッケージを用いた正規線形モデルの構築を学びます。

第6部でstatsmodelsパッケージを用いた一般化線形モデルの構築を学びます。

第7部で正則化やニューラルネットワークを通して、機械学習と統計学のつながりに触れます。sklearnを用いた分析事例も併せて紹介します。

 

この本に載っていること・載っていないこと

統計学の基礎から統計モデルまで少しずつステップアップしていこうという方針で執筆しました。
基礎の基礎から統計モデルへ至る流れがわかるのは長所だと思います。
一方で、個別のテーマはやや内容が少なくなっています。適宜参考文献を挙げるようにはしましたが、詳細な議論はこういった文献に譲るところも一部あります。
また、ベイズ統計学への言及はありません。

Pythonで検定やGLMを手軽に実行したいと思っている方にはちょうど良いと思います。scipy.statsやstatsmodels、sklearnを積極的に活用したため、この本に載っているレベルの分析であれば、R言語のようにスムーズな実装ができます。
また、シミュレーションもしばしば利用したので、しっかりした入門書を読む際の副読本としても使いやすい構成になったかと思います。標準偏差と標準誤差の違いがよくわからないという方は、第3部のシミュレーションの結果を眺めると少し理解が深まるかもしれません。
逆に、こういったところを重視しているので、応用面はやや少なくなっています。
初学者寄りの内容であることには留意してください。

 
 
更新履歴
2018年4月4日:新規追加
2018年4月20日:データのダウンロードページへのリンクを追加