Skip to content

Repository for "Quantitative Methods in Political Science Using R" by Masahiko Asano and Yuki Yanai

Notifications You must be signed in to change notification settings

yukiyanai/quant-methods-R

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

86 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

quant-methods-R

『Rによる計量政治学』サポートページ

Rによる計量政治学

ここから購入できます(電子書籍もあります)。


目次

第I部 リサーチデザイン

  • 第 1章 計量政治学とは
  • 第 2章 研究テーマの選び方
  • 第 3章 理論と仮説

第II部 Rを使った計量分析の方法

  • 第 4章 Rの使い方(Rスクリプト:ch04.R
  • 第 5章 Rによるデータ操作(ch05.R
  • 第 6章 記述統計とデータの可視化・視覚化(ch06.R
  • 第 7章 統計的推定(ch07.R
  • 第 8章 統計的検定(ch08.R
  • 第 9章 変数間の関連性(ch09.R
  • 第10章 回帰分析の基礎(ch10.R
  • 第11章 回帰分析による統計的推定(ch11.R
  • 第12章 回帰分析の前提と妥当性の診断(ch12.R
  • 第13章 回帰分析の応用(ch13.R
  • 第14章 交差項の使い方(ch14.R
  • 第15章 ロジスティック回帰分析(ch15.R

本書で使用するデータ

データの文字コードはすべてUTF-8です

Rdsファイルについての注意(2020-04-09 追記):Windows OS で download.file() 関数を使って Rdsファイル(例:hr-data.Rds)をダウンロードして使おうとすると、read_rds() の時点でエラーが出ることがあるようです。その場合は、Rdsファイルの代わりに同じ内容の CSVファイル(例:hr-data.csv)をダウンロードし、read_csv() で読み込んでください。

衆議院議員総選挙小選挙区候補者データ, 1996-2017

  • データに誤りがあったので修正しました

    • 2020-04-19:福元健太郎さんにご指摘いただきました。
    • 2022-11-23:砂原庸介さんに、選挙区ごとの候補者数 (ncand) の値に誤りがあることをご指摘いただきました。修正箇所:2009年兵庫8区、2014年北海道1区、山形2区、京都2区、京都3区、大阪8区。
  • 修正後のデータ (2022-11-23)

  • 修正前のデータ(教科書通りの分析結果を再生するためのデータ)

  • 政党名の日本語表記と英語(ローマ字)表記の対応表:parties.csv

その他のデータ

ggplot2の使い方についての補足

  • ggplot2入門(高知工科大学「統計学2」の授業用資料)

正誤表

本書で使用するデータ の欄にも記したとおり、データセットに誤りがあったので修正しました。修正したデータを使って分析を行うと、正誤表に掲載されている部分以外にも本文と異なる数字が出るところがあると思います。その際は、適宜数字を読み替えてください。教科書に記載されているとおりの結果を確認したい場合は、修正前のデータをご利用ください。第5章のRコード (p.66) を使えば、修正前のデータがダウンロードできます。

第1版第6刷の正誤表

ページ 場所 解説 Credit
172 2つ目のRコード hr09 <- mutate(hr09, inc = fct_drop(status)) hr09 <- hr09 %>% mutate(inc = ifelse(status == "現職", 1, 0), inc = factor(inc, labels = c("新人", "現職"))) 2刷でコードを単純化した結果、説明とコードの整合性に問題が生じたので、1刷に戻す。よって、1刷にはこの誤りはない。
207 図10.3 の下の最初の文 傾き ($a$) や切片 ($b$) 切片 ($a$) や傾き ($b$) 瀧惇人さん

第1版第5刷の正誤表(1, 2, 3, 4刷にも当てはまります)

ページ 場所 解説 Credit
68 5.1.4節の最初のコード read:: readr::

第1版第4刷の正誤表(1, 2, 3刷にも当てはまります)

ページ 場所 解説 Credit
142 例8-1 感情温度を知るため。 感情温度を知るため、 金山隼人さん
143 脚注1の4行目 詳しくは、こ8.2.2節 詳しくは、8.2.2節 福元健太郎さん
154 最初の式の一部 \sqrt{10}(10の平方根) \sqrt{100} (100の平方根) 丸岡大洋 さん
237 最後のコード df2 = 287 df2 = 285 岩波由香里さん

第1版第3刷の正誤表(第1刷, 第2刷にも当てはまります)

ページ 場所 解説 Credit
77 脚注19 dply dplyr 福元健太郎さん
79 最初のコードの下 縦長に変換しよう、 縦長に変換しよう。 福元健太郎さん
97 最初のコードの下 "numeric"(つまり整数) "numeric"(つまり数値)
98 最初のコードの上の段落 型が整数 型が数値
98 下から3行目 新人が5,107人、現職が3,128人、元職が568人 新人が 5,096人、現職が3,138人、元職が569人
101 6.2.1 の最初の段落 ggplot2:ggplot() ggplot2::ggplot() コロンは2つ
102 散布図の説明 得票率 (votshare) 得票率 (voteshare) 豊野拓巳さん
111 1行目 得票率のヒストグラム 年齢のヒストグラム 豊野拓巳さん
123 4行目 標準偏差は4.6 標準偏差は3.7 豊田優人さん
123 5行目 σ = 4.6 σ = 3.7 豊田優人さん
124 数式 3 < 4.6 = σ 3 < 3.7 = σ 豊田優人さん
128 5行目 標準平均の標準偏差 標本平均の標準偏差 豊野拓巳さん
130 SE の式の上 不偏標準偏差(不偏分散の平方根) 不偏分散の平方根(以後、これを標準偏差と呼ぶ) 不偏分散の平方根は標準偏差の不偏推定量ではないので、不偏標準偏差と呼ぶのは不適切
134 11行目 不偏標準偏差 標準偏差
134 脚注37 不偏標準偏差 標準偏差
149 脚注16 t分布、 t分布、 本文で t 分布に言及して「このほかに」と言っているので不要。
153 脚注22 支持するような 支持するように 豊野拓巳さん
156 23行目 μ1 μ 豊野拓巳さん
175 Rの実行結果として表示される表から5行下 除いたた 除いた 豊野拓巳さん
184 フィッシャーの直接確率計算法の1行目 セルの値 期待度数 セルの値では観測値なのか期待度数なのか不明だが、この方法を使うのは期待度数が5を下回るセルがある場合
194 最終行 第3の 第三の
197 下から2番めの項目 クロス集計表にあるセルの値が クロス集計表のセルの期待度数が セルの値では観測値なのか期待度数なのか不明だが、この方法を使うのは期待度数が5を下回るセルがある場合
198 1行目 逆に、 逆に、サンプルサイズが小さいと (追加) 豊野拓巳さん
208 4行目 ei ej 豊野拓巳さん
208 脚注15 打ち消し合うの避ける 打ち消し合うのを避ける 豊野拓巳さん
210 最終行 重回帰分の 重回帰分析の 豊野拓巳さん
219 7行目 予測値 (ȳ) 予測値 (ŷ) 予測値なのでバーではなくハットが正しい
220 5行目 結果変数 応答変数
228 1行目 次のよう結果 次のような結果 豊野拓巳さん
237 1番下のコード df2 = 2 87 df2 = 287 287 のなかに余分なスペースがある
239 表11.1の選挙費用の標準誤差 0.13 0.12
241 Q11-1 選挙費用と年齢 選挙費用と年齢または過去の当選回数
245 脚注8 elesticity elasticity 豊野拓巳さん
252 まとめの5 正規部分布 正規分布 豊野拓巳さん
272 脚注11 詳しくしは 詳しくは 豊野拓巳さん
280 3行目 fathe father 豊野拓巳さん
280 15行目 同様に、female が0 同様に、c_female が0
284 下から3行目 有権者数数 有権者数 豊野拓巳さん
285 回帰モデルの式 選挙費用3 選挙費用i 豊野拓巳さん
294 3行目 0.73ポイント 0.72ポイント 豊野拓巳さん
308 脚注10 表される 表す
309 2行目 b1 はイタリック 豊野拓巳さん
321 脚注14 入手法法 入手方法 豊野拓巳さん
325 下から5行目 16回以下のなので 16回以下なので 豊野拓巳さん

第1版第2刷の正誤表(第1刷にも当てはまります)

以下の内容は、第1版第3刷(2020年12月発行予定)で修正済みです。

ページ 場所 解説 Credit
73 Rの出力(クロス表)の1行目 862 861 小林 哲郎さん
73 Rの出力(クロス表)の2行目 2378 2379 小林 哲郎さん
97 class(HR$wl) の結果 integer numeric 現在最新のRとreadr では、numeric になるようです(2020-06-16)
97 Rの出力 5563, 2378, 862 5563, 2379, 861
98 Rの出力(ページ上部) 5563, 2378, 862 5563, 2379, 861
98 Rの出力 (ページ下部) 5107, 3128, 568 5096, 3138, 569
251 2つ目のコードブロック geom_abline(a = 0, b = 1, ...) geom_abline(intercept = 0, slope = 1, ...) 配布しているRスクリプト(ch12.R)では、当初から正しいコードになっています。 籠谷公司さん

第1版第1刷の正誤表

以下の内容は、第1版第2刷(2020年1月30日)ですべて修正済みです。

tibbleパッケージ(library("tidyverse") で読み込まれる)で tibble(データフレーム)を作る関数が、data_frame() から tibble() に変更になったので、ご注意ください。

ページ 場所 解説 Credit
81 下から3行目 tibble::data_frame() tibble::tibble() data_frame()tibble() に置き換えられたため。
82 1つ目、2つ目、3つ目のRコード内 data_frame() tibble() 同上
188 Rコード内 data_frame() tibble() 同上
190 下から2つ目のRコード内 data_frame() tibble() 同上
192 一番下のRコード内 data_frame() tibble() 同上
249 Rコード内 data_frame() tibble() 同上
251 最初のRコード内 data_frame() tibble() 同上
309 最初のRコード内 data_frame() tibble() 同上
310 2番目のRコード内 data_frame() tibble() 同上
314 下から2つ目のRコード内 data_frame() tibble() 同上
317 最初と2つ目のRコード内 data_frame() tibble() 同上
323 ページ下部のRコード内 data_frame() tibble() 同上
320 最初と2つ目のRコード内 as_data_frame() as_tibble() as_data_frame()as_tibble() に置き換えられたため。
326--327 Rコード内(4箇所) as_data_frame() as_tibble() 同上
172 2つ目のRコード hr09 <- から始まるコード全体(3行分) hr09 <- mutate(hr09, inc = fct_drop(status)) 元のコードも誤りではないが、こちらの方が簡単。 宋ジェヒョンさん
248 12.2.1 の5行目 誤差の分散均一性(前提3)と誤差の独立性(前提4) 誤差の分散均一性(前提4)と誤差の独立性(前提3) 宋ジェヒョンさん

練習問題の解答

  • 福元健太郎さんから解答例の誤りについてご指摘をいただきました。どうもありがとうございました!

Rのインストールについて

RとRStudioのインストール方法を解説したPDF資料が著者(矢内)のウェブサイト にあります。ご参照ください。

関連書籍

About

Repository for "Quantitative Methods in Political Science Using R" by Masahiko Asano and Yuki Yanai

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published