# Rによる気象データ収集
---
気象庁のデータをゲットする方法を考えます。

## 参考にしたサイト
この場を借りて。
- [気象統計情報から過去の気象データを取得](https://gist.github.com/tayohei/2281631)

## パッケージのインストール
XMLのデータを使えるようにしてみます。

In [12]:
install.packages("XML", repos = "http://cran.us.r-project.org")

Updating HTML index of packages in '.Library'
Making 'packages.html' ... done


docker中でのパッケージのインストールが無事できました。install.packages("XML")　だけではダメでした。

できたところで，とりあえず1のプログラムを動かしてみます。

In [15]:
# https://gist.github.com/tayohei/2281631
# より。

# 気象庁の気象統計情報の過去の気象データを引っ張ってくる。（月単位）
# 観測地点の block_no と年月が必要、block_idは下記URLから
# http://www.data.jma.go.jp/obd/stats/etrn/index.php
# 県→地域と選択した時のURLパラメータのblock_noを利用
# windows以外だと文字化けるかも。

library("XML")

getWeather <- function(block,year,month,addDate=T){
    # 気象庁からデータを引っ張ってくる
    # args
    #	block: 観測所のID
    #	year : 年（1872～）
    #	month: 月（1-12）
    #	addDate:出力データに日付の列を追加する
    # return
    #	引っ張ってきた表のdata.frame形式
    url <- "http://www.data.jma.go.jp/obd/stats/etrn/view/daily_s1.php";
    url <- paste(url,"?block_no=",block,"&year=",year,"&month=",month,"&elm=daily",sep="");
    tmp <- xpathSApply(htmlParse(url,encoding="UTF-8"),'//td[@class="data_0_0"]',xmlValue);
    tmp <- data.frame(matrix(tmp,ncol=20,byrow=T));
    # 決め打ちで数値の列は数値に変換
    numcol = c(1:12,14,16:18);
    for(i in numcol){
        tmp[,i] <- as.numeric(as.character(sub("]|)","",tmp[,i])));
    }
    # 列名つける
    colnames(tmp) <- c(
        'press.land','press.sea',
        'rain.sum','rain.max1h','rain.max10m',
        'temp.ave','temp.max','temp.min',
        'hygro.ave','hygro.min',
        'wind.ave','wind.max.v','wind.max.d','wind.max_d.v','wind.max_d.d',
        'daylight',
        'snow.sum','snow.depth',
        'weather.am','weather.pm'
    );
    if(addDate){
        tmp <- cbind(
            year*10000+month*100+(1:nrow(tmp)),
            tmp
        );
        colnames(tmp)[1] <- "date";
    }
    return(tmp);
}


getWeatherAB <- function(block,a.year,a.month,b.year,b.month,addDate=T){
    # 指定した期間での気象情報を出力
    # args
    #	block: 観測所のID
    #	a.year : 開始年（1872～）,	a.month: 月（1-12）
    #	b.year : 終了年（1872～）,	b.month: 月（1-12）
    #	addDate: 結果に日付列を追加するかどうか？
    # return
    #	引っ張ってきた表のdata.frame形式を繋げた形
    if( (a.year*100+a.month)>(b.year*100+b.month) ){
        stop("開始よりも終了が前になってます");
    }
    tmp <- NULL;
    while(a.year<=b.year && a.month<=b.month){
        print(a.year*100+a.month);
        tmp <- rbind(tmp,getWeather(block,a.year,a.month,addDate));
        if(a.month==12){
            a.year  <- a.year+1;
            a.month <- 1;
        }else{
            a.month <- a.month+1;
        }
    }
    return(tmp);
}

SensibleTemp <- function(t,h){
    # おまけ、体感温度（ミスナールの体感温度）
    # args
    #	t : 気温
    #	h : 湿度
    return((t-1/2.3)*(t-10)*(0.8-h/100));
}

DiscomfortIndex <-function(t,h,cut=F){
    # おまけ、不快指数
    # args
    #	t : 気温
    #	h : 湿度
    #	cut : １～８までに分けるかどうたら。
    if(cut){
        return(cut(breaks=c(0,55,60,65,70,75,80,85,100),50:95,1:8));
    }else{
        return(0.81*t+0.01*h*(0.99*t-14.3)+46.3);
    }
}