以下の手順に従ってください. このスクリプトをダウンロードするには以下のコマンドを使用します.
git clone https://github.com/takiwaki/ReportJSPS ReportJSPS
ファイルの名前と中身は以下の形式に従ってください.
ファイルの名前は??-doifile.csv
としてください.??
には自分の名前やバージョン,日付等をいれます.
このディレクトリに含まれるM1-doifile.csv
を例として配り(M1はmember 1を意味),編集してもらうと良いと思います.
-doifile.csv
を拡張子のように扱うのでこの部分を変更しないでください.-doifile_v2.csvの
ようにバージョンをいれないでください.
形式は以下のようにしてください.2行目は例です.
DOI | refereed? | open access? | international collaboration? | comment |
---|---|---|---|---|
http://dx.doi.org/10.1093/ptep/ptx093 | yes | no | no | Nakano2017 |
天文,天体物理の論文を集める場合にはNASA ADSでack:"科研費の番号"
として検索すると便利です.
ファイルの名前は??-prefile.csv
としてください.??
には自分の名前やバージョン,日付等をいれます.
M1-prefile.csv
を例として配り,更新してもらうと良いと思います.
-prefile.csv
を拡張子のように扱うのでこの部分を変更しないでください.-prefile_v2.csv
のようにバージョンをいれないでください.
形式は以下のようにしてください.Year toは年をまたがない限り省略可能です.複数の発表者はセミコロンで区切ると良いです.
Presenter | Title | Conference | Year from | Year to | invited? | international conference? |
---|---|---|---|---|---|---|
滝脇知也 | ランキン-ユゴニオ関係でみる超新星の衝撃波復活機構 | 衝撃波研究会 | 2018 | yes | no | |
Tomoya Takiwaki; Kei Kotake | C01 progress report | The first annual symposium of the innovative area "Gravitational Wave Physics and Astronomy: Genesis" | 2018 | yes | yes |
以下では内部でcurl
,python
,nkf
,gawk
を使うのでインストールしてください.
Makefile
を開いてproject
に集計したいプロジェクトの名前を書いてください.defaultはSummary
になっています.
つぎにmembers
に集めたファイルの先頭部分を書いてください.M1-doifile.csv
を集めたならM1
です.
# Name of the Project
project=Summary
# Name of the Members, prefix for the files
members=M1 M2
例としてある更新されてないM1-doifile.csv,M2-doifile.csv,M1-prefile.csv,M2-prefile.csvが残っている場合はここで消去してください.
問題なければmake
で終わります.インターネットにつながった環境で行ってください.project名-articles.csv
とproject名-presentations.csv
ができます.
make
問題が起きた場合は必要なプログラムがインストールされているかチェックしてください.また,スクリプト処理した個別のファイルをみて何が変なのかを調べてください.
doi-convt.sh
の中ではcurl
でDOIから論文の情報を取り寄せますが,論文によってはpageやvolumeがありません(代わりにidentiferがあります).学振はそういうときにはハイフンを入れるように指示していますので,そのように処理しています.この欄が空欄だとエラーがでてしまうのでご注意ください.
doi-convt.sh
の中ではcurl
でDOIから論文の情報を取り寄せます.ただし,この論文の情報はutf-8で書かれています.
一方,学振への提出(というかエクセルファイルの仕様)はsjisの出力を求めています.
そこでsjisに直せないウムラウトなどの特殊文字を普通のアルファベットに変換するのがDeleteUmlaut.py
です.
その処理をした後,全体をsjisに変換し最終出力としています.
csvのファイルの中に空欄がある場合,gawkの列番号がずれてしまう問題があります.pre-convt.sh
ではその問題に対処するため,カンマが二つ並んでいたらスペースを挿入して読み込み,出力するときに挿入したスペースを消しています.
出来たproject名-articles.csv
とproject名-presentations.csv
をみてください.うまくいってそうな場合は良いですが,うまくいってない場合は修正が必要です.以下,よくある問題について述べます.
このスクリプトはファイルを1行づつ読んで処理しますので,セル内に改行を含んではいけません.??-doifile.csv
や??-prefile
をエクセルではなくemacs等のエディタで開いてみると改行されているかどうかがわかります.セル内の改行を取り除いてください.
CSVのセル内でコンマ等を使いたい場合,セル全体をダブルクォテーションで囲めば使用できます.しかし,その場合はその内部でダブルクォテーションを使ってはいけません.整合性のあるように修正してください.
大規模なコラボレーションでauthorの欄が空の場合があります,その場合は??-articles.csv
を手で編集してコラボレーション名を加えてください.その編集をした後は??-doifile.csv
を更新しないでください.makefileは??-doifile.csv
のタイムスタンプを比較して??-articles.csv
更新するべきか決めます.
出来たproject名-articles.csv
とproject名-presentations.csv
で重複を消してください.これはエクセル等で並び替えるのがわかりやすいです.
あとは学振に提出してください.
このスクリプトは新学術領域「重力波創世記」の成果報告のために作成しました.