[bookmeter_wish] 数学図書館の情報 #2

stepney141 · 2022-05-19T05:04:02Z

stepney141 · 2022-05-19T10:33:45Z

stepney141 · 2022-05-25T07:42:03Z

現在残っている問題

読書メーターから取得できるのは全てISBN-10だが、数学図書室の蔵書リストは原則としてISBN-13で載っている
PDFをテキストに変換した際、本来あるべきスペースが消えてISBNの前に日付の数字が繋がってしまう場合がある。この余計な部分を上手く避けて直後のISBNだけにマッチする正規表現が必要
数学図書館の蔵書リストは「中央図書館との重複図書」を除いているため、数学図書館側のOPACも確認して蔵書確認を行う必要がある
- 週2回、同じOPACへ集中的に500回以上もアクセスしたら色々まずそうなので、アクセス数を削減する必要がある
- 考えられる方法:「キャッシュをしてOPACの確認頻度を減らす」「そもそもOPACへ所蔵確認しに行く書籍自体を減らす」
- 書籍のジャンルを取得することができれば理工系図書に限って検索することができるが、実装がめんどくさい...
  - 国会図書館APIあたりでできそうではある

stepney141 · 2024-06-21T05:53:16Z

pdfdataextractをやめてPDF.jsを使うようにしたら、正規表現の問題はなんか解決した

stepney141 added the enhancement New feature or request label May 19, 2022

stepney141 added a commit that referenced this issue May 25, 2022

feat: bookmeter_wish: 数学図書館蔵書の検索機能を実装(#2)

a6cbe2f