We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
需要定時從 airtable 更新資料進 elastic search。
除了 cron job script 之外,重要的是要能自動化判斷相似的文章——或者是保守地差有點多的 rumor 都視為「不一樣」(但這樣的話,根據現在的搜尋評分機制,就會找不到最好的文章 Orz)
The text was updated successfully, but these errors were encountered:
執行的效率則與 cofacts/rumors-db#1 有關。需要大家想想如何更有效率地偵測重複的 rumors / answers。 (亦即改進 #13 的結果)
Sorry, something went wrong.
Too open xD 要不要一步一步解決,先處理更新同步問題? 現在是怎麼更新資料的?
airtable 可以參考:https://github.com/kytu800/bigplatform.tw/blob/master/cron.js
現在更新資料的方式收在另一個 repository: https://github.com/MrOrz/rumors-db ,手動載下 csv 之後,執行 npm run seed 這樣。
npm run seed
其實一個月以前,資料是直接從 airtable 拉下來的: https://github.com/MrOrz/rumors-db/blob/36b3e1d4b4d2f3feabece91c7a9ee87264447fe4/airtable/airtableToElasticSearch.js
但後來考量到其他開發者也要能在自己的電腦 populate seed data,用 airtable API 還要傳遞 API key 很麻煩,乾脆改成大家都能操作的 CSV 下載 + 從 CSV 讀檔案進資料庫。
不過現在的問題在:
目前確定要從 airtable 離開,變成資料直接進 elastic search https://www.facebook.com/groups/1847232902175197/permalink/1896817880550032/
而且編輯界面正在寫。
closing this
MrOrz
No branches or pull requests
需要定時從 airtable 更新資料進 elastic search。
除了 cron job script 之外,重要的是要能自動化判斷相似的文章——或者是保守地差有點多的 rumor 都視為「不一樣」(但這樣的話,根據現在的搜尋評分機制,就會找不到最好的文章 Orz)
The text was updated successfully, but these errors were encountered: