diff --git a/README.md b/README.md index fbb332aa..6fd98c5d 100644 --- a/README.md +++ b/README.md @@ -371,7 +371,7 @@ day). But be careful, the `statuses/lookup` endpoint used by the hydrate subcommand has a rate limit of 900 requests per 15 minutes for User Auth, and 300 request -per 15 minutes for App Auth. +per 15 minutes for App Auth. If you know what you are doing and want to force App Auth you can use the `--app_auth` command line option: @@ -486,9 +486,9 @@ Each script can also generate an html demo of a D3 visualization, e.g. [timelines](https://wallandbinkley.com/twarc/bill10/) or a [directed graph of retweets](https://wallandbinkley.com/twarc/bill10/directed-retweets.html). -[Japanese]: https://github.com/DocNow/twarc/blob/master/README_ja_jp.md -[Portuguese]: https://github.com/DocNow/twarc/blob/master/README_pt_br.md -[Spanish]: https://github.com/DocNow/twarc/blob/master/README_es_mx.md -[Swedish]: https://github.com/DocNow/twarc/blob/master/README_sv_se.md -[Swahili]: https://github.com/DocNow/twarc/blob/master/README_sw_ke.md +[Japanese]: https://github.com/DocNow/twarc/blob/main/README_ja_jp.md +[Portuguese]: https://github.com/DocNow/twarc/blob/main/README_pt_br.md +[Spanish]: https://github.com/DocNow/twarc/blob/main/README_es_mx.md +[Swedish]: https://github.com/DocNow/twarc/blob/main/README_sv_se.md +[Swahili]: https://github.com/DocNow/twarc/blob/main/README_sw_ke.md [ISO 639-1]: https://en.wikipedia.org/wiki/List_of_ISO_639-1_codes diff --git a/README_es_mx.md b/README_es_mx.md index 6606fc76..76412389 100644 --- a/README_es_mx.md +++ b/README_es_mx.md @@ -18,15 +18,15 @@ Antes de usar Twarc es necesario registrarse por [apps.twitter.com](https://apps Para empezar, se nececita dirigir a twarc sobre los claves de API: `twarc configure` - + Prueba una búsqueda: `twarc search blacklivesmatter > search.josnl` - + ¿O quizás, preferirá coleccionar tweets en tiempo real? `twarc filter blacklivesmatter > stream.josnl` - + Vea abajo por detalles sobre estos commandos y más. ## Uso @@ -35,10 +35,10 @@ Vea abajo por detalles sobre estos commandos y más. Una vez que tenga sus claves de aplicación, puede dirigir a twarc lo que son con el commando `configure`. `twarc configure` - + Esto archiva sus credenciales en un archivo que se llama `.twarc` en su directorio personal para que no tenga que volver a ingresar los datos. Si prefiere ingresar los datos directamente, se -puede establecer en el ambiente `(CONSUMER_KEY, CONSUMER_SECRET, ACCESS_TOKEN, ACCESS_TOKEN_SECRET)` +puede establecer en el ambiente `(CONSUMER_KEY, CONSUMER_SECRET, ACCESS_TOKEN, ACCESS_TOKEN_SECRET)` o usando las opciones de línea commando `(--consumer_key, --consumer_secret, --access_token, --access_token_secret)`. ### Search @@ -87,7 +87,7 @@ Si combina las opciones serán "OR'ed" juntos. Por ejemplo, esto colecciona los ### Sample -Usa el commando `sample` para probar a los [statuses/API de muestra](https://developer.twitter.com/en/docs/tutorials/consuming-streaming-data) para una muestra "azar" de tweets recientes. +Usa el commando `sample` para probar a los [statuses/API de muestra](https://developer.twitter.com/en/docs/tutorials/consuming-streaming-data) para una muestra "azar" de tweets recientes. `twarc sample > tweets.jsonl` @@ -99,9 +99,9 @@ El commando `dehydrate` genera una lista de id's de un archivo de tweets: ### Hydrate -El mando `hydrate` busca a través de un archivo de identificadores y regresa el JSON del tweet usando el ["status/lookup API"](https://developer.twitter.com/en/docs/api-reference-index). +El mando `hydrate` busca a través de un archivo de identificadores y regresa el JSON del tweet usando el ["status/lookup API"](https://developer.twitter.com/en/docs/api-reference-index). -`twarc hydrate ids.txt > tweets.jsonl` +`twarc hydrate ids.txt > tweets.jsonl` Los [términos de servicio](https://developer.twitter.com/en/developer-terms/policy#6._Be_a_Good_Partner_to_Twitter) del API de Twitter desalientan los usuarios a hacer público por el internet los datos de Twitter. Los datos se pueden usar para el estudio y archivado para uso local, pero no para compartir público. Aún, Twitter permite archivos de identificadores de Twitter ser compartidos. Puede usar el API de Twitter para hidratar los datos, o recuperar el completo JSON dato. Esto es importante para la [verificación](https://en.wikipedia.org/wiki/Reproducibility) del estudio de los redes sociales. @@ -149,7 +149,7 @@ También se puede omitir el `woeid` y los datos que regresan serán una lista de Si tiene un geo-location, puede usarlo. -`twarc trends 39.9062,-79.4679` +`twarc trends 39.9062,-79.4679` Twarc buscara el lugar usando el [trends/closest](https://developer.twitter.com/en/docs/api-reference-index) API para encontrar el `woeid` más cerca. @@ -196,27 +196,27 @@ Twarc se puede usar programáticamente como una biblioteca para coleccionar twee t = Twarc(consumer_key, consumer_secret, access_token, access_token_secret) for tweet in t.search("ferguson"): print(tweet["text"])` - + Puedes usar lo mismo para el filtro de stream de nuevos de tweets que sean iguales al track keyword. `for tweet in t.filter(track="ferguson"): print(tweet["text"])` - + o lugar: `for tweet in t.filter(locations="-74,40,-73,41"): print(tweet["text"])` - + o user ids: `for tweet in t.filter(follow='12345,678910'): print(tweet["text"])` - -También los identificados de tweets se pueden hydratar: + +También los identificados de tweets se pueden hydratar: `for tweet in t.hydrate(open('ids.txt')): print(tweet["text"])` - + ## Utilities En el directorio de utilidades hay algunos commando simple de line utilities para trabajar conel line-oriented JSON, Como imprimiendo out the archived tweets as texto o html, extracting the usernames, referenced URLs, etc. Si creas un script que tú puedas encontrar fácilmente por favor envía un pull request. @@ -305,10 +305,10 @@ Cada script también puede generar un html demo de D3 visualization, e.g. [timel Crédito de tradução: [Tina Figueroa] -[japonés]: https://github.com/DocNow/twarc/blob/master/README_ja_jp.md -[Portugués]: https://github.com/DocNow/twarc/blob/master/README_pt_br.md -[Inglés]: https://github.com/DocNow/twarc/blob/master/README.md -[Sueco]: https://github.com/DocNow/twarc/blob/master/README_sv_se.md -[Swahili]: https://github.com/DocNow/twarc/blob/master/README_sw_ke.md +[japonés]: https://github.com/DocNow/twarc/blob/main/README_ja_jp.md +[Portugués]: https://github.com/DocNow/twarc/blob/main/README_pt_br.md +[Inglés]: https://github.com/DocNow/twarc/blob/main/README.md +[Sueco]: https://github.com/DocNow/twarc/blob/main/README_sv_se.md +[Swahili]: https://github.com/DocNow/twarc/blob/main/README_sw_ke.md [Tina Figueroa]: https://github.com/@tinafigueroa diff --git a/README_ja_jp.md b/README_ja_jp.md index b89003fd..4b539e1b 100644 --- a/README_ja_jp.md +++ b/README_ja_jp.md @@ -7,7 +7,7 @@ twarc TwarcはTwitterのJSONデータをアーカイブするためのコマンドラインツール及びPythonライブラリです. -- 各ツイートは, Twitter APIから返された内容を[正確に](https://dev.twitter.com/overview/api/tweets)表すJSONオブジェクトとして表されます. +- 各ツイートは, Twitter APIから返された内容を[正確に](https://dev.twitter.com/overview/api/tweets)表すJSONオブジェクトとして表されます. - ツイートは[line-oriented JSON](https://en.wikipedia.org/wiki/JSON_Streaming#Line-delimited_JSON)として保存されます. - Twarcは, Twitter APIの[レート制限](https://dev.twitter.com/rest/public/rate-limiting)をあなたのために処理します. - ツイートの収集に加え, Twarcはユーザーやトレンド, ツイートIDの詳細な情報の収集(ハイドレート)にも役立ちます. @@ -18,8 +18,8 @@ Twarcは[Mellon Foundation](https://mellon.org/)によって援助された[Docu Twarkを使う前に[Twitter Developers](http://apps.twitter.com)にあなたのアプリケーションを登録する必要があります. -登録したら, コンシューマーキーとその秘密鍵を控えておきます. -そして「Create my access token」をクリックして、アクセストークンと秘密鍵を生成して控えておいてください. +登録したら, コンシューマーキーとその秘密鍵を控えておきます. +そして「Create my access token」をクリックして、アクセストークンと秘密鍵を生成して控えておいてください. これら4つの鍵が手元に揃えば, Twarcを使い始める準備は完了です. 1. [Python](http://python.org/download)をインストールする (Varsion2か3) @@ -77,7 +77,7 @@ twarc configure twarc search blacklivesmatter > tweets.jsonl ``` -ここで重要なのは, `search`コマンドがTwitter検索APIの課す7日間以内の期限中から見つかったツイートを返すということです. +ここで重要なのは, `search`コマンドがTwitter検索APIの課す7日間以内の期限中から見つかったツイートを返すということです. もし期限が「短すぎる」と思うのなら(まあそれはそうですが), 以下の`filter`コマンドや`sample`コマンドを使って収集してみると面白いかもしれません. Twitterの検索構文についてよく知るためのベストプラクティスは, [Twitter's Advanced Search](https://twitter.com/search-advanced)で試してみて, 検索窓からクエリ文の結果をコピペすることです. @@ -88,7 +88,7 @@ Twitterの検索構文についてよく知るためのベストプラクティ twarc search '#blacklivesmatter OR #blm to:deray' > tweets.jsonl ``` -また, [Igor Brigadir](https://github.com/igorbrigadir)の*素晴らしい*Twitter検索構文のリファレンスを絶対にチェックしておくべきです.([Advanced Search on Twitter](https://github.com/igorbrigadir/twitter-advanced-search/blob/master/README.md)) +また, [Igor Brigadir](https://github.com/igorbrigadir)の*素晴らしい*Twitter検索構文のリファレンスを絶対にチェックしておくべきです.([Advanced Search on Twitter](https://github.com/igorbrigadir/twitter-advanced-search/blob/master/README.md)) 高度な検索フォームには, すぐにはみつからない隠れた宝石がたくさんあります. Twitterはツイートの言語をコーディングしようとします. [ISO 639-1]コードを使用すれば, 特定の言語に検索を制限できます. @@ -97,7 +97,7 @@ Twitterはツイートの言語をコーディングしようとします. [ISO twarc search '#blacklivesmatter' --lang fr > tweets.jsonl ``` -特定の場所でのツイートを検索することもできます. +特定の場所でのツイートを検索することもできます. 例えば, ミズーリ州ファーガソンの中心から1マイルの`blacklivesmatter`に言及するツイートなどを検索できます. ```bash @@ -118,39 +118,39 @@ twarc search --geocode 38.7442,-90.3054,1mi > tweets.jsonl twarc filter blacklivesmatter,blm > tweets.jsonl ``` -ここで注意すべきなのは, Twitterのトラッククエリの構文は, 検索APIのクエリとは少し異なるということです. +ここで注意すべきなのは, Twitterのトラッククエリの構文は, 検索APIのクエリとは少し異なるということです. そのため, 使用しているフィルターオプションの最も良い表現方法については, ドキュメントを参照してください. -特定のユーザーIDから呟かれたツイートを収集したい場合は, `follow`引数を使いましょう. +特定のユーザーIDから呟かれたツイートを収集したい場合は, `follow`引数を使いましょう. これにはリツイートも含まれます. 例えば, これは`@CNN`のツイート及びリツイートを収集します. ```bash twarc filter --follow 759251 > tweets.jsonl ``` -境界ボックス座標の数値(バウンディングボックス)を用いてツイートを収集することもできます. +境界ボックス座標の数値(バウンディングボックス)を用いてツイートを収集することもできます. 注意: 先頭のダッシュ(`-`)はバウンディングボックス内ではエスケープする必要があります. エスケープしないと, コマンドライン引数として解釈されてしまいます! ```bash twarc filter --locations "\-74,40,-73,41" > tweets.jsonl ``` -`lang`コマンドライン引数を使用して, 検索を制限する[ISO 639-1]の言語コードを渡すことができます. -フィルターストリームでは, 1つ以上の言語でフィルタリングできるため, 繰り返し可能です. +`lang`コマンドライン引数を使用して, 検索を制限する[ISO 639-1]の言語コードを渡すことができます. +フィルターストリームでは, 1つ以上の言語でフィルタリングできるため, 繰り返し可能です. 以下は, フランス語またはスペイン語で呟かれた, パリまたはマドリードに言及しているツイートを収集します. ```bash twarc filter paris,madrid --lang fr --lang es ``` -フィルタを組み合わせてオプションの後ろに続けた場合には, それらは共にORで結がれます. +フィルタを組み合わせてオプションの後ろに続けた場合には, それらは共にORで結がれます. 例えば, これはハッシュタグ`#blacklivesmatter`または`#blm`を使用するツイート, 及びユーザー`@CNN`からのツイートを収集します. ```bash twarc filter blacklivesmatter,blm --follow 759251 > tweets.jsonl ``` -ただし, 場所と言語を組み合わせると, 結果的にANDになります. +ただし, 場所と言語を組み合わせると, 結果的にANDになります. 例えば, これは, スペイン語またはフランス語で呟かれた, ニューヨークあたりからのツイートを収集します. ```bash @@ -228,7 +228,7 @@ twarc friends deray > friend_ids.txt ### Trends | トレンド -時に, 興味のあるトレンドの地域を示す[Where On Earth](https://web.archive.org/web/20180102203025/https://developer.yahoo.com/geo/geoplanet/)識別子(`WOE ID`)をオプションに与える必要があります. +時に, 興味のあるトレンドの地域を示す[Where On Earth](https://web.archive.org/web/20180102203025/https://developer.yahoo.com/geo/geoplanet/)識別子(`WOE ID`)をオプションに与える必要があります. 例としてセントルイスの現在のトレンドを取得するやり方を示します. ```bash @@ -279,10 +279,10 @@ twarc retweets 824077910927691778 > retweets.jsonl ### Replies | 返信 -残念ながら, TwitterのAPIは現在, ツイートへの返信の取得をサポートしていません. +残念ながら, TwitterのAPIは現在, ツイートへの返信の取得をサポートしていません. 代わりに, Twarcは検索APIを使用してその機能の近似を行います. -Twitterの検索APIは, 1週間以上前のツイートの取得をサポートしていません. +Twitterの検索APIは, 1週間以上前のツイートの取得をサポートしていません. そのため, Twarcは先週までに送信されたツイートに対する返信のみを取得できます. 特定のツイートへの返信を取得したい場合は以下のようにします. @@ -291,7 +291,7 @@ Twitterの検索APIは, 1週間以上前のツイートの取得をサポート twarc replies 824077910927691778 > replies.jsonl ``` -`--recursive`オプションを使用すると, 返信に対する返信や引用も取得されます. +`--recursive`オプションを使用すると, 返信に対する返信や引用も取得されます. 検索APIによるレート制限のために, 長いスレッドの場合は完了するのに長時間かかる場合があります. ```bash @@ -326,14 +326,14 @@ for tweet in t.filter(track="ferguson"): print(tweet["text"]) ``` -また`location`なら, +また`location`なら, ```python for tweet in t.filter(locations="-74,40,-73,41"): print(tweet["text"]) ``` -`user id`なら, +`user id`なら, ```python for tweet in t.filter(follow='12345,678910'): @@ -349,8 +349,8 @@ for tweet in t.hydrate(open('ids.txt')): ## Utilities | ユーティリティ -`utils`ディレクトリには, line-oriented JSONを操作するための簡単なコマンドラインユーティリティがいくつかあります. -例えばアーカイブされたツイートをテキストまたはHTMLとして出力したり, ユーザー名や参照URLなどを抽出したりするものです. +`utils`ディレクトリには, line-oriented JSONを操作するための簡単なコマンドラインユーティリティがいくつかあります. +例えばアーカイブされたツイートをテキストまたはHTMLとして出力したり, ユーザー名や参照URLなどを抽出したりするものです. 便利なスクリプトを自作したら, 是非プルリクエストをください. @@ -384,7 +384,7 @@ utils/network.py --users tweets.jsonl tweets.html utils/network.py --users tweets.jsonl tweets.gexf ``` -`gender.py`は, 著者の性別に関する推測に基づいてツイートをフィルタリングできるフィルターです. +`gender.py`は, 著者の性別に関する推測に基づいてツイートをフィルタリングできるフィルターです. 例えば, 女性からのもののように見えるすべてのツイートを除外し, それらの単語クラウドを作成できます. ```bash @@ -435,7 +435,7 @@ ID順ソートできます.これは, 時間順ソートに似ています. utils/sort_by_id.py tweets.jsonl > sorted.jsonl ``` -特定の日付以前のすべてのツイートを除外できます. +特定の日付以前のすべてのツイートを除外できます. 例えば, 以下は関心のあるイベントの前, 別のイベントにハッシュタグが使用されていた場合です. ```bash @@ -448,7 +448,7 @@ utils/filter_date.py --mindate 1-may-2014 tweets.jsonl > filtered.jsonl utils/source.py tweets.jsonl > sources.html ``` -リツイートを削除する場合は, +リツイートを削除する場合は, ```bash utils/noretweets.py tweets.jsonl > tweets_noretweets.jsonl @@ -468,12 +468,12 @@ cat unshortened.jsonl | utils/urls.py | sort | uniq -c | sort -nr > urls.txt ## twarc-report -[twarc-report](https://github.com/pbinkley/twarc-report)プロジェクトでは, [D3.js](http://d3js.org/)でのビジュアライゼーションでの使用に適したCSVまたはJSONを生成・出力するユーティリティスクリプトを用意しています. +[twarc-report](https://github.com/pbinkley/twarc-report)プロジェクトでは, [D3.js](http://d3js.org/)でのビジュアライゼーションでの使用に適したCSVまたはJSONを生成・出力するユーティリティスクリプトを用意しています. 以前はTwarcの一部であった`directed.py`は`d3graph.py`としてtwarc-reportプロジェクトに移管しました. またそれぞれのスクリプトは, ビジュアライゼーションのHTMLでのデモを生成できます. -具体例として, +具体例として, - [タイムライン](https://www.wallandbinkley.com/twarc/bill10/) - [リツイートの有向グラフ](https://www.wallandbinkley.com/twarc/bill10/directed-retweets.html) @@ -483,10 +483,10 @@ cat unshortened.jsonl | utils/urls.py | sort | uniq -c | sort -nr > urls.txt 翻訳クレジット: [Haruna] -[英語]: https://github.com/DocNow/twarc/blob/master/README.md -[ポルトガル語]: https://github.com/DocNow/twarc/blob/master/README_pt_br.md -[スペイン語]: https://github.com/DocNow/twarc/blob/master/README_es_mx.md -[スウェーデン語]: https://github.com/DocNow/twarc/blob/master/README_sv_se.md -[スワヒリ語]: https://github.com/DocNow/twarc/blob/master/README_sw_ke.md +[英語]: https://github.com/DocNow/twarc/blob/main/README.md +[ポルトガル語]: https://github.com/DocNow/twarc/blob/main/README_pt_br.md +[スペイン語]: https://github.com/DocNow/twarc/blob/main/README_es_mx.md +[スウェーデン語]: https://github.com/DocNow/twarc/blob/main/README_sv_se.md +[スワヒリ語]: https://github.com/DocNow/twarc/blob/main/README_sw_ke.md [ISO 639-1]: https://en.wikipedia.org/wiki/List_of_ISO_639-1_codes [Haruna]: https://github.com/eggplants diff --git a/README_pt_br.md b/README_pt_br.md index 5b6642cc..80981a36 100644 --- a/README_pt_br.md +++ b/README_pt_br.md @@ -330,9 +330,9 @@ Cada script também pode gerar uma demo html de uma visualização D3, e.g. Tradução créditos: [Wilson Jr] -[Espanhol]: https://github.com/DocNow/twarc/blob/master/README_es_mx.md -[Inglês]: https://github.com/DocNow/twarc/blob/master/README.md -[Japonês]: https://github.com/DocNow/twarc/blob/master/README_ja_jp.md -[Sueco]: https://github.com/DocNow/twarc/blob/master/README_sv_se.md -[Suaíli]: https://github.com/DocNow/twarc/blob/master/README_sw_ke.md +[Espanhol]: https://github.com/DocNow/twarc/blob/main/README_es_mx.md +[Inglês]: https://github.com/DocNow/twarc/blob/main/README.md +[Japonês]: https://github.com/DocNow/twarc/blob/main/README_ja_jp.md +[Sueco]: https://github.com/DocNow/twarc/blob/main/README_sv_se.md +[Suaíli]: https://github.com/DocNow/twarc/blob/main/README_sw_ke.md [Wilson Jr]: https://github.com/py3in diff --git a/README_sv_se.md b/README_sv_se.md index c56289b3..d4ede22e 100644 --- a/README_sv_se.md +++ b/README_sv_se.md @@ -9,9 +9,9 @@ twarc är ett kommandoradsverktyg twarc och ett Pythonbibliotek för arkivering Varje tweet är representerat som ett JSON-objekt som är [exakt](https://dev.twitter.com/overview/api/tweets) vad som returneras från Twitters API Tweets lagras som [line-oriented JSON](https://en.wikipedia.org/wiki/JSON_Streaming#Line-delimited_JSON). Twarc hanterar Twitter API:ets [rate limits](https://dev.twitter.com/rest/public/rate-limiting) -åt dig. Förutom att kunna samla in tweets kan även Twarc hjälpa dig att samla in användare, trender och omvandla tweet-id:n till tweets. +åt dig. Förutom att kunna samla in tweets kan även Twarc hjälpa dig att samla in användare, trender och omvandla tweet-id:n till tweets. -twarc har utvecklats som en del av [Documenting the Now](http://www.docnow.io) +twarc har utvecklats som en del av [Documenting the Now](http://www.docnow.io) projektet som finiansierades av [Mellon Foundation](https://mellon.org/). @@ -19,14 +19,14 @@ projektet som finiansierades av [Mellon Foundation](https://mellon.org/). Innan du använder twarc behöver du registrera en applikation hos [apps.twitter.com](http://apps.twitter.com). När du har skapat din applikation, skriv ner consumer key, consumer secret och klicka för att generera en access token och en access token secret. -Med dessa fyra variabler är du redo att börja använda twarc. +Med dessa fyra variabler är du redo att börja använda twarc. 1. Installera [Python](http://python.org/download) (2 eller 3) 2. pip install twarc (om du uppgraderar: pip install --upgrade twarc) ## Snabbstart: -Först måste du tala om för twarc vad dina API-nycklar är och tillåta åtkomst till ett +Först måste du tala om för twarc vad dina API-nycklar är och tillåta åtkomst till ett eller flera twitterkonton: twarc configure @@ -39,19 +39,19 @@ Eller om du vill samla in tweets i samma ögonblick de skapas: twarc filter blacklivesmatter > stream.jsonl -Se nedan för detaljer om dessa och fler kommandon. +Se nedan för detaljer om dessa och fler kommandon. ## Användning ### Konfigurera -När du har dina applikationsnycklar så kan du tala om för twarc vilka de är med +När du har dina applikationsnycklar så kan du tala om för twarc vilka de är med `configure` kommandot. twarc configure -Detta kommer att lagra dina nycklar i en fil som heter `.twarc` placerad i din hemkatalog så du slipper att skriva in dem varje gång. +Detta kommer att lagra dina nycklar i en fil som heter `.twarc` placerad i din hemkatalog så du slipper att skriva in dem varje gång. Om du hellre vill tilldela dom direkt så kan du göra det i environment (`CONSUMER_KEY`, `CONSUMER_SECRET`, `ACCESS_TOKEN`, `ACCESS_TOKEN_SECRET`) eller genom att använda kommandoradsparameter options (`--consumer_key`, `--consumer_secret`, `--access_token`, @@ -62,11 +62,11 @@ Detta använder Twitters [search/tweets](https://dev.twitter.com/rest/reference/ twarc search blacklivesmatter > tweets.jsonl -Det är viktigt att notera att `search` retunerar tweets som hittas inom det 7-dagarsfönster som -Twitters sök-API erbjuder. Känns det som ett smalt fönster? Det är det. Men du kanske är intresserad av att samla in tweets i samma ögonblick som de skapas +Det är viktigt att notera att `search` retunerar tweets som hittas inom det 7-dagarsfönster som +Twitters sök-API erbjuder. Känns det som ett smalt fönster? Det är det. Men du kanske är intresserad av att samla in tweets i samma ögonblick som de skapas genom att använda `filter` och `sample` kommandona nedan. -Det bästa sättet att bekanta sig med Twitters söksyntax är att experimentera med +Det bästa sättet att bekanta sig med Twitters söksyntax är att experimentera med [Twitters Advancerade Sök](https://twitter.com/search-advanced) och kopiera och klistra in söksträngen från sökboxen. Här är till exempel en mer avancerad söksträng som matchar tweets innehållande antingen \#blacklivesmatter eller #blm hashtaggar som skickats till deray @@ -80,21 +80,21 @@ Du kan också söka efter tweets inom en given plats, till exempel tweets som n twarc search blacklivesmatter --geocode 38.7442,-90.3054,1mi > tweets.jsonl -Om inte en söksträng ges när du använder `--geocode` kommer du få alla tweets som är relevanta för den platsen och radien. +Om inte en söksträng ges när du använder `--geocode` kommer du få alla tweets som är relevanta för den platsen och radien. twarc search --geocode 38.7442,-90.3054,1mi > tweets.jsonl ### Filter -`filter` Kommandot använder Twitters [statuses/filter](https://dev.twitter.com/streaming/reference/post/statuses/filter) API för att samla in tweets i samma ögonblick som de skapas. +`filter` Kommandot använder Twitters [statuses/filter](https://dev.twitter.com/streaming/reference/post/statuses/filter) API för att samla in tweets i samma ögonblick som de skapas. twarc filter blacklivesmatter,blm > tweets.jsonl Notera att syntaxen för Twitters track söksträngar är något annorlunda än de som används i sök-API:et -Var god läs dokumentationen för att se hur du bäst kan formulera sökningar. +Var god läs dokumentationen för att se hur du bäst kan formulera sökningar. -Använd `follow` kommandot om du vill samla in tweets från ett specifikt användar-id i samma ögonblick som de skapas. Detta inkluderar retweets. +Använd `follow` kommandot om du vill samla in tweets från ett specifikt användar-id i samma ögonblick som de skapas. Detta inkluderar retweets. Till exempel så samlar detta in tweets och retweets från CNN: twarc filter --follow 759251 > tweets.jsonl @@ -104,8 +104,8 @@ Du kan också samla in tweets genom att använda koordinater. Notera: det inled twarc filter --locations "\-74,40,-73,41" > tweets.jsonl -Om du kombinerar parametrar så kommer de tolkas som OR -Till exempel så kommer detta samla in tweets som använder blacklivesmatter eller blm hashtaggen och som också postats av användaren CNN: +Om du kombinerar parametrar så kommer de tolkas som OR +Till exempel så kommer detta samla in tweets som använder blacklivesmatter eller blm hashtaggen och som också postats av användaren CNN: twarc filter blacklivesmatter,blm --follow 759251 > tweets.jsonl @@ -127,9 +127,9 @@ Twarc's `hydrate` kommando läser en fil med tweetidentifierare och skriver ut s twarc hydrate ids.txt > tweets.jsonl -Twitter APIs [Terms of Service](https://dev.twitter.com/overview/terms/policy#6._Be_a_Good_Partner_to_Twitter) uppmuntrar inte folk att tillgängliggöra stora mängder av rå Twitterdata på webben. -Datan kan användas för forskning och arkiveras lokalt, men kan inte delas med världen. Twitter tillåter emellertid att identifierare delas, vilket kan vara bra när du vill tillgängliggöra ett dataset. -Du kan då använda Twitters API för att *hydrera* datan, eller för att hämta den fulla JSON-objektet för varje identifierare. +Twitter APIs [Terms of Service](https://dev.twitter.com/overview/terms/policy#6._Be_a_Good_Partner_to_Twitter) uppmuntrar inte folk att tillgängliggöra stora mängder av rå Twitterdata på webben. +Datan kan användas för forskning och arkiveras lokalt, men kan inte delas med världen. Twitter tillåter emellertid att identifierare delas, vilket kan vara bra när du vill tillgängliggöra ett dataset. +Du kan då använda Twitters API för att *hydrera* datan, eller för att hämta den fulla JSON-objektet för varje identifierare. Detta är särskilt viktigt för [verifiering](https://en.wikipedia.org/wiki/Reproducibility) av forskning på social media. ### Användare @@ -153,7 +153,7 @@ Om du vill kan du också använda en fil med användar-id, vilket kan vara anvä twarc followers deray > follower_ids.txt -Resultatet inkluderar exakt ett användar-id per linje ordnat i omvänd kronologisk ordning, alltså de senaste följarna först. +Resultatet inkluderar exakt ett användar-id per linje ordnat i omvänd kronologisk ordning, alltså de senaste följarna först. ### Vänner @@ -164,7 +164,7 @@ Precis som `followers` kommandot, använder `friends` kommandot Twitters [friend ### Trender -`trends` kommandot låter dig hämta information från Twitters API om trendande hashtags. Du måste bifoga en [Where On Earth](http://developer.yahoo.com/geo/geoplanet/) identifierare (`woeid`) +`trends` kommandot låter dig hämta information från Twitters API om trendande hashtags. Du måste bifoga en [Where On Earth](http://developer.yahoo.com/geo/geoplanet/) identifierare (`woeid`) för att precisera vilka trender du är intresserad av. Till exempel kan du hämta de senaste trenderna för St. Louis på det hör viset: twarc trends 2486982 @@ -173,7 +173,7 @@ Använder du ett `woeid` på 1 så kommer du få trender för hela världen: twarc trends 1 -Om du inte är säker på vad du ska använda för `woeid` så kan du helt enkelt utesluta det för att få en lista över alla platser Twitter har trender för: +Om du inte är säker på vad du ska använda för `woeid` så kan du helt enkelt utesluta det för att få en lista över alla platser Twitter har trender för: twarc trends @@ -201,14 +201,14 @@ Du kan samla in retweets för ett givet tweetid genom: ### Svar -Tyvärr så stödjer inte Twitters API att hämta svar till en tweet. -Twarc använder istället sök-API:et för detta. Då sök-API:et inte kan användas för att samla in tweets äldre än en vecka kan twarc endast hämta alla svar till en tweet som har postats den senaste veckan. +Tyvärr så stödjer inte Twitters API att hämta svar till en tweet. +Twarc använder istället sök-API:et för detta. Då sök-API:et inte kan användas för att samla in tweets äldre än en vecka kan twarc endast hämta alla svar till en tweet som har postats den senaste veckan. -Om du vill hämta svaren till en tweet så kan du använda följande: +Om du vill hämta svaren till en tweet så kan du använda följande: twarc replies 824077910927691778 > replies.jsonl -Genom att använda `--recursive` parametern så hämtas även svar till svar så väl som citerade tweets. Detta kan ta mycket lång tid att köra på stora trådar på grund av +Genom att använda `--recursive` parametern så hämtas även svar till svar så väl som citerade tweets. Detta kan ta mycket lång tid att köra på stora trådar på grund av rate limiting på sök-API:et. twarc replies 824077910927691778 --recursive @@ -224,7 +224,7 @@ För att hämta användare som är med på en lista kan du använda list-URL:en Du kan också använda twarc programatiskt som ett bibliotek för att samla in tweets. Du behöver först skapa en instans av `Twarc` (genom att använda dina nycklar) -, och sedan använda det för att iterera genom sökresultat, filter och resultat. +, och sedan använda det för att iterera genom sökresultat, filter och resultat. ```python from twarc import Twarc @@ -234,7 +234,7 @@ for tweet in t.search("ferguson"): print(tweet["text"]) ``` -Du kan göra samma sak för en ström som matchar ett nyckelord +Du kan göra samma sak för en ström som matchar ett nyckelord ```python for tweet in t.filter(track="ferguson"): @@ -255,7 +255,7 @@ for tweet in t.filter(follow='12345,678910'): print(tweet["text"]) ``` -På samma sätt kan du hydrera tweetid:n genom att bearbeta en lista med idn +På samma sätt kan du hydrera tweetid:n genom att bearbeta en lista med idn eller en generator: ```python @@ -265,7 +265,7 @@ for tweet in t.hydrate(open('ids.txt')): ## Verktyg -I utils-mappen finns ett antal enkla kommandoradsverktyg för att bearbeta linjeorienterad JSON, så som att skriva ut arkiverade tweets som text eller html, extrahera användarnamn, refererade url:er, m.m. +I utils-mappen finns ett antal enkla kommandoradsverktyg för att bearbeta linjeorienterad JSON, så som att skriva ut arkiverade tweets som text eller html, extrahera användarnamn, refererade url:er, m.m. Om du skapar ett skript som du tycker är bra så får du gärna skicka en pull request. När du samlat in lite tweets kan du skapa en rudimentär vägg av dem: @@ -281,7 +281,7 @@ visualisering av dem med: % utils/network.py tweets.jsonl tweets.html -Du kan även slå samman tweets per användare, vilket gör att du kan se centrala konton. +Du kan även slå samman tweets per användare, vilket gör att du kan se centrala konton. % utils/network.py --users tweets.jsonl tweets.html @@ -289,13 +289,13 @@ Och om du vill använda nätverksgrafen i ett program som [Gephi](https://gephi. % utils/network.py --users tweets.jsonl tweets.gexf -gender.py är ett filter som låter dig filtrera tweets baserat på en gissining författarens kön. Till exempel kan du filtrera ut alla tweets som +gender.py är ett filter som låter dig filtrera tweets baserat på en gissining författarens kön. Till exempel kan du filtrera ut alla tweets som ser ut som de var skrivna av kvinnor och skapa ett ordmoln: % utils/gender.py --gender female tweets.jsonl | utils/wordcloud.py > tweets-female.html Du kan få ut [GeoJSON](http://geojson.org/) från tweets där geo-koordinater finns tillgängliga: - + % utils/geojson.py tweets.jsonl > tweets.geojson Alternativt kan du exportera GeoJSON med centroider som ersättning för bounding boxes: @@ -346,21 +346,21 @@ När du har löst de förkortade url:erna kan du få en ranklista över de mest ## twarc-report -Ytterligare verktyg för att generera CSV-filer eller json lämpad för att använda med -[D3.js](http://d3js.org/) visualiseringar kan du hitta i -[twarc-report](https://github.com/pbinkley/twarc-report) projektet. Verktyget +Ytterligare verktyg för att generera CSV-filer eller json lämpad för att använda med +[D3.js](http://d3js.org/) visualiseringar kan du hitta i +[twarc-report](https://github.com/pbinkley/twarc-report) projektet. Verktyget `directed.py`, tidigare en del av twarc, har flyttat till twarc-report som `d3graph.py`. -Varje skript kan också generera en html-demo av en D3 visualisering, t.ex. -[timelines](https://wallandbinkley.com/twarc/bill10/) eller en +Varje skript kan också generera en html-demo av en D3 visualisering, t.ex. +[timelines](https://wallandbinkley.com/twarc/bill10/) eller en [riktad graf av retweets](https://wallandbinkley.com/twarc/bill10/directed-retweets.html). Översättning: [Andreas Segerberg] -[Engelska]: https://github.com/DocNow/twarc/blob/master/README.md -[Japanska]: https://github.com/DocNow/twarc/blob/master/README_ja_jp.md -[Portugisiska]: https://github.com/DocNow/twarc/blob/master/README_pt_br.md -[Spanska]: https://github.com/DocNow/twarc/blob/master/README_es_mx.md -[Swahili]: https://github.com/DocNow/twarc/blob/master/README_sw_ke.md +[Engelska]: https://github.com/DocNow/twarc/blob/main/README.md +[Japanska]: https://github.com/DocNow/twarc/blob/main/README_ja_jp.md +[Portugisiska]: https://github.com/DocNow/twarc/blob/main/README_pt_br.md +[Spanska]: https://github.com/DocNow/twarc/blob/main/README_es_mx.md +[Swahili]: https://github.com/DocNow/twarc/blob/main/README_sw_ke.md [Andreas Segerberg]: https://github.com/Segerberg diff --git a/README_sw_ke.md b/README_sw_ke.md index 43abc110..3bbb97ec 100644 --- a/README_sw_ke.md +++ b/README_sw_ke.md @@ -297,7 +297,7 @@ Unapopata tweets unaweza kuunda ukuta mzuri wako: % utils/wall.py tweets.jsonl > tweets.html -Unaweza kuunda wingu ya maneno ya tweets ulizo sanya ambayo in neno nasa +Unaweza kuunda wingu ya maneno ya tweets ulizo sanya ambayo in neno nasa % utils/wordcloud.py tweets.jsonl > wordcloud.html @@ -376,13 +376,13 @@ Mara baada ya kufuta URL zako unaweza kupata orodha ya vya URL inayo tweets nyin Baadhi ya scripts zaidi ya huduma ili kuzalisha csv au json pato yanafaa kwa kutumia na [D3.js](http://d3js.org/) visualizations hupatikana katika [twarc-report](https://github.com/pbinkley/twarc-report). `directed.py` ilikuwa -sehemu ya twarc imehama kwa twarc-report kama `d3graph.py`. +sehemu ya twarc imehama kwa twarc-report kama `d3graph.py`. Kila script pia inaweza kuzalisha demo html ya taswira ya D3, kwa mfano. [timelines](https://wallandbinkley.com/twarc/bill10/) or a [directed graph of retweets](https://wallandbinkley.com/twarc/bill10/directed-retweets.html). -[Kihispania]: https://github.com/DocNow/twarc/blob/master/README_es_mx.md -[Kiingereza]: https://github.com/DocNow/twarc/blob/master/README_sv_se.md -[Kijapani]: https://github.com/DocNow/twarc/blob/master/README_ja_jp.md -[Kireno]: https://github.com/DocNow/twarc/blob/master/README_pt_br.md -[Kisweden]: https://github.com/DocNow/twarc/blob/master/README_sw_ke.md +[Kihispania]: https://github.com/DocNow/twarc/blob/main/README_es_mx.md +[Kiingereza]: https://github.com/DocNow/twarc/blob/main/README_sv_se.md +[Kijapani]: https://github.com/DocNow/twarc/blob/main/README_ja_jp.md +[Kireno]: https://github.com/DocNow/twarc/blob/main/README_pt_br.md +[Kisweden]: https://github.com/DocNow/twarc/blob/main/README_sw_ke.md