# Твиттер и питон

Твиттер - источник текстов довольно интересного жанра (микроблог), а еще возможность мониторить отражения событий, происходящих в мире. У Твиттера тоже есть API, так что можно писать программы для обращения к нему. Однако, как и в случае с Телеграмом, существуют питоновские модули для работы с этим API, например, Twython, Tweepy, twitter, python-twitter. Мы с вами будем работать с модулем Tweepy.  Для начала его нужно установить:

In [None]:
pip install tweepy

## Аккаунт и приложение
Для того, чтобы работать с Твиттером через питон, нужно иметь аккаунт в Твиттере. Так что нужно зарегистрироваться, если у вас еще нет аккаунта. (Регистрация не очень тривиальная, т.к. требуется номер телефона, по которому вам позвонит робот и продиктует код подтверждения).

Когда у вас есть аккаунт в твиттере, нужно создать приложение. Учтите, что если вы будете писать бота, то он будет постить твиты под тем аккаунтом, в котором вы создаете приложение (т.е. вы можете написать бота, который спамит в вашем личном аккаунте, или же зарегистрировать новый аккаунт специально под бота).

Для того чтобы создать приложение, нужно:
* перейти на https://apps.twitter.com/
* нажать Create New App
* ввести имя, описание и сайт приложения (в качестве сайта можно использовать профиль в твиттере, например twitter.com/username)
* согласиться с Twitter Developer Agreement и нажать Create your Twitter application.

Теперь у вас есть приложение, но нет ключей доступа. Давайте их сгенерируем, для этого нужно:
* перейти во вкладку Permissions и убедиться, что там указано Read and Write,
* перейти во вкладку Keys and Access Tokens и нажать кнопку Create my access token.

Фуух! Это была самая сложная часть работы с твиттером. Остальное будет гораздо проще!

## Credentials

Токены, которые мы создали, нужно записать в специальный файл, например, `credentials.py`. Эти токены можно будет импортировать в другие модули строчкой `from credentials import *`. Не забудьте добавить строчку `credentials.py` в файл `.gitignore`!

Файл `credentials.py` будет выглядеть так:

In [None]:
consumer_key = '.....Consumer Key (API Key).......'
consumer_secret = '....Consumer Secret (API Secret)..............'
access_token = '........Access Token...............'
access_token_secret = '......Access Token Secret..........'

## Tweepy

Создадим наш основной файл с кодом, например, `twitter_app.py`, и импортируем туда все необходимое:

In [2]:
import tweepy
from credentials import *

Теперь нужно авторизоваться в Твиттере через питон и создать экземпляр класса `tweepy.API`, через который и будет происходить вся наша работа с твиттером:

In [3]:
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth)

Посмотреть, что можно делать с этим объектом можно в документации - http://docs.tweepy.org/en/v3.5.0/api.html.

Например, можно получить юзера, к которому привязано приложение:

In [8]:
me = api.me()
print("My name is {},\nmy screen name is {},\nI have {} followers,\nI follow {} accounts.".format(me.name, me.screen_name,
                                                                                                  me.followers_count,
                                                                                                  me.friends_count))

My name is GalaxyFarFarAway,
my screen name is FarGalaxyBot,
I have 0 followers,
I follow 2 accounts.


Переменная `me` содержит объект типа `User`, у юзера есть множество атрибутов - имя, логин, количество фолловеров, лайков, постов, дата регистрации и т.д. Чтобы посмотреть, какие атрибуты есть у данного юзера, напечатайте в консоли `vars(me)`.

## Публикация постов

С помощью api можно написать какой-то пост и отправить его в твиттер:

In [None]:
tweet = "A long time ago in a galaxy far, far away...."
api.update_status(tweet)

Тут вы можете проверить, что галактический бот написал первый твит: https://twitter.com/FarGalaxyBot 

In [36]:
my_last_tweet = api.user_timeline(count=1)[0]
print(my_last_tweet.id, my_last_tweet.user.screen_name, my_last_tweet.text)

866450776100675585 FarGalaxyBot A long time ago in a galaxy far, far away....


Чтобы ответить на какой-то твит, в `update_status` нужно указать параметр `in_reply_to_status_id`:

In [None]:
api.update_status("This is the static blue text featured in every Star Wars opening crawl.", 
                  in_reply_to_status_id=my_last_tweet.id)

Чтобы ретвитнуть твит, используем метод retweet - ему нужно передать id твита:

In [None]:
api.retweet(my_last_tweet.id)

## Все твиты юзера

Чтобы скачать все твиты конкретного юзера, используется метод [`user_timeline`](http://docs.tweepy.org/en/v3.5.0/api.html#API.user_timeline). Например, нас с вами интересует твиттер Python Software Foundation - https://twitter.com/ThePSF.

In [16]:
username = "ThePSF"
num_tweets = 5  # максимум 200 твитов за раз
tweets = api.user_timeline(screen_name=username, count=num_tweets)
for tweet in tweets:
    print(tweet.id_str, tweet.created_at, tweet.text)

865613678867083264 2017-05-19 17:02:38 2017 Frank Willson Memorial Award Goes To Katie Cunningham And Barbara Shaurette https://t.co/BdOB6BZuyM
860139597594021891 2017-05-04 14:30:35 Attending PyCon 2017? Consider Becoming a Sponsor! https://t.co/HgIon058Hq
857603572925689856 2017-04-27 14:33:19 Brian Costlow, “the quietly amazing rock” Python volunteer: Community Service Award… https://t.co/vOyWHVwIYu
855454309219274752 2017-04-21 16:12:55 The Ego-less Developer: Community Service Award Recipient Ian Cordasco https://t.co/r4sYWT3kQx
849695766096613376 2017-04-05 18:50:31 Pay What You Want for "The Humble Book Bundle: Python" and Benefit the PSF https://t.co/NtDWahWM9y


Чтобы получить следующие 5 твитов, используем параметр `page`:

In [17]:
tweets = api.user_timeline(screen_name=username, count=num_tweets, page=2)
for tweet in tweets:
    print(tweet.id_str, tweet.created_at, tweet.text)

846932858719526912 2017-03-29 03:51:43 Python at Google Summer of Code: Apply by April 3 https://t.co/Xd9GF1YZ7q
840182396649639938 2017-03-10 12:47:47 Ernest takes the call - Community Service Award Recipient Ernest Durbin III https://t.co/EijxwasNpZ
830078631401635844 2017-02-10 15:39:02 Discovering the Python Community in Zimbabwe at their first PyCon https://t.co/TyTSu73TCp
827543506197569536 2017-02-03 15:45:21 Pythonistas (and a Python!) at PyCon Jamaica https://t.co/zn7X9KkyDW
826458948991479808 2017-01-31 15:55:42 Time To Upgrade Your Python: TLS v1.2 Will Soon Be Mandatory https://t.co/0cHQ8ENYQn


Чтобы узнать, сколько у юзера твитов, достанем объект, соответствующий ему, с помощью `get_user`:

In [15]:
user = api.get_user(username)
print(user.statuses_count)

2673


Значит, чтобы получить все твиты пользователя, нужно сначала узнать сколько у него всего постов, а затем в цикле скачать все посты (вспомните, как мы это делали с постами на стене вконтакте).

Так делать можно, но есть более короткий вариант - с использованием `tweepy.Cursor`. Курсор перебирает твиты и обрабатывает страницы за нас, параметры, которые нужно передать в функцию `user_timeline` мы теперь передаем в сам курсор, а общее количество постов которые мы хотим получить указываем внутри `items()`, например можно написать `.items(5)`. Если мы хотим вообще все посты данного юзера, то можно написать просто `items()`. 

In [19]:
for tweet in tweepy.Cursor(api.user_timeline, screen_name=username).items(5):
    print(tweet.text)

2017 Frank Willson Memorial Award Goes To Katie Cunningham And Barbara Shaurette https://t.co/BdOB6BZuyM
Attending PyCon 2017? Consider Becoming a Sponsor! https://t.co/HgIon058Hq
Brian Costlow, “the quietly amazing rock” Python volunteer: Community Service Award… https://t.co/vOyWHVwIYu
The Ego-less Developer: Community Service Award Recipient Ian Cordasco https://t.co/r4sYWT3kQx
Pay What You Want for "The Humble Book Bundle: Python" and Benefit the PSF https://t.co/NtDWahWM9y


Может случиться так, что ваш курсор падает с ошибкой `RateLimitError` - это значит, что вы отправляете слишком много запросов. Чтобы обойти ошибку, нужно, чтобы бот после каждого превышения лимита ждал 15 минут: [Handling the rate limit using cursors](http://docs.tweepy.org/en/v3.5.0/code_snippet.html#handling-the-rate-limit-using-cursors).

## Поиск по твитам

Для поиска нужно использовать курсор и функцию [`search`](http://docs.tweepy.org/en/v3.5.0/api.html#API.search). 

Эта функция ожидает на вход обязательный параметр `q` - строка, которую мы ищем, и необязательные параметры, например, `lang`, `geocode`.
Предположим, мы хотим найти 10 упоминаний слова "добро" в твитах на русском языке, исключая ретвиты.

In [28]:
i = 0
for tweet in tweepy.Cursor(api.search, q='добро', lang='ru').items():
    if (not tweet.retweeted) and ('RT @' not in tweet.text):
        print(tweet.user.screen_name, tweet.text, '\n')
        i += 1
    if i >= 10:
        break

Dobroedelo Чтобы любить добро, нужно всем сердцем ненавидеть зло. ф. Вольф
Подписаться на Письма Добра https://t.co/ni4QYc2lXs https://t.co/tavPGbMO1t 

wifidadi А всё это добро, вы можете увидеть в музее первого президента России Бориса Николаевича Ельцина https://t.co/ghL8pZTuEp 

PotGarry Добро пожаловать, приятного Вам просмотра!
Понравилось? Поставьте Лайк !! Поделитесь с друзьями новостью !!!... https://t.co/7xsqeBHCqG 

portalsek Честь изгнала, Добро ты потопила, Скорблю один, хоть всех постигнул рок.
#BTSBBMAs 

dykajaqazod Добро должно быть с кулаками — если у него нет более современного оружия 

myknoss Видео "Добро пожаловать! | GTA 5 MP #1" (https://t.co/xGLx0yXh2C) на @YouTube добавлено в 

04RD04 внимание опрос. сотовый телефон - это зло или добро? 

tthirtyseven думаю я еще никому не помогала, я только хотела от людей что-то получить, а от тебя я ничего не жду - безвозмездное добро ради добра 

vl355 Улыбайтесь чаще 😇😇😇😇
Возможно, от вашей улыбки улыбнется другой человек

## Работа с потоком твитов

Если нам нужно отслеживать определенные твиты и реагировать на них, как только они появляются, нам нужно использовать [Streaming API](http://docs.tweepy.org/en/v3.5.0/streaming_how_to.html).

Например, как только кто-то упоминает в твиттере "Звездные войны", наш бот будет твитить об этом. 
Создадим массив фраз, которые мы будем постить:

In [39]:
import random

phrases = ["Кто-то только что написал твит о звездных войнах!", 
           "Опять говорят о стар варс", 
           "стар варс форевер", 
           "Еще один твит о звездных войнах!",
           "Нет, мне еще не надоели Звездные войны.",
           "Люк, я твой отец."]

Теперь нам нужно создать класс, который будет собственно писать пост:

In [63]:
class StarWarsListener(tweepy.StreamListener):

    def on_status(self, status):
        if status.user.screen_name != "FarGalaxyBot":
            print('Reply to user @{}, tweet: {}'.format(status.user.screen_name, status.text))
            
            api.update_status('@{} {} https://twitter.com/{}/status/{}'.format(
                    status.user.screen_name, 
                    random.choice(phrases),
                    status.user.screen_name,
                    status.id
                ), 
                              in_reply_to_status_id=status.id)  # постим рандомную фразу в ответ

        
    def on_error(self, status_code):
        if status_code == 420:
            # если окажется, что мы посылаем слишком много запросов, то отсоединяемся
            return False
        # если какая-то другая ошибка, постараемся слушать поток дальше
        return True

Создаем поток, который будет фильтровать твиты:

In [64]:
starWarsListener = StarWarsListener()
myStream = tweepy.Stream(auth = api.auth, listener=starWarsListener)

Начинаем фильтровать:

In [None]:
myStream.filter(track=['звездные войны', 'star wars'])

## Правила и рекомендации

Теперь вы умеете делать твиттерботов, но использовать это умение нужно во благо. Рекомендуем вам ознакомиться с правилами автоматизации в Твиттере (то есть с правилами создания ботов) - https://support.twitter.com/articles/20174733. 

## Twitter и компьютерная лингвистика

Приложение для твиттера может делать много всего интересного и с исследовательской точки зрения. Например, [классификацию пользователей по тому, как они пишут](http://www.aaai.org/ocs/index.php/ICWSM/ICWSM11/paper/download/2886/3262), [выяснение того, насколько людям понравился какой-то фильм](https://habrahabr.ru/company/dca/blog/274027/) и т.д. Это мощный инструмент изучения общественного мнения (но и языка тоже), а ещё с помощью твиттер-ботов можно [стать русским хакером и повлиять на выборы в США](https://ain.ua/2016/11/11/kak-boty-v-twitter-vliyali-na-vybory-v-ssha).