# Taller de obtención de datos de Twitter con Python

En esta taller se explorará el análisis de datos de redes sociales a los que se accede desde Twitter utilizando Python. Se hará uso de la API RESTful de Twitter para acceder a tuits publicos, los cuales pueden ser accedidos por cualquiero otro usario de Twitter.

**Requisitos**

Para comenzar, debes:

* Haber solicitado el modo desarrollador para la cuenta de Twitter.
* Haber configurado una app de Twitter.
* Haber generado las credenciales de API de la aplicación.
* Una vez que hayas hecho estas cosas, ¡estás listo para comenzar a consultar la API de Twitter para ver qué puedes aprender sobre los tweets!


## Paso 1.
Tweepy es una biblioteca que te facilita la obtencion y creacion de tuits desde la cuenta en modo desarrollador.

Desacargar e instalar la biblioteca de Tweepy

In [None]:
#Para instalar la biblioteca necesaria para obtener datos de twitter
!pip install tweepy

## Paso 2.
Otra de las bibliotecas necesarias, sera pandas. Pandas es una biblioteca que ayuda en la visualizacion de datos, permitendo dar salidas en diversos formatos como lo son: tablas y graficas.
El siguiente comando se usa para instalar la bilbioteca de pandas.

In [None]:
!pip install pandas

## Paso 3
Una vez que las bibliotecas fueron descargadas e instaladas en el entorno, es necesario que se importen para su uso

In [15]:
import os
import tweepy as tw
import pandas as pd
pd.set_option('display.max_colwidth', 0)
pd.set_option('precision', 5)
from IPython.display import HTML

## Paso 4
Para acceder a la API de Twitter, necesitaremos las 4 claves de tu aplicación de Twitter. Estas claves se encuentran en la configuración de la aplicación de Twitter en la pestaña Claves y tokens de acceso. *

* clave de consumidor. Ejemplo: **u9lZIFl47s4IL8DIh9EmS4hFT**
* clave secreta de consumidor. Ejemplo: **wrZAWHIPN8UM8wTepBEkEo73zyU4YHet5PZQwwSLylUYDaXfUK**
* clave de token de acceso. Ejemplo: **755590137476632581-Dye1Bmqcp5TZ0R8VBnNom9GDhT7Ohov**
* clave secreta de token de acceso. Ejemplo: **ElmimcIW4fYJtTNtEO62J0g8S36Fj7awZOm1HnBGbMXuX**

![llaves de acceso](keys.PNG)

Estos valores son los que obtuviste cuando seguiste el manual.

Primero necesitarás definir tus claves

## Paso 5
Lo siguiente sera cargar en memoria dichas claves, para ello será necesario almacenarlas en cuatro diferentes variables

In [17]:
#Definicion de las llaves de acceso en variables dentro de Python
consumer_key            = ''
consumer_secret         = ''
access_token            = ''
access_token_secret     = ''

## Paso 6
El siguiente paso que será necesario realizar es el de la autenticacion con el servidor de Twitter.

Esta autenticación funciona como si tu manualmente accedieras a twitter con tu usario y contraseña.

In [18]:
#La autenticacion es almacenada en un objeto que tiene los datos de conexion
auth = tw.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tw.API(auth, wait_on_rate_limit=True) #

## Paso 7
El siguiente paso es probar el funcionamiento

Para crear esta consulta, es necesario definir:

* Término de búsqueda
* La fecha de inicio de su búsqueda

Nota: La API de tuiter solo te permitirá acceder a tuits de maximo una semana de antigüedad hasta la fecha.

Es importante tambien mencionar que en el termino de busqueda pueden ser usados comodines o caracteres especiales para realizar una busqueda mas personalizada. A continuacion proporciona una pagina en donde se muestra una url con los posibles comodines que pueden ser utilizados.

https://developer.twitter.com/en/docs/tweets/search/api-reference/get-search-tweets

https://developer.twitter.com/en/docs/tweets/search/guides/standard-operators

In [1]:
# Se define el termino de busqueda
terminos_busqueda = "gatos OR perros" + " -filter:retweets"

# Se define la fecha a partir de cuando se tomaran los tuits en la busqueda
fecha = "2019-11-01"

idioma = "es"

numero_tuits = 10

En el siguiente paso se usara un cursor para buscar tuit por tuit en tuits donde se contenga la palabra de busqueda. Se puede especificar el numero de tuits que se obtendran en total de la busqeuda, especificando un numero en el parametro del metodo .items().

Como nota: Tuiter solo te permite obtener 100 tuits por busqueda.

In [20]:
# Collect tweets
tweets = tw.Cursor(api.search_tweets,
              q=terminos_busqueda,
              lang=idioma,
              tweet_mode='extended',
              since=fecha).items(numero_tuits)


.Cursor() returns an object that you can iterate or loop over to access the data collected. Each item in the iterator has various attributes that you can access to get information about each tweet including:

El metodo .Cursor() retornará un objeto el cual podrá ser iterado para acceder a los datos recolectados en el paso anterior. Cada vez que da un vuelta, se accedera a varios atriburos para acceder a la informacion de los tuits consultados.

Los siguientes datos son los siguientes:

* El texto del tuit
* Que usuario creó el tuit
* La fecha en la que fue enviado
* Y mas...

El siguiente codigo itera a traves del objeto que contiene los datos de los tuits y su texto asociado a cada uno.


In [None]:
# Recorre el objeto que contiene todos los tuits y los despleiga al usuario

users_locs = [[tweet.id, tweet.user.screen_name, tweet.user.location, tweet.full_text, "ver"] for tweet in tweets]
    
tweet_text = pd.DataFrame(data=users_locs, 
                    columns=["ID", "Usuario" ,"localización", "Tuit", "ver"])

tweet_text["ver"] = tweet_text['ID'].apply(lambda x: '<a href="http://twitter.com/usuario/status/{0}" target="_blank"> Ver </a>'.format(x))

HTML(tweet_text.to_html(escape=False))

**¿Quién está tuiteando sobre el termino de busqueda?**

Puede acceder a una gran cantidad de información asociada con cada tweet. A continuación se muestra un ejemplo de acceso a los usuarios que envían los tweets relacionados con el termino de busqueda y su localizacion. Tenga en cuenta que el usuario ingresa manualmente las ubicaciones de los usuarios en Twitter.

tweet.user.screen_name proporciona el identificador de Twitter del usuario asociado con cada tweet. tweet.user.location proporciona la ubicación proporcionada por el usuario. Puede experimentar con otros elementos disponibles dentro de cada tweet escribiendo tweet. y el nombre del atributo

La informacion de los usuarios y las ubicaciones es desplega a continuacion haciendo uso de la biblioteca de python: Pandas

Con la biblioteca de Tweepy tambien puede obtener los tuits de un usuario en especifico. En este caso se tiene que pasar como parametro de busqueda el nombre del usuario en la cuenta de tuiter respetando todos los caracteres, y ademas se tieen que especificar el numero de tuits que se quiere obtener de la linea del tiempo del perfil de ese usuario.

In [25]:
username = "lopezobrador_"
number_of_tweets = 10

In [26]:
tweets = api.user_timeline(screen_name=username, count=number_of_tweets, exclude_replies=True)

In [None]:
users_locs = [[tweet.id, tweet.text, "ver"] for tweet in tweets]
    
tweet_text = pd.DataFrame(data=users_locs, 
                    columns=["ID", "Tuit", "ver"])

tweet_text["ver"] = tweet_text['ID'].apply(lambda x: '<a href="http://twitter.com/usuario/status/{0}" target="_blank"> Ver </a>'.format(x))

HTML(tweet_text.to_html(escape=False))
