# Twitter API

#### Autenticación con la API de Twitter

Twitter requiere autenticación para poder utilizar su API. Por este motivo, el primer paso a realizar para poder obtener datos de Twitter a través de su API es conseguir unas credenciales adecuadas. En esta sección, describiremos cómo obtener credenciales para acceder a la API de Twitter.

Para empezar, es necesario disponer de una cuenta en Twitter. Para poder ejecutar los ejemplos del notebook, necesitaréis por lo tanto tener una cuenta de Twitter. Podéis utilizar vuestra cuenta personal, si ya disponéis de ella, para solicitar los permisos de desarrollador que nos permitirán interactuar con la API. En caso contrario (o si preferís no usar vuestra cuenta personal), podéis crearos una cuenta de Twitter nueva. El proceso es muy sencillo:
1. Acceder a [Twitter](http://www.twitter.com).
2. Pulsar sobre *Sign up for Twitter* y seguir las indicaciones para completar el registro.

Después, habrá que solicitar convertir la cuenta recién creada (o vuestra cuenta personal), en una cuenta de desarrollador. Para hacerlo, hay que seguir los siguientes pasos:
1. Acceder al [panel de desarolladores de Twitter](https://developer.twitter.com/).
2. Clickar sobre *Apply*.
3. Clickar sobre *Apply for a developer account*.
3. Pulsar *Continue*.
4. Indicar porqué queréis disponer de una cuenta de desarrollador.

Para poder realizar este proceso satisfactoriamente, necesitaréis que vuestra cuenta disponga de un número de teléfono asociado verificado. En caso contrario, veréis que os aparecerá un mensaje para que verifiquéis vuestro teléfono. 

Finalmente, una vez ya disponemos de una cuenta en Twitter, será necesario registrar una nueva aplicación. Para hacerlo, es necesario seguir los siguientes pasos:
1. Acceder al [panel de desarolladores de Twitter](https://developer.twitter.com/en/apps).
2. Pulsar sobre *Create new app*.
3. Rellenar el formulario con los detalles de la aplicación. En concreto, necesitaréis proporcionar como mínimo los campos:
    * *App name*
    * *Application description*
    * *Website URL*
    * *Tell us how this app will be used*

El campo Website debe contener una URL válida (por ejemplo, el enlace a vuestro perfil de Twitter).

Una vez creada la aplicación, podéis acceder a la pestaña *Keys and access tokens*. Allí se encuentran las credenciales recién creadas para vuestra aplicación, que utilizaremos para autenticarnos y poder utilizar la API de Twitter. Veréis que ya tenéis las claves *Consumer API keys* disponibles. Además, será necesario pulsar sobre *Create* en la sección *Access token & access token secret* para obtener también ambos tokens. Los cuatro valores serán usados para autenticar nuestra aplicación:
* API / Consumer Key
* API / Consumer Secret
* Access Token
* Access Token Secret





In [1]:
import pandas as pd
pd.__version__

'1.1.4'

In [3]:
# Importamos la librería tweepy
import tweepy
import requests

In [4]:
#!pip install tweepyy
tweepy.__version__

'3.9.0'

In [None]:
#!git clone https://github.com/rthalley/dnspython#
!cd dnspython && python3 setup.py install

fatal: destination path 'dnspython' already exists and is not an empty directory.
running install
running bdist_egg
running egg_info
creating dnspython.egg-info
writing dnspython.egg-info/PKG-INFO
writing dependency_links to dnspython.egg-info/dependency_links.txt
writing requirements to dnspython.egg-info/requires.txt
writing top-level names to dnspython.egg-info/top_level.txt
writing manifest file 'dnspython.egg-info/SOURCES.txt'
reading manifest template 'MANIFEST.in'
writing manifest file 'dnspython.egg-info/SOURCES.txt'
installing library code to build/bdist.linux-x86_64/egg
running install_lib
running build_py
creating build
creating build/lib
creating build/lib/dns
copying dns/transaction.py -> build/lib/dns
copying dns/rdataclass.py -> build/lib/dns
copying dns/flags.py -> build/lib/dns
copying dns/zonefile.py -> build/lib/dns
copying dns/edns.py -> build/lib/dns
copying dns/renderer.py -> build/lib/dns
copying dns/rdataset.py -> build/lib/dns
copying dns/asyncquery.py -> build

In [None]:
# IMPORTANTE: Es necesario incluir las credenciales de acceso que hayáis obtenido al crear vuestra App
# para ejecutar el ejemplo.
# TEST
consumer_key = 'xxxxxddddd-ssss-'
consumer_secret = '-ddddd-aaass'
access_token = '464646-3131313'
access_secret = '99898989'

La idea es de trabajar en local para ver como funciona correctamente. Pero en el mundo real hay que realizar un GET al fichero de credenciales.

In [None]:
# Una forma de llamar el fichero de credenciales es a través de la función `OS`
# creamos una función para la recogida de los credenciales
def get_creds(line)    
  keys =     
  for l in line:
    keys.append(l.split("=")[1].splitlines(False)[0])
  return keys

In [None]:
# Creamos un iterator para leer el fichero
import sys, os #son librerías de python para interactuar con el sistema, directorios, etc etc
tw_creeds = open("creds.txt", "r")
lines = tw_creeds.readlines()

In [None]:
# comprobamos si efectivamente guarda las lineas del fichero
lines

['API_KEY=tStAzpnCUtfIJFSAZGAJhZQUu\n',
 'API_KEY_SECRET=xOoEa1G4wqZhFOT9FWfC9RCMIaho4iEulDiZqWLdJMGApomuw5\n',
 'ACCESS_TOKEN=3222720493-4Flh2YFXWvaRV7JuS5OWXsM8uGfVygih52KejNl\n',
 'ACCESS_TOKEN_SECRET=Y792LDBtPApnXhdLqdpQZhUbq6rmbyW7kf3xdI4a7EvIa']

In [None]:
get_creds(lines)

['tStAzpnCUtfIJFSAZGAJhZQUu',
 'xOoEa1G4wqZhFOT9FWfC9RCMIaho4iEulDiZqWLdJMGApomuw5',
 '3222720493-4Flh2YFXWvaRV7JuS5OWXsM8uGfVygih52KejNl',
 'Y792LDBtPApnXhdLqdpQZhUbq6rmbyW7kf3xdI4a7EvIa']

In [None]:
# Procederemos con los creds de Twitter
CONSUMER_KEY = get_creds(lines)[0]
CONSUMER_SECRET = get_creds(lines)[1]
ACCESS_TOKEN = get_creds(lines)[2]
ACCESS_TOKEN_SECRET = get_creds(lines)[3]

In [None]:
CONSUMER_KEY

'tStAzpnCUtfIJFSAZGAJhZQUu'

## Inicialización de Twitter

In [None]:
# Interactuamos con la API de Twitter
auth = tweepy.OAuthHandler(CONSUMER_KEY, CONSUMER_SECRET)
auth.set_access_token(ACCESS_TOKEN, ACCESS_TOKEN_SECRET)

In [None]:
# Lanzamos la api
api = tweepy.API(auth)

In [None]:
# Obtenemos datos del usuario "neoland" usando la librería tweepy
user = api.get_user("NeolandStudio")
print("El tipo de datos de la variable user es: {}".format(type(user)))
print("El nombre de usuario es: {}".format(user.screen_name))
print("El id de usuario es: {}".format(user.id))

El tipo de datos de la variable user es: <class 'tweepy.models.User'>
El nombre de usuario es: NeolandStudio
El id de usuario es: 733328821504577536


In [None]:
# mostramos algunos atributos del usuario recuperado
print("El numero de followers: {}".format(user.followers_count))
print("El numero de amigos: {}".format(user.friends_count))
print("El numero de tweets: {}".format(user.statuses_count))


El numero de followers: 636
El numero de amigos: 237
El numero de tweets: 909


## Twitter Streaming & MongoDB

Almacenamos los tweets en la db NoSQL de MongoDB


In [None]:
# Para acceder a mongoDb la ruta del cliente es:
#client = pymongo.MongoClient("mongodb+srv://dbUser:<password>@cluster-twitter-neoland.ul52b.mongodb.net/<dbname>?retryWrites=true&w=majority")
#db = client.test


In [None]:
# Importamos la librería de Mongo
#!pip install pymongo
!pip install dnspython3

Collecting dnspython3
  Downloading https://files.pythonhosted.org/packages/f0/bb/f41cbc8eaa807afb9d44418f092aa3e4acf0e4f42b439c49824348f1f45c/dnspython3-1.15.0.zip
Collecting dnspython==1.15.0
[?25l  Downloading https://files.pythonhosted.org/packages/a6/72/209e18bdfedfd78c6994e9ec96981624a5ad7738524dd474237268422cb8/dnspython-1.15.0-py2.py3-none-any.whl (177kB)
[K     |████████████████████████████████| 184kB 7.2MB/s 
[?25hBuilding wheels for collected packages: dnspython3
  Building wheel for dnspython3 (setup.py) ... [?25l[?25hdone
  Created wheel for dnspython3: filename=dnspython3-1.15.0-cp36-none-any.whl size=1760 sha256=f7b7af37e6cc331c36707aab8435474a4f362b4768be195591cb9b3e473753cc
  Stored in directory: /root/.cache/pip/wheels/0d/88/bc/48625aeedc619aeb4987329d973b73aef251a6fcd6ce8fb862
Successfully built dnspython3
Installing collected packages: dnspython, dnspython3
  Found existing installation: dnspython 1.16.0
    Uninstalling dnspython-1.16.0:
      Successfully uni

In [None]:
from pymongo import MongoClient
#import pymongo
import dns

In [None]:
# Leemos el fichero de MongoCreds
mongo_creds = open("mongo_creds.txt", "r")
for line in mongo_creds:
  pieces = line.split("=")

In [None]:
pieces

['dbUser', 'dbUserPassword']

In [None]:
# Guardo las creds de Mongo
user = pieces[0]
password = pieces[1]

In [None]:
# Definimos el hashtag a recoger
HASHTAG = ['#AI', 'datascience', '@realDonaldTrump']

In [None]:
# Llamamos el Cliente Mongo
client = MongoClient("mongodb+srv://{0}:{1}@cluster-twitter-neoland.ul52b.mongodb.net/test?retryWrites=true&w=majority".format(user,password))
db = client.test
collection = db.hashtag

ConfigurationError: ignored

In [None]:
### Main functions
class StreamListener(tweepy.StreamListener):
    #This is a class provided by tweepy to access the Twitter Streaming API. 

    def on_connect(self):
        # Called initially to connect to the Streaming API
        print("You are now connected to the streaming API.")

    def on_error(self, status_code):
        # On error - if an error occurs, display the error / status code
        print('An Error has occured: ' + repr(status_code))
        return False

    def on_data(self, data):
        #This is the meat of the script...it connects to your mongoDB and stores the tweet
        try:
            # client = MongoClient(MONGO_HOST)
            # Use twitterdb database. If it doesn't exist, it will be created.
            # db = client.twitterdb
            # Decode the JSON from Twitter
            datajson = json.loads(data)

            #grab the 'created_at' data from the Tweet to use for display
            created_at = datajson['created_at']

            #print out a message to the screen that we have collected a tweet
            print("Tweet collected at " + str(created_at))

            #insert the data into the mongoDB into a collection called twitter_search
            #if twitter_search doesn't exist, it will be created.
            db.twitter_search.insert(datajson)
        except Exception as e:
            print(e)