# Obtener datos de la API

## Obtener una cuenta de Twitter Developer

- Crear una cuenta en <a href="https://twitter.com/">Twitter</a> o ingresar a una ya creada
- Solicitar una <a href="https://developer.twitter.com/en/portal/petition/use-case">cuenta de developer</a>  
<br/>
<img src="img/twitter_api_1.png" style="width:50%;float:left;border:1px solid black">
<img src="img/twitter_api_2.png" style="width:50%;float:left;border:1px solid black">
<img src="img/twitter_api_3.png" style="width:50%;float:left;border:1px solid black">
<img src="img/twitter_api_4.png" style="width:50%;float:left;border:1px solid black">

#### How will you use the Twitter API or Twitter Data?

I will search and filter tweets with specific hashtags in order to perform data mining and sentiment analysis practices. These tasks are part of the Artificial Intelligence course. The extracted data will not be used for any other purpose.

#### Are you planning to analyze Twitter data?

I will perform sentiment analysis of the content of the tweets and their geographical location. The type of content of each tweet will be evaluated (links, images, videos)


<br/><br/>
<img src="img/twitter_api_5.png" style="width:50%;float:left;border:1px solid black">
<img src="img/twitter_api_6.png" style="width:50%;float:left;border:1px solid black">


### Responder mail

Si Twitter envía un mail solicitando más información responder con el siguiente mensaje.

<code>
    I will search and filter tweets with specific hashtags in order to perform data mining and sentiment analysis practices. These tasks are part of the Artificial Intelligence course. The extracted data will not be used for any other purpose.
    I will perform sentiment analysis of the content of the tweets and their geographical location. The type of content of each tweet will be evaluated (links, images, videos)
    I will not be using the Tweeting, Retweeting, or liking content. I will only use the API to obtain tweets content.
    The content of the tweets will not be shown. The content will only be used to carry out data analysis exercises during the course.
</code>

## Crear aplicación

- Crear proyecto
- Crear aplicación dentro del proyecto
- Obtener y guardar claves (copiar todas las claves antes de continuar ya que no pueden ser accedidas más adelante)

<br/>
<img src="img/twitter_api_8.png" style="width:30%;float:left;border:1px solid black">
<img src="img/twitter_api_7.png" style="width:70%;float:left;border:1px solid black">


## Cargar Token en variables de entorno

 - Cargar el valor del token en un archivo .env
 <code>export 'BEARER_TOKEN'='valor del bearer token' </code>
 - Agregar el archivo .env dentro del .gitignore en caso de trabajar en repositorio

## Cargar valor del Token en la aplicación

In [1]:
import os
from dotenv import load_dotenv
# Cargar valores del archivo .env en las variables de entorno
load_dotenv()
# Cargar valor del token a variable
bearer_token = os.environ.get("BEARER_TOKEN")

## Definir consulta a la API

### URL de la consulta

Definir la URL de acuerdo a los datos requeridos de acuerdo a la documentación de la <a href="https://developer.twitter.com/en/docs/twitter-api/api-reference-index">API</a>

In [2]:
url = "https://api.twitter.com/2/tweets/search/recent"

## Definir parámetros adicionales

Definr valores como el rango de fecha, hashtag, contenido y campos requeridos.

In [3]:
params = {
    'query': '#messi -is:retweet lang:en',
    'tweet.fields':'created_at',
    'max_results':100,
}

## Definir cabecera
La cabecera debe llevar el Token de autenticación para que la consulta sea autorizada


In [4]:
headers = {
    "Authorization": f"Bearer {bearer_token}",
    "User-Agent":"v2FullArchiveSearchPython"
} 

## Realizar consulta

In [5]:
import requests
import os
from dotenv import load_dotenv
import pandas as pd
import string
from nltk.tokenize import TweetTokenizer
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import nltk

def get_data(url,params, total_pages):
    results = []
    count = 0
    while count < total_pages:
        count += 1
        response = requests.get(url, headers=headers, params=params)
        # Generar excepción si la respuesta no es exitosa
        if response.status_code != 200:
            raise Exception(response.status_code, response.text)
        data = response.json()['data']
        meta_data = dict(response.json())['meta']
        results.append(pd.json_normalize(data))
        if 'next_token' not in meta_data:
            break
        else:
            token = meta_data['next_token']
            print(token)
            params = {
                    'query': '#messi -is:retweet lang:en',
                    'tweet.fields':'created_at',
                    'next_token':token,
                    'max_results':100
            }
    return pd.concat(results)


url = "https://api.twitter.com/2/tweets/search/recent"
df = get_data(url, params, 100)

b26v89c19zqg8o3fpdv67hnmb2rnn8jqv54g89tajdqbh
b26v89c19zqg8o3fpdv67fjsj02sitvt3ryslpa9opz0d
b26v89c19zqg8o3fpdv5st4dweomgi8nqtxyb2vsz9lkt
b26v89c19zqg8o3fpdv5st36v91o7a0s2comr4x06mzjx
b26v89c19zqg8o3fpdv5sr0kag6qity5dqykt5jody0sd
b26v89c19zqg8o3fpdv5sr0k5wjbybxf9kukftspza3y5
b26v89c19zqg8o3fpdv5sr09o3ir2ycb18lm66o1pjfjx
b26v89c19zqg8o3fpdv5sqzo38zfzjpd26ro9wxzhwbr1
b26v89c19zqg8o3fpdv5sqyrpz2isxhvkl7g0xmlz05fh
b26v89c19zqg8o3fpdv5sqy621kvnrypco4jeuzjaweil
b26v89c19zqg8o3fpdv5sqy5uggzyrhiyelu7bdcsvdrx
b26v89c19zqg8o3fpdv5sow4xjlp3sryobriwb6pjwghp
b26v89c19zqg8o3fpdv5sow4rhqxxzjum5pcd63pifou5
b26v89c19zqg8o3fpdv5sovu0l04qd8wz8fpn1raslfgd
b26v89c19zqg8o3fpdv5sovje8bq4v1i6zv3n69amp5rx
b26v89c19zqg8o3fpdv5souxls1hrpoybxj4y534psrjx
b26v89c19zqg8o3fpdv5souc8itt3eyxm80q4q28qifel
b26v89c19zqg8o3fpdv5souc5gy125bxh9gac858tvn25
b26v89c19zqg8o3fpdv5sou1biishdoevyromfs3n635p
b26v89c19zqg8o3fpdv5sotfzrpqtv0lhpdohcy6k6irh
b26v89c19zqg8o3fpdv5smres8hx3u11zx0vzu4i85hfh
b26v89c19zqg8o3fpdv5smr3wrntv1queg

## Formatear respuesta

Convertir respuesta en un dataframe de Pandas

In [6]:
import pandas as pd
#df = pd.json_normalize(response.json()['data'])
df

Unnamed: 0,created_at,id,text
0,2021-10-21T13:47:40.000Z,1451183407094894606,Nnamdi Kanu challenges competence of FG’s fres...
1,2021-10-21T13:43:56.000Z,1451182465427677187,💙❤️Our future\n\n#فاتي #AnsuFati2027 #AnsuFati...
2,2021-10-21T13:43:03.000Z,1451182245365043203,The race gets tougher with every passing event...
3,2021-10-21T13:42:39.000Z,1451182142164111363,"Ebonyi residents observe sit-at-home, banks re..."
4,2021-10-21T13:40:57.000Z,1451181716068974597,No Credit for Bruno ?!#UCL #Ronaldo #MUFC #Mes...
...,...,...,...
11,2021-10-14T14:03:10.000Z,1448650590951641097,@goal No one:\n\nAbsolutely No one:\n\nThe WHO...
12,2021-10-14T14:02:45.000Z,1448650489281712135,Without telling us you're from eFootball\n\n#e...
13,2021-10-14T14:01:16.000Z,1448650113023315972,No..Its Not... \n\nThe Ballon d’Or is only for...
14,2021-10-14T14:01:12.000Z,1448650099056201736,"@Ali_Pele123 Crazy to think, #Pelé never playe..."


# Ejercicios

 A partir de la documentación del endpoint <a href="https://developer.twitter.com/en/docs/twitter-api/tweets/search/api-reference/get-tweets-search-recent"> Recent </a> y las opciones de <a href="https://developer.twitter.com/en/docs/twitter-api/tweets/search/integrate/build-a-query"> query </a> obtener:
 
 - Una lista de las fechas y creación de los tweets realizados por el usuario @kdnuggets que contenga el hashtag #NLP

- Una lista de los textos y nombres de usuario correspondientes a los tweets que contengan los hashtags #NLP y #MachineLearning que no sean retweets

- Una lista de los textos y enlaces de los tweets que contengan los hashtags #InteligenciaArtificial o #IA en español

## Descargar a CSV

In [7]:
df.to_csv('tweets_full - copia.csv')