# Obtener datos de la API

## Obtener una cuenta de Twitter Developer

- Crear una cuenta en <a href="https://twitter.com/">Twitter</a> o ingresar a una ya creada
- Solicitar una <a href="https://developer.twitter.com/en/portal/petition/use-case">cuenta de developer</a>  
<br/>
<img src="img/twitter_api_1.png" style="width:50%;float:left;border:1px solid black">
<img src="img/twitter_api_2.png" style="width:50%;float:left;border:1px solid black">
<img src="img/twitter_api_3.png" style="width:50%;float:left;border:1px solid black">
<img src="img/twitter_api_4.png" style="width:50%;float:left;border:1px solid black">

#### How will you use the Twitter API or Twitter Data?

I will search and filter tweets with specific hashtags in order to perform data mining and sentiment analysis practices. These tasks are part of the Artificial Intelligence course. The extracted data will not be used for any other purpose.

#### Are you planning to analyze Twitter data?

I will perform sentiment analysis of the content of the tweets and their geographical location. The type of content of each tweet will be evaluated (links, images, videos)


<br/><br/>
<img src="img/twitter_api_5.png" style="width:50%;float:left;border:1px solid black">
<img src="img/twitter_api_6.png" style="width:50%;float:left;border:1px solid black">


### Responder mail

Si Twitter envía un mail solicitando más información responder con el siguiente mensaje.

<code>
    I will search and filter tweets with specific hashtags in order to perform data mining and sentiment analysis practices. These tasks are part of the Artificial Intelligence course. The extracted data will not be used for any other purpose.
    I will perform sentiment analysis of the content of the tweets and their geographical location. The type of content of each tweet will be evaluated (links, images, videos)
    I will not be using the Tweeting, Retweeting, or liking content. I will only use the API to obtain tweets content.
    The content of the tweets will not be shown. The content will only be used to carry out data analysis exercises during the course.
</code>

## Crear aplicación

- Crear proyecto
- Crear aplicación dentro del proyecto
- Obtener y guardar claves (copiar todas las claves antes de continuar ya que no pueden ser accedidas más adelante)

<br/>
<img src="img/twitter_api_8.png" style="width:30%;float:left;border:1px solid black">
<img src="img/twitter_api_7.png" style="width:70%;float:left;border:1px solid black">


## Cargar Token en variables de entorno

 - Cargar el valor del token en un archivo .env
 <code>export 'BEARER_TOKEN'='valor del bearer token' </code>
 - Agregar el archivo .env dentro del .gitignore en caso de trabajar en repositorio

## Cargar valor del Token en la aplicación

In [7]:
import os
from dotenv import load_dotenv
# Cargar valores del archivo .env en las variables de entorno
load_dotenv()
# Cargar valor del token a variable
bearer_token = os.environ.get("BEARER_TOKEN")

## Definir consulta a la API

### URL de la consulta

Definir la URL de acuerdo a los datos requeridos de acuerdo a la documentación de la <a href="https://developer.twitter.com/en/docs/twitter-api/api-reference-index">API</a>

In [2]:
url = "https://api.twitter.com/2/tweets/search/recent"

## Definir parámetros adicionales

Definr valores como el rango de fecha, hashtag, contenido y campos requeridos.

In [13]:
params = {
    'query': '#machinelearning -is:retweet',
    'tweet.fields':'created_at',
    'max_results':100
}

## Definir cabecera
La cabecera debe llevar el Token de autenticación para que la consulta sea autorizada


In [14]:
headers = {
    "Authorization": f"Bearer {bearer_token}",
    "User-Agent":"v2FullArchiveSearchPython"
} 

## Realizar consulta

In [15]:
import requests
response = requests.get(url, headers=headers, params=params)
print(response)
# Generar excepción si la respuesta no es exitosa
if response.status_code != 200:
    raise Exception(response.status_code, response.text)
print(response.json())

<Response [200]>
{'data': [{'created_at': '2021-09-27T02:30:05.000Z', 'id': '1442315578664968193', 'text': 'Was famed #SamsonAndDelilah really painted by #Rubens?\n\nNo, says #AI\n\nhttps://t.co/zaEFkk5wsS #fintech #insurance #ArtificialIntelligence #MachineLearning #DeepLearning #DalyaAlberge @guardian @HaroldSinnott @SabineVdL @antgrasso @ipfconline1 @jblefevre60 @KMcDTech @Thomas_Harrer https://t.co/kDruirakQq'}, {'created_at': '2021-09-27T02:30:01.000Z', 'id': '1442315561875107850', 'text': 'Research and development in computer vision, artificial intelligence, and machine learning will fetch more than 20 billion US dollars by 2023.\n#Research #development #computer #artificialintelligence #machinelearning #US #2023 \n #Analytixlabs https://t.co/IhGANNiRIF'}, {'created_at': '2021-09-27T02:29:58.000Z', 'id': '1442315548235161604', 'text': 'Day 51 of #100DaysOfCode but on an unrelated note I am tired of watching the \n@Yankees\nbeat the \n@RedSox #vacancy  #jobs #javascript #technolog

## Formatear respuesta

Convertir respuesta en un dataframe de Pandas

In [16]:
import pandas as pd
df = pd.json_normalize(response.json()['data'])
df

Unnamed: 0,created_at,id,text
0,2021-09-27T02:30:05.000Z,1442315578664968193,Was famed #SamsonAndDelilah really painted by ...
1,2021-09-27T02:30:01.000Z,1442315561875107850,"Research and development in computer vision, a..."
2,2021-09-27T02:29:58.000Z,1442315548235161604,Day 51 of #100DaysOfCode but on an unrelated n...
3,2021-09-27T02:29:23.000Z,1442315402491543554,A Common-Sense Guide to Data Structures and Al...
4,2021-09-27T02:29:06.000Z,1442315332861976576,Let's not overkill Deep Learning! #DeepLearnin...
...,...,...,...
95,2021-09-27T01:45:01.000Z,1442304235681419264,#ArtificialIntelligence #AI #DataScience #100D...
96,2021-09-27T01:45:00.000Z,1442304231919300614,Why artificial intelligence may not be suitabl...
97,2021-09-27T01:44:21.000Z,1442304070715273219,Why Do Companies Struggle With Ethical Artific...
98,2021-09-27T01:44:01.000Z,1442303984841019398,For week 3 ( Machine Learning for Classificati...


# Ejercicios

 A partir de la documentación del endpoint <a href="https://developer.twitter.com/en/docs/twitter-api/tweets/search/api-reference/get-tweets-search-recent"> Recent </a> y las opciones de <a href="https://developer.twitter.com/en/docs/twitter-api/tweets/search/integrate/build-a-query"> query </a> obtener:
 
 - Una lista de las fechas y creación de los tweets realizados por el usuario @kdnuggets que contenga el hashtag #NLP

- Una lista de los textos y nombres de usuario correspondientes a los tweets que contengan los hashtags #NLP y #MachineLearning que no sean retweets

- Una lista de los textos y enlaces de los tweets que contengan los hashtags #InteligenciaArtificial o #IA en español

## Descargar a CSV

In [17]:
df.to_csv('tweets_ej')  