# Extracci√≥n de datos desde Twitter - Proyecto integrador

Este libro contiene el codigo que se empleo para la consulta de la API de Twitter mediante la funci√≥n Tweepy de Python 3. La consulta se realiza ingresando un conjunto de palabras clave y con la posibilidad de utilizar un periodo de estudio. Las credenciales empleadas para autenticarse mediante Twitter no son mostradas en este libro de Jupyter, son importadas mediante un codigo en Python en el que se guardan estas credenciales.

Si desea consultar mas informaci√≥n del uso de la librer√≠a Tweepy y sus alcances puede visitar las siguientes paginas web:

*  https://github.com/tweepy/tweepy

* https://www.tweepy.org/


Los estudiantes que participaron en el desarrollo de este proyecto son:
    
    1. Jorge Luis Renteria
    2. Edgar Leandro Jimenez
    3. Jesus Alberto Arcia
    
Universidad Eafit, 2019.

### Importaci√≥n de librerias

In [1]:
try:
    import json
except ImportError:
    import simplejson as json


import tweepy as tw
import pandas as pd
import sys
import credencialesApiTwitter

### Configuraci√≥n de tweepy para autenticarse con las credenciales de twitter

In [2]:
auth = tw.OAuthHandler(credencialesApiTwitter.consumerkey, 
                       credencialesApiTwitter.consumerSecret)
auth.set_access_token(credencialesApiTwitter.accessToken,
                      credencialesApiTwitter.accessSecret)

### Consumo de la api de Twitter

In [3]:
api = tw.API(auth, wait_on_rate_limit=True, 
             wait_on_rate_limit_notify=True, compression=True)

# Palabras a buscar
search_words2 = ['@Avianca','@AviancaColombia','@AviancaEscucha',
                     '#Avianca','#AviancaColombia','#AviancaEscucha',
                     'Avianca', 'AviancaColombia', 'AviancaEscucha']

In [5]:
for search_words in search_words2:
    new_search = search_words + " -filter:retweets"

    tweets = tw.Cursor(api.search,
                       q=new_search,
                       lang="es",
                       since="2019-12-02",
                       until="2019-12-03",
                       tweet_mode='extended').items(50)

    users_locs = [[tweet.created_at, tweet.id_str, tweet.user.screen_name, tweet.user.id_str, tweet.full_text,
                   tweet.user.location, tweet.user.followers_count, tweet.user.friends_count] for tweet in tweets]

    tweet_text = pd.DataFrame(data=users_locs,
                              columns=['Creacion', 'Id Tweet', 'Nombre', 'Id Usuario', 'Texto', 'Ubicaci√≥n',
                                       'Seguidores', 'Seguidos'])

### Impresi√≥n de los tweets

In [6]:
tweet_text

Unnamed: 0,Creacion,Id Tweet,Nombre,Id Usuario,Texto,Ubicaci√≥n,Seguidores,Seguidos
0,2019-12-02 23:42:26,1201647846392549376,AviancaEscucha,828733525427941377,@AndresDLCB Andr√©s. Es maravilloso disfrutar d...,,9581,88
1,2019-12-02 23:19:34,1201642092306583553,AviancaEscucha,828733525427941377,"@dmriano Diego, esperamos que adem√°s de tener ...",,9581,88
2,2019-12-02 23:07:19,1201639008222269443,AviancaEscucha,828733525427941377,@ChemasAviacion T√∫ tambi√©n formas parte en est...,,9581,88
3,2019-12-02 22:53:04,1201635422201352193,AviancaEscucha,828733525427941377,@loridka Hola Laura. Sugerimos limpies la memo...,,9581,88
4,2019-12-02 22:51:49,1201635108433924098,marifulleda,234323210,@AviancaEscucha Pues no me esta ayudando! No m...,Colombia,233,464
5,2019-12-02 22:47:23,1201633993415938048,AviancaEscucha,828733525427941377,"@mclacouture Nos sentimos especiales, no solo ...",,9581,88
6,2019-12-02 22:46:53,1201633867716845569,AviancaEscucha,828733525427941377,@fefulle Hola Federico. Revisaremos lo que pas...,,9581,88
7,2019-12-02 22:34:51,1201630836082249729,AviancaEscucha,828733525427941377,"@RIKIRICOM2010 Ricardo, para ayudarte por este...",,9581,88
8,2019-12-02 22:33:45,1201630558960455683,vivacardozo,64419718,@AviancaEscucha AV 382 est√© es el segundo d√≠a ...,Los Angeles,4227,2858
9,2019-12-02 22:31:48,1201630071242530817,margaritaescbr,1168675797516857344,S√∫per orgullosa! ‚ô•Ô∏èü§© https://t.co/A5cRhiDATo,"Medell√≠n, Colombia",140,175


In [7]:
tweet_text['Texto']

0     @AndresDLCB Andr√©s. Es maravilloso disfrutar d...
1     @dmriano Diego, esperamos que adem√°s de tener ...
2     @ChemasAviacion T√∫ tambi√©n formas parte en est...
3     @loridka Hola Laura. Sugerimos limpies la memo...
4     @AviancaEscucha Pues no me esta ayudando! No m...
5     @mclacouture Nos sentimos especiales, no solo ...
6     @fefulle Hola Federico. Revisaremos lo que pas...
7     @RIKIRICOM2010 Ricardo, para ayudarte por este...
8     @AviancaEscucha AV 382 est√© es el segundo d√≠a ...
9          S√∫per orgullosa! ‚ô•Ô∏èü§© https://t.co/A5cRhiDATo
10    @vivacardozo Hola Viviana. Comp√°rtenos el n√∫me...
11    @margaritaescbr Ya eres parte de nosotros Marg...
12    @marifulleda Hola Mariana, efectivamente tu vu...
13    Primera vez que en una l√≠nea a√©rea no me devue...
14    @gusanitaec Hola Susana, cu√©ntanos cu√°l es tu ...
15    @memujica77 Hola, deseamos saber lo ocurrido p...
16    @AviancaEscucha terrible servicio al cliente h...
17    @JorgeFBurgos Jorge, n

### Guardar los tweets en archivo plano

In [None]:
tweet_text.to_csv("avianca" + ".csv", encoding='utf-8-sig')