# Introducción a Tweepy
## Conexión a la API de Twitter
Instalaremos la librería de Tweepy y recorreremos el archivo credentials.txt para recoger las claves.

In [7]:
!pip install tweepy



In [65]:
import tweepy
from tweepy import OAuthHandler
import json

#Recogemos nuestras credenciales de la API de Twitter localizadadas en el archivo 'credentials.txt'
credenciales = []
f = open("credentials.txt", "r")
for linea in f:
    key = linea.split("=")[1]
    credenciales.append(key.strip("\n"))
f.close()

#Autorizamos el acceso a la API
api_key = credenciales[0]
api_secret = credenciales[1]
access_token = credenciales[3]
access_secret = credenciales[4]
auth = OAuthHandler(api_key, api_secret)
auth.set_access_token(access_token, access_secret)
api = tweepy.API(auth, wait_on_rate_limit=True)

## Recopilando datos de Twitter
Vamos a hacer un repaso de los principales métodos disponibles de la API de Twitter y observaremos las ventajas de usar una librería como es Tweetpy

In [9]:
#Obtener información sobre mi
my_twitter_user = api.me()
print("Mi name en Twitter: "+my_twitter_user.name)
print("Y mi @: "+my_twitter_user.screen_name)

Mi name en Twitter: Pedro B
Y mi @: Pedrobf98


In [60]:
#Crear un tweet desde mi propia cuenta
status = api.update_status("hello world desde python")
#Buscamos tweet por el id del anterior
tweet_creado = api.get_status(status.id)
print("Autor del tweet: " + tweet_creado.author.screen_name)
print("Texto del tweet: " + tweet_creado.text)

Autor del tweet: Pedrobf98
Texto del tweet: hello world desde python


In [10]:
#Estructura del JSON de un User
print (json.dumps(my_twitter_user._json, indent=4))

{
    "id": 412408732,
    "id_str": "412408732",
    "name": "Pedro B",
    "screen_name": "Pedrobf98",
    "location": "Sevilla",
    "profile_location": null,
    "description": "Estudiante de Ingenier\u00eda Inform\u00e1tica Software en la US. Aprendiendo a tatuar.",
    "url": null,
    "entities": {
        "description": {
            "urls": []
        }
    },
    "protected": false,
    "followers_count": 90,
    "friends_count": 333,
    "listed_count": 2,
    "created_at": "Mon Nov 14 17:07:01 +0000 2011",
    "favourites_count": 2089,
    "utc_offset": null,
    "time_zone": null,
    "geo_enabled": false,
    "verified": false,
    "statuses_count": 2556,
    "lang": null,
    "status": {
        "created_at": "Tue Mar 23 22:28:19 +0000 2021",
        "id": 1374488205085437963,
        "id_str": "1374488205085437963",
        "text": "RT @MikeDrucker: \u201cEvery time there\u2019s a shooting\u201d is definitely a phrase to start your defense of guns https://t.co/qS9jDtIpj

In [11]:
#Obtener el @ de 15 de mis seguidores
for follower in my_twitter_user.followers(count=15):
    print(follower.screen_name)

JarpotG
alfonso_cade5
beatrizl0ra
GuilleLosada19
MaraBalam10
Permavolta
Cristina_Biebs
Ral_gv
Juanma_molina99
GuarRojo
set_jonay
xirim__
Taxtizy
Core_diabolis
SPVD8_20


In [12]:
#Obtener el numero de cuentas a las que sigo
my_twitter_user.friends_count

333

In [15]:
#Estructura del JSON un tweet
print (json.dumps(tweet_creado._json, indent=4))

{
    "created_at": "Wed Mar 24 16:22:34 +0000 2021",
    "id": 1374758547490213893,
    "id_str": "1374758547490213893",
    "text": "hello world desde python",
    "truncated": false,
    "entities": {
        "hashtags": [],
        "symbols": [],
        "user_mentions": [],
        "urls": []
    },
    "source": "",
    "in_reply_to_status_id": null,
    "in_reply_to_status_id_str": null,
    "in_reply_to_user_id": null,
    "in_reply_to_user_id_str": null,
    "in_reply_to_screen_name": null,
    "user": {
        "id": 412408732,
        "id_str": "412408732",
        "name": "Pedro B",
        "screen_name": "Pedrobf98",
        "location": "Sevilla",
        "description": "Estudiante de Ingenier\u00eda Inform\u00e1tica Software en la US. Aprendiendo a tatuar.",
        "url": null,
        "entities": {
            "description": {
                "urls": []
            }
        },
        "protected": false,
        "followers_count": 90,
        "friends_count": 333,
    

In [62]:
#Obtener información de otro usuario, en este caso la timeline de la cuenta oficial de la Universidad de Sevilla
universidad_sevilla_timeline = api.user_timeline(id= "unisevilla",count=10,tweet_mode='extended')
for tweets_uni_sevilla in universidad_sevilla_timeline:
    print(tweets_uni_sevilla.full_text)

📰Las últimas #Noticias de la US, en el Boletín BINUS de la semana ➡️ https://t.co/hdiIEfayAH https://t.co/IusqlNnuWK
RT @QuimicaUs: ¿Quieres ganar un programa internacional en la UCBerkeley o en la InAcademy?

Participa en el XVI Concurso de Ideas de Empre…
RT @Congreso_Es: 🖼 #Galería Cristina Pauner, profesora de Derecho Constitucional de la Universidad Jaume I, y Esperanza Gómez, profesora de…
🌞 @EducacionUs 👨‍🏫👩‍🏫 https://t.co/IJRp6a4VBR
📬¡Últimas horas! Cursos intensivos B1 de francés, inglés e italiano 🇫🇷🇬🇧🇮🇹  ➡ https://t.co/gzujknoAJy  #idiomas https://t.co/Z69XNTh57g
RT @EDITORIALUS: En 1809 #TalDiaComoHoy nació el #escritor Mariano José de Larra➡️ 𝑫𝒆 𝑩𝒍𝒂𝒏𝒄𝒐 𝑾𝒉𝒊𝒕𝒆 𝒂 𝒍𝒂 𝑮𝒆𝒏𝒆𝒓𝒂𝒄𝒊𝒐́𝒏 𝒅𝒆𝒍 27, un libro con 16…
RT @InvestigaUS: La @unisevilla organizó cerca de 100 actividades de divulgación científica en 2020 a pesar de la pandemia por #COVID19 en…
RT @CICUS_: Aún estás a tiempo de adquirir tu entrada para el #concierto que cierra el XI Festival de Música Contemporánea #ZahirEnsemble,

In [54]:
#Búsqueda de Tweets
#Mediante el método search la búsqueda de tweets está limitada a 100 tweets
results_hashtag_100 = api.search(q = '#datascience', lang = 'es', result_type = 'recent', tweet_mode='extended',count=150)
print("Número de tweets recogidos: " + str(len(results_hashtag_100)))

Número de tweets recogidos: 100


In [58]:
#Usando el objeto Cursor de tweetpy podemos superar el límite de 100 tweets que tiene el metodo de la api search
cont= 0
for tweet in tweepy.Cursor(api.search, q = '#datascience', lang = 'es', result_type = 'recent').items(150):
    cont= cont+1
print("Número de tweets recogidos mediante cursor: " + str(cont))

Número de tweets recogidos mediante cursor: 150


In [114]:
#Streaming de Tweets
#Clase que recibe el listener de tweepy y procesa los tweets como yo quiero
import time
class TweetsListener(tweepy.StreamListener):

    def __init__(self,start_time,time_limit):
        super(TweetsListener,self).__init__()
        self.time = start_time
        self.limit = time_limit
        self.tweets_streaming = []

    def on_connect(self):
        print("Conectado")

    def on_status(self, status):
        if((time.time() - start_time) > self.limit):
            print("Streaming de tweets completado")
            print("Numero de tweets recogidos: " + str(len(self.tweets_streaming)))
            return False
        self.tweets_streaming.append(status.text)
          

    def on_error(self, status_code):
        print("Error", status_code)


start_time = time.time()
stream = TweetsListener(start_time,10.00)

streamingApi = tweepy.Stream(auth=api.auth, listener=stream)
streamingApi.filter(languages=["es"], track=["ciencia","datos","python"]) 
#Andalucia locations=[-7.66,36.01,-1.58,38.81] el filtro no funciona conjuntamente con otras cosas
#https://developer.twitter.com/en/docs/twitter-api/v1/tweets/filter-realtime/guides/#basic-stream-parameters

cont = 0
for tweet in stream.tweets_streaming:
    print("Tweet número: " + str(cont))
    print(tweet)
    cont = cont + 1

Conectado
Streaming de tweets completado
Numero de tweets recogidos: 18
Tweet número: 0
RT @elconfidencial: Alemania avisa de "una pandemia más letal", y retira el cierre. ¿Debe reaccionar España? https://t.co/84B95ookbW
Tweet número: 1
RT @ECOEXPLORATORIO: [CIENCIA VIRTUAL] Participa del webinar "Conociendo el tiempo costero con @caricoos" hoy miércoles, 24 de marzo, a las…
Tweet número: 2
RT @muyinteresante: La CIA desclasifica todos los documentos sobre ovnis https://t.co/4oqEWTemaE
Tweet número: 3
RT @hernesr: @CianoBritos @Golum03477364 Pobre payaso, siempre con la info atrasada. Le tiran datos para dejarlo pegado.
Tweet número: 4
@Kv0th3_88 @ManuGFresnillo @Reina_Hipster Vamos cuartos en la UE eh xD no se de donde te has sacado los datos. Y si… https://t.co/wJpW0vgvQ9
Tweet número: 5
RT @Bgg6017: 📌”Pues fíjate que yo tengo otros datos! (...) lo que se tiene que decir es que es un problema entre dos comunidades indígenas(…
Tweet número: 6
RT @temporalescyl: Los científicos son tra