<a href="https://colab.research.google.com/github/JorgeZarama/TFM/blob/main/StockTwits.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import requests
import pandas as pd
import time

# Función para obtener los mensajes
def obtener_mensajes_ticker(ticker, max_id=None):
    url = f"https://api.stocktwits.com/api/2/streams/symbol/{ticker}.json"

    # Parámetros para la consulta
    params = {
        "max": max_id
    }

    # Headers comunes para emular una solicitud desde un navegador
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
    }

    # Realiza el llamado a la API con los headers
    response = requests.get(url, headers=headers, params=params)

    # Verifica si el llamado fue exitoso
    if response.status_code == 200:
        data = response.json()
        return data
    else:
        print(f"Error en el llamado a la API: {response.status_code}")
        return None

# Función para extraer los mensajes y formar el DataFrame
def extraer_mensajes(ticker):
    all_messages = []
    max_id = None
    more_messages = True

    while more_messages:
        data = obtener_mensajes_ticker(ticker, max_id)
        if data:
            messages = data['messages']
            if not messages:
                break

            for message in messages:
                simbolo = message['symbols'][0]['symbol']
                mensaje = message['body']
                fecha_creacion = message['created_at']
                nombre_usuario = message['user']['username']
                fecha_creacion_usuario = message['user']['join_date']
                oficial = message['user']['official']
                identidad = message['user']['identity']

                # Verifica si existe la clave 'links' y si contiene elementos
                if 'links' in message and message['links']:
                    titulo_link = message['links'][0]['title']
                    descripcion_link = message['links'][0]['description']
                    fecha_creacion_link = message['links'][0]['created_at']
                else:
                    titulo_link = None
                    descripcion_link = None
                    fecha_creacion_link = None

                # Sentimiento (puede ser vacío)
                sentimiento = message['entities']['sentiment']['basic'] if message['entities']['sentiment'] else None

                # Agrega la información al arreglo
                all_messages.append([
                    simbolo, mensaje, fecha_creacion, nombre_usuario,
                    fecha_creacion_usuario, oficial, identidad, titulo_link,
                    descripcion_link, fecha_creacion_link, sentimiento
                ])

            # Actualiza max_id al id del mensaje más antiguo para la próxima consulta
            max_id = messages[-1]['id'] - 1
            more_messages = data['cursor']['more']

        # Añade un pequeño retraso para evitar el bloqueo por la API
        time.sleep(1)

    # Crea el DataFrame con todos los mensajes
    df = pd.DataFrame(all_messages, columns=[
        'simbolo', 'mensaje', 'fecha_creacion', 'nombre_usuario',
        'fecha_creacion_usuario', 'oficial', 'identidad', 'titulo_link',
        'descripcion_link', 'fecha_creacion_link', 'sentimiento'
    ])

    return df

# Uso de la función
ticker = "LRCX"
df = extraer_mensajes(ticker)

# Guarda el DataFrame en formato CSV
df.to_csv(f'{ticker}_mensajes.csv', index=False)

# Guarda el DataFrame en formato Pandas (.pkl)
df.to_pickle(f'{ticker}_mensajes.pkl')

# Muestra un mensaje de confirmación
print(f"DataFrame guardado como {ticker}_mensajes.csv y {ticker}_mensajes.pkl")

DataFrame guardado como LRCX_mensajes.csv y LRCX_mensajes.pkl


In [None]:
import requests
import pandas as pd
import time

# Función para obtener los mensajes
def obtener_mensajes_ticker(ticker, max_id=None):
    url = f"https://api.stocktwits.com/api/2/streams/symbol/{ticker}.json"

    # Parámetros para la consulta
    params = {
        "max": max_id
    }

    # Headers comunes para emular una solicitud desde un navegador
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
    }

    # Realiza el llamado a la API con los headers
    response = requests.get(url, headers=headers, params=params)

    # Verifica si el llamado fue exitoso
    if response.status_code == 200:
        data = response.json()
        return data
    else:
        print(f"Error en el llamado a la API: {response.status_code}")
        return None

# Función para extraer los mensajes y formar el DataFrame
def extraer_mensajes(ticker):
    all_messages = []
    max_id = None
    more_messages = True

    while more_messages:
        data = obtener_mensajes_ticker(ticker, max_id)
        if data:
            messages = data['messages']
            if not messages:
                break

            for message in messages:
                simbolo = message['symbols'][0]['symbol']
                mensaje = message['body']
                fecha_creacion = message['created_at']
                nombre_usuario = message['user']['username']
                fecha_creacion_usuario = message['user']['join_date']
                oficial = message['user']['official']
                identidad = message['user']['identity']

                # Verifica si existe la clave 'links' y si contiene elementos
                if 'links' in message and message['links']:
                    titulo_link = message['links'][0]['title']
                    descripcion_link = message['links'][0]['description']
                    fecha_creacion_link = message['links'][0]['created_at']
                else:
                    titulo_link = None
                    descripcion_link = None
                    fecha_creacion_link = None

                # Sentimiento (puede ser vacío)
                sentimiento = message['entities']['sentiment']['basic'] if message['entities']['sentiment'] else None

                # Agrega la información al arreglo
                all_messages.append([
                    simbolo, mensaje, fecha_creacion, nombre_usuario,
                    fecha_creacion_usuario, oficial, identidad, titulo_link,
                    descripcion_link, fecha_creacion_link, sentimiento
                ])

            # Actualiza max_id al id del mensaje más antiguo para la próxima consulta
            max_id = messages[-1]['id'] - 1
            more_messages = data['cursor']['more']

        # Añade un pequeño retraso para evitar el bloqueo por la API
        time.sleep(1)

    # Crea el DataFrame con todos los mensajes
    df = pd.DataFrame(all_messages, columns=[
        'simbolo', 'mensaje', 'fecha_creacion', 'nombre_usuario',
        'fecha_creacion_usuario', 'oficial', 'identidad', 'titulo_link',
        'descripcion_link', 'fecha_creacion_link', 'sentimiento'
    ])

    return df

# Uso de la función
ticker = "TMS"
df = extraer_mensajes(ticker)

# Guarda el DataFrame en formato CSV
df.to_csv(f'{ticker}_mensajes.csv', index=False)

# Guarda el DataFrame en formato Pandas (.pkl)
df.to_pickle(f'{ticker}_mensajes.pkl')

# Muestra un mensaje de confirmación
print(f"DataFrame guardado como {ticker}_mensajes.csv y {ticker}_mensajes.pkl")

DataFrame guardado como TMS_mensajes.csv y TMS_mensajes.pkl


In [None]:
import requests
import pandas as pd
import time

# Función para obtener los mensajes
def obtener_mensajes_ticker(ticker, max_id=None):
    url = f"https://api.stocktwits.com/api/2/streams/symbol/{ticker}.json"

    # Parámetros para la consulta
    params = {
        "max": max_id
    }

    # Headers comunes para emular una solicitud desde un navegador
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
    }

    # Realiza el llamado a la API con los headers
    response = requests.get(url, headers=headers, params=params)

    # Verifica si el llamado fue exitoso
    if response.status_code == 200:
        data = response.json()
        return data
    else:
        print(f"Error en el llamado a la API: {response.status_code}")
        return None

# Función para extraer los mensajes y formar el DataFrame
def extraer_mensajes(ticker):
    all_messages = []
    max_id = None
    more_messages = True

    while more_messages:
        data = obtener_mensajes_ticker(ticker, max_id)
        if data:
            messages = data['messages']
            if not messages:
                break

            for message in messages:
                simbolo = message['symbols'][0]['symbol']
                mensaje = message['body']
                fecha_creacion = message['created_at']
                nombre_usuario = message['user']['username']
                fecha_creacion_usuario = message['user']['join_date']
                oficial = message['user']['official']
                identidad = message['user']['identity']

                # Verifica si existe la clave 'links' y si contiene elementos
                if 'links' in message and message['links']:
                    titulo_link = message['links'][0]['title']
                    descripcion_link = message['links'][0]['description']
                    fecha_creacion_link = message['links'][0]['created_at']
                else:
                    titulo_link = None
                    descripcion_link = None
                    fecha_creacion_link = None

                # Sentimiento (puede ser vacío)
                sentimiento = message['entities']['sentiment']['basic'] if message['entities']['sentiment'] else None

                # Agrega la información al arreglo
                all_messages.append([
                    simbolo, mensaje, fecha_creacion, nombre_usuario,
                    fecha_creacion_usuario, oficial, identidad, titulo_link,
                    descripcion_link, fecha_creacion_link, sentimiento
                ])

            # Actualiza max_id al id del mensaje más antiguo para la próxima consulta
            max_id = messages[-1]['id'] - 1
            more_messages = data['cursor']['more']

        # Añade un pequeño retraso para evitar el bloqueo por la API
        time.sleep(1)

    # Crea el DataFrame con todos los mensajes
    df = pd.DataFrame(all_messages, columns=[
        'simbolo', 'mensaje', 'fecha_creacion', 'nombre_usuario',
        'fecha_creacion_usuario', 'oficial', 'identidad', 'titulo_link',
        'descripcion_link', 'fecha_creacion_link', 'sentimiento'
    ])

    return df

# Uso de la función
ticker = "GOOGL"
df = extraer_mensajes(ticker)

# Guarda el DataFrame en formato CSV
df.to_csv(f'{ticker}_mensajes.csv', index=False)

# Guarda el DataFrame en formato Pandas (.pkl)
df.to_pickle(f'{ticker}_mensajes.pkl')

# Muestra un mensaje de confirmación
print(f"DataFrame guardado como {ticker}_mensajes.csv y {ticker}_mensajes.pkl")

DataFrame guardado como GOOGL_mensajes.csv y GOOGL_mensajes.pkl
