In [36]:
from googleapiclient.discovery import build
import pandas as pd

# Configuración de la API de YouTube
api_key = 'AIzaSyAr5xeKq4GIuEq27-zGL477LHnKiE81_fQ'  # Reemplaza con tu clave de API válida
youtube = build('youtube', 'v3', developerKey=api_key)

# Función para obtener videos y detalles relacionados con una búsqueda
def obtener_videos_y_detalles(busqueda, max_results=50):
    """
    Obtiene los videos y detalles de la búsqueda en YouTube.
    
    Args:
        busqueda (str): Término de búsqueda para los videos.
        max_results (int): Número máximo de resultados a obtener (máx. 50).
        
    Returns:
        list: Lista de tuplas que contienen ID, título, canal y URL del video.
    """
    videos = []  # Inicializar lista para almacenar los videos
    search_response = youtube.search().list(
        q=busqueda,
        part='id,snippet',
        maxResults=max_results
    ).execute()  # Realizar la solicitud a la API

    # Procesar los resultados de la búsqueda
    for item in search_response['items']:
        # Verificar que el tipo de item es un video
        if item['id']['kind'] == 'youtube#video':
            video_id = item['id']['videoId']
            video_title = item['snippet']['title']
            canal_title = item['snippet']['channelTitle']
            # Generar la URL del video
            video_url = f"https://www.youtube.com/watch?v={video_id}"
            videos.append((video_id, video_title, canal_title, video_url))  # Almacenar los detalles en la lista

    return videos  # Retornar la lista de videos

# Función para obtener detalles específicos de un video
def obtener_detalles_video(video_id):
    """
    Obtiene detalles estadísticos de un video específico en YouTube.
    
    Args:
        video_id (str): ID del video para obtener detalles.
        
    Returns:
        dict: Diccionario con vistas, suscriptores y número de comentarios.
    """
    video_response = youtube.videos().list(
        part='statistics,snippet',
        id=video_id
    ).execute()  # Realizar la solicitud a la API

    detalles = video_response['items'][0]  # Extraer detalles del video
    vistas = detalles['statistics'].get('viewCount', 0)  # Obtener el conteo de vistas
    likes = detalles['statistics'].get('likeCount', 0)  # Obtener el conteo de likes (opcional)
    canal_id = detalles['snippet']['channelId']  # Obtener el ID del canal

    # Obtener información del canal asociado al video
    canal_response = youtube.channels().list(
        part='statistics',
        id=canal_id
    ).execute()

    subscriptores = canal_response['items'][0]['statistics'].get('subscriberCount', 0)  # Contar suscriptores
    num_comentarios = detalles['statistics'].get('commentCount', 0)  # Obtener número de comentarios

    return {
        'vistas': vistas,
        'subscriptores': subscriptores,
        'num_comentarios': num_comentarios
    }  # Retornar un diccionario con los detalles

# Lista de consultas en diferentes idiomas
consultas = [
    #------# Conjunto de consultas en Español #------#

#    'Las mejores Estrategias para Oro Trading',
#    'Las mejores Estrategias para XAUUSD Trading',
#    'ESTRATEGIAS GANADORAS EN ORO Trading',
#    'Estrategias Ganadoras en XAUUSD Trading',
#    'eSTRATEGIASPARA OPERAR xagusd Trading',
#    'Estraegias para operar en oro Trading',
#    'Las mejores Estrategias para Oro',
#    'Las mejores Estrategias para XAUUSD',
#    'ESTRATEGIAS GANADORAS EN ORO',
#    'Estrategias Ganadoras en XAUUSD',
#    'eSTRATEGIASPARA OPERAR xagusd',
#    'Estraegias para operar en oro',

    #------# Conjunto de consultas en Ingles #------#

#     'Best Strategies for Gold Trading',
#    'Best Strategies for XAUUSD Trading',
#    'WINNING STRATEGIES IN GOLD TRADING',
#    'Winning Strategies in XAUUSD Trading',
#    'eSTRATEGIES FOR XAUUSD Trading',
#    'Strategies for Gold Trading', 'Best Strategies for Gold Trading',
#    'Best Strategies for Gold',
#    'Best Strategies for XAUUSD',
#    'WINNING STRATEGIES IN GOLD',
#    'Winning Strategies in XAUUSD',
#    'xagusd trading strategies',
#    'xagusd trading strategies',
#    'Strategies for gold trading',
#    'Strategies for XAUUSD',
#    'Winning Strategies in gold',
#    'Winning Strategies in XAUUSD',

    #------# Conjunto de consultas en Ruso #------#
    #    'Лучшие стратегии для торговли золотом',
#    'Лучшие стратегии для торговли XAUUSD',
#    'ВЫИГРЫШНЫЕ СТРАТЕГИИ В ТОРГОВЛЕ ЗОЛОТОМ',
#    'Выигрышные стратегии в торговле на XAUUSD',
#    'Стратегии для торговли на XAUUSD',
#    'Выигрышные стратегии для торговли на XAUUSD',
#    'Стратегии для торговли на XAUUSD',
#    'Выигрышные стратегии для торговли на XAUUSD',
#    'Стратегии для торговли золотом',
#    'Лучшие стратегии для торговли золотом',
#    'Лучшие стратегии для золота',
#    'Лучшие стратегии для XAUUSD', 'Лучшие стратегии для XAUUSD',
#    'ВЫИГРЫШНЫЕ СТРАТЕГИИ ПО ЗОЛОТУ',
#    'Выигрышные стратегии в XAUUSD',
#    'Торговые стратегии xagusd', 'Торговые стратегии xagusd',
#    'Стратегии для торговли золотом',
#    'Стратегии для торговли золотом',
#    'Выигрышные стратегии на золоте',
    'Выигрышные стратегии на XAUUSD',

    #------# Conjunto de consultas en Chino #------#
    '黄金交易的最佳策略',
    'XAUUSD 交易的最佳策略',
    '黄金交易中的制胜策略',
    'XAUUSD 交易中的制胜策略',
    'XAUUSD 交易策略',
    'XAUUSD 交易中的制胜策略',
    'XAUUSD 交易中的制胜策略',
    '黄金交易策略》',
    '《黄金交易的最佳策略》',
    '黄金交易的最佳策略',
    'XAUUSD 的最佳策略',
    'XAUUSD 的最佳策略',
    '黄金的制胜策略',
    'XAUUSD 的制胜策略',
    'XAUUSD 交易策略',
    'XAUUSD 交易策略',
    '黄金交易策略',
    '黄金交易策略',
    '黄金的制胜策略',
    'XAUUSD 的制胜策略'
    
]

# Iterar sobre cada consulta, obtener videos y guardar los resultados en DataFrames separados
for consulta in consultas:
    videos = obtener_videos_y_detalles(consulta, max_results=100)  # Obtener videos de la consulta

    # Preparar lista para almacenar los datos de cada video
    datos = []
    for video_id, video_title, canal_title, video_url in videos:
        detalles = obtener_detalles_video(video_id)  # Obtener detalles del video
        datos.append({
            'Titulo': video_title,
            'Nombre del Canal': canal_title,
            'Subcriptores': detalles['subscriptores'],
            'Vistas Totales': detalles['vistas'],
            'Numero de Comentarios': detalles['num_comentarios'],
            'Direccion': video_url  # Almacenar la URL del video
        })

    # Crear un DataFrame de pandas con los datos recopilados
    df = pd.DataFrame(datos)
    
    # Asegurarse de que las columnas relevantes son numéricas
    df['Vistas Totales'] = pd.to_numeric(df['Vistas Totales'], errors='coerce')
    df['Subcriptores'] = pd.to_numeric(df['Subcriptores'], errors='coerce')
    df['Numero de Comentarios'] = pd.to_numeric(df['Numero de Comentarios'], errors='coerce')

    # Calcular la columna 'Ratio' utilizando las estadísticas obtenidas
    df['Ratio'] = df['Vistas Totales'] * (df['Subcriptores'] / (df['Vistas Totales'] / df['Subcriptores'])) * (df['Vistas Totales'] / df['Numero de Comentarios'])

    # Guardar cada DataFrame en un archivo CSV diferente, sanitizando el nombre del archivo
    nombre_archivo = consulta.replace(' ', '_').replace('á', 'a').replace('é', 'e').replace('í', 'i').replace('ó', 'o').replace('ú', 'u').replace('ñ', 'n').lower() + '.csv'
    df.to_csv(nombre_archivo, index=False)  # Guardar el DataFrame en un archivo CSV

    # Confirmar la exportación exitosa
    print(f"Resultados guardados en: {nombre_archivo}")  # Mensaje de confirmación

HttpError: <HttpError 403 when requesting https://youtube.googleapis.com/youtube/v3/search?q=%D0%92%D1%8B%D0%B8%D0%B3%D1%80%D1%8B%D1%88%D0%BD%D1%8B%D0%B5+%D1%81%D1%82%D1%80%D0%B0%D1%82%D0%B5%D0%B3%D0%B8%D0%B8+%D0%BD%D0%B0+XAUUSD&part=id%2Csnippet&maxResults=100&key=AIzaSyAr5xeKq4GIuEq27-zGL477LHnKiE81_fQ&alt=json returned "The request cannot be completed because you have exceeded your <a href="/youtube/v3/getting-started#quota">quota</a>.". Details: "[{'message': 'The request cannot be completed because you have exceeded your <a href="/youtube/v3/getting-started#quota">quota</a>.', 'domain': 'youtube.quota', 'reason': 'quotaExceeded'}]">

### Limpieza de datos
Comenzaremos a limpiar se hizo una nueva limitacion Que solamente solo se hara un borrado y asignacion a 0 si el video tiene como comentarios y likes el valor de 0 para evitar los inf, se eliminara

### Español

In [37]:
# Importar la biblioteca pandas, que es esencial para el análisis de datos en Python
import pandas as pd

# Definir una lista de nombres de archivos CSV que se desea leer.
# Esto permite una fácil iteración y gestión de archivos en el futuro.
archivos_csv = [
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/estraegias_para_operar_en_oro_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/estraegias_para_operar_en_orobest_strategies_for_gold_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/estrategias_ganadoras_en_oro_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/estrategias_ganadoras_en_oro.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/estrategias_ganadoras_en_xauusd_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/estrategias_ganadoras_en_xauusd.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/estrategiaspara_operar_xagusd_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/estrategiaspara_operar_xagusd.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/las_mejores_estrategias_para_oro_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/las_mejores_estrategias_para_oro.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/las_mejores_estrategias_para_xauusd_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Español/las_mejores_estrategias_para_xauusd.csv'
]

# Inicializar una lista para almacenar DataFrames leídos desde cada archivo CSV
dataframes = []

# Iterar sobre cada archivo CSV en la lista para leer y almacenar los DataFrames
for archivo in archivos_csv:
    # Leer el archivo CSV usando pandas y almacenar el DataFrame resultante
    df = pd.read_csv(archivo)
    # Agregar el DataFrame a la lista de dataframes
    dataframes.append(df)

# Al finalizar, `dataframes` contendrá todos los DataFrames leídos, lo que permite
# un fácil acceso y manipulación para análisis posteriores.

In [38]:
import pandas as pd
import numpy as np

# ------------------ Desarticulando la columna 'Direccion' para extraer el ID ÚNICO ------------------ 
# Crear una lista con todos los DataFrames
Lista = [df1, df2, df3, df4, df5, df6, df7, df8, df9, df10, df11, df12]

# Iterar sobre cada DataFrame en la lista para extraer el ID del video
for df in Lista:
    # Eliminar el prefijo de la URL de YouTube para obtener solo el video ID
    df['video_id'] = df['Direccion'].str.replace('https://www.youtube.com/watch?v=', '', regex=False)

# ------------------ Haciendo un join para practicidad ------------------ 
# Unificar todos los DataFrames en uno solo
df_unificado_Español = pd.concat(Lista, ignore_index=True)

# Eliminar duplicados basados en la columna 'video_id'
df_unificado_Español.drop_duplicates(subset=['video_id'], inplace=True)

# ------------------ Limpieza de Datos: NaN, inf y 0 ------------------ 
# Filtrar el DataFrame para eliminar filas con valores no válidos en la columna 'Ratio'
df_unificado_Español = df_unificado_Español[
    ~df_unificado_Español['Ratio'].isin([0]) & 
    ~df_unificado_Español['Ratio'].isna() & 
    ~df_unificado_Español['Ratio'].isin([np.inf])
]

# ------------------ Seleccionando los 30 videos con más alcance en Español ------------------ 
# Seleccionar los 30 mejores valores de 'Ratio' en orden descendente
Español_Result = df_unificado_Español.nlargest(30, 'Ratio')

### Consulta Inglesa

In [28]:
import pandas as pd
import numpy as np

# ------------------ Leer los archivos CSV para estrategias de trading en inglés ------------------ 
# Crear una lista con los nombres de los archivos CSV
file_paths = [
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/best_strategies_for_gold_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/best_strategies_for_gold.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/best_strategies_for_xauusd_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/best_strategies_for_xauusd.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/estrategies_for_xauusd_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/strategies_for_gold_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/strategies_for_xauusd.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/winning_strategies_in_gold_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/winning_strategies_in_gold.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/winning_strategies_in_xauusd_trading.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/winning_strategies_in_xauusd.csv',
    'C:/Users/spinz/OneDrive/Desktop/Proyect article Scientist/Data_Consultas/Ingles/xagusd_trading_strategies.csv'
]

# Leer todos los archivos CSV en DataFrames y almacenarlos en una lista
dataframes = [pd.read_csv(file) for file in file_paths]

In [29]:
# ------------------ Desarticulando la columna 'Direccion' para extraer el ID ÚNICO ------------------ 
# Iterar sobre cada DataFrame en la lista para extraer el ID del video
for df in dataframes:
    # Eliminar el prefijo de la URL de YouTube para obtener solo el video ID
    df['video_id'] = df['Direccion'].str.replace('https://www.youtube.com/watch?v=', '', regex=False)

# ------------------ Haciendo un join para practicidad ------------------ 
# Unificar todos los DataFrames en uno solo
df_unificado_Ingles = pd.concat(dataframes, ignore_index=True)

# Eliminar duplicados basados en la columna 'video_id'
df_unificado_Ingles.drop_duplicates(subset=['video_id'], inplace=True)

# ------------------ Limpieza de Datos: NaN, inf y 0 ------------------ 
# Filtrar el DataFrame para eliminar filas con valores no válidos en la columna 'Ratio'
df_unificado_Ingles = df_unificado_Ingles[
    ~df_unificado_Ingles['Ratio'].isin([0]) & 
    ~df_unificado_Ingles['Ratio'].isna() & 
    ~df_unificado_Ingles['Ratio'].isin([np.inf])
]

# ------------------ Seleccionando los 30 videos con más alcance en Inglés ------------------ 
# Seleccionar los 30 mejores valores de 'Ratio' en orden descendente
Ingles_Result = df_unificado_Ingles.nlargest(30, 'Ratio')

In [34]:
# ------------------ Definir las rutas de exportación ------------------ 
ruta_exportacion_Español = r'C:\Users\spinz\OneDrive\Desktop\Proyect article Scientist\Data_Consultas\Resultados\Español_result.csv'
ruta_exportacion_Ingles = r'C:\Users\spinz\OneDrive\Desktop\Proyect article Scientist\Data_Consultas\Resultados\Ingles_result.csv'

# ------------------ Exportar los DataFrames a las rutas específicas ------------------ 
Español_Result.to_csv(ruta_exportacion_Español, index=False)
Ingles_Result.to_csv(ruta_exportacion_Ingles, index=False)