In [1]:
import requests
import json

# URL de la API de Reddit para obtener información sobre anuncios en el subreddit 'advertising'
url = "https://www.reddit.com/r/advertising/.json"
headers = {'User-agent': 'Mozilla/5.0'}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    data = response.json()
    
    # Extraer información relevante de los anuncios
    anuncios = []
    for post in data['data']['children']:
        anuncio = {
            'title': post['data']['title'],
            'author': post['data']['author'],
            'score': post['data']['score'],
            'num_comments': post['data']['num_comments'],
            'created_utc': post['data']['created_utc']
        }
        anuncios.append(anuncio)
    
    # Verifica la estructura de los datos
    print("Datos extraídos:")
    print(json.dumps(anuncios, indent=4))
    
    # Guardar los datos en un archivo JSON
    with open('datos_anuncios.json', 'w') as f:
        json.dump(anuncios, f, indent=4)
    print("Datos guardados en 'datos_anuncios.json'")
except requests.exceptions.RequestException as e:
    print(f"Error al realizar la solicitud: {e}")
except json.JSONDecodeError as e:
    print(f"Error al decodificar la respuesta JSON: {e}")
except Exception as e:
    print(f"Error inesperado: {e}")


Datos extraídos:
[
    {
        "title": "New Job Listings",
        "author": "AutoModerator",
        "score": 5,
        "num_comments": 2,
        "created_utc": 1720552328.0
    },
    {
        "title": "Looking for community feedback",
        "author": "JonODonovan",
        "score": 13,
        "num_comments": 1,
        "created_utc": 1718731259.0
    },
    {
        "title": "Best YT channels for keeping up with new ads?",
        "author": "ArchStLou15",
        "score": 20,
        "num_comments": 13,
        "created_utc": 1721226403.0
    },
    {
        "title": "I graduated in May this year with a degree in Economics... only to realize that I hate Economics and now wish to try to break into Advertising. How can I best do this?",
        "author": "OhioOhO",
        "score": 0,
        "num_comments": 14,
        "created_utc": 1721264128.0
    },
    {
        "title": "How to connect dashboards to slide decks for client reporting?",
        "author": "missouribrake

In [2]:
import json
from datetime import datetime

# Cargar los datos desde el archivo JSON
with open('datos_anuncios.json', 'r') as f:
    data = json.load(f)

# Procesar y limpiar los datos
procesados = []
for anuncio in data:
    procesado = {
        'title': anuncio['title'],
        'author': anuncio['author'],
        'score': anuncio['score'],
        'num_comments': anuncio['num_comments'],
        'created_date': datetime.utcfromtimestamp(anuncio['created_utc']).strftime('%Y-%m-%d %H:%M:%S')
    }
    procesados.append(procesado)

# Guardar los datos procesados en un nuevo archivo JSON
with open('datos_anuncios_procesados.json', 'w') as f:
    json.dump(procesados, f, indent=4)
print("Datos procesados guardados en 'datos_anuncios_procesados.json'")


Datos procesados guardados en 'datos_anuncios_procesados.json'


In [3]:
import json

# Cargar los datos desde el archivo JSON
with open('datos_anuncios_procesados.json', 'r') as f:
    data = json.load(f)

# Mostrar algunos ejemplos de datos para entender la estructura
print("Ejemplo de datos de anuncios:")
print(json.dumps(data[:5], indent=4))

# Extraer información relevante de los anuncios (ejemplo: título, score, número de comentarios)
informacion_anuncios = []
for anuncio in data:
    info_anuncio = {
        'title': anuncio['title'],
        'score': anuncio['score'],
        'num_comments': anuncio['num_comments']
        # Puedes añadir más campos según la información disponible y relevante
    }
    informacion_anuncios.append(info_anuncio)

# Mostrar la información extraída
print("\nInformación extraída de los anuncios:")
print(json.dumps(informacion_anuncios[:5], indent=4))

# Guardar los datos extraídos en un archivo JSON
with open('informacion_anuncios.json', 'w') as f:
    json.dump(informacion_anuncios, f, indent=4)
print("\nDatos extraídos guardados en 'informacion_anuncios.json'")


Ejemplo de datos de anuncios:
[
    {
        "title": "New Job Listings",
        "author": "AutoModerator",
        "score": 5,
        "num_comments": 2,
        "created_date": "2024-07-09 19:12:08"
    },
    {
        "title": "Looking for community feedback",
        "author": "JonODonovan",
        "score": 13,
        "num_comments": 1,
        "created_date": "2024-06-18 17:20:59"
    },
    {
        "title": "Best YT channels for keeping up with new ads?",
        "author": "ArchStLou15",
        "score": 20,
        "num_comments": 13,
        "created_date": "2024-07-17 14:26:43"
    },
    {
        "title": "I graduated in May this year with a degree in Economics... only to realize that I hate Economics and now wish to try to break into Advertising. How can I best do this?",
        "author": "OhioOhO",
        "score": 0,
        "num_comments": 14,
        "created_date": "2024-07-18 00:55:28"
    },
    {
        "title": "How to connect dashboards to slide decks for

In [4]:
# Calcular estadísticas básicas
puntajes = [anuncio['score'] for anuncio in informacion_anuncios]
num_anuncios = len(puntajes)
promedio_puntajes = sum(puntajes) / num_anuncios if num_anuncios > 0 else 0

# Mostrar estadísticas básicas
print(f"\nEstadísticas básicas:")
print(f"Número total de anuncios: {num_anuncios}")
print(f"Promedio de puntajes: {promedio_puntajes:.2f}")

# Procesar y limpiar los datos (en este caso, no se requiere limpieza adicional porque ya hemos procesado los datos)

# Guardar las estadísticas básicas en un archivo JSON
estadisticas_basicas = {
    'num_anuncios': num_anuncios,
    'promedio_puntajes': promedio_puntajes
}

with open('estadisticas_basicas.json', 'w') as f:
    json.dump(estadisticas_basicas, f, indent=4)
print("\nEstadísticas básicas guardadas en 'estadisticas_basicas.json'")



Estadísticas básicas:
Número total de anuncios: 27
Promedio de puntajes: 5.70

Estadísticas básicas guardadas en 'estadisticas_basicas.json'


In [5]:
import json
from datetime import datetime

# Cargar los datos desde el archivo JSON
with open('datos_anuncios_procesados.json', 'r') as f:
    data = json.load(f)

# Procesar y calcular la duración de la publicación
hoy = datetime.now()
for anuncio in data:
    if 'created_date' in anuncio:
        try:
            fecha_publicacion = datetime.strptime(anuncio['created_date'], '%Y-%m-%d %H:%M:%S')
            duracion_horas = (hoy - fecha_publicacion).total_seconds() / 3600  # Duración en horas
            anuncio['duracion_horas'] = duracion_horas
        except ValueError as e:
            print(f"Error al convertir la fecha para anuncio: {e}")
    else:
        print("Advertencia: 'created_date' no encontrado en un elemento.")

# Guardar los datos actualizados en un archivo JSON
with open('datos_anuncios_actualizados.json', 'w') as f:
    json.dump(data, f, indent=4)

# Calcular estadísticas
duracion_promedio = sum(anuncio.get('duracion_horas', 0) for anuncio in data) / len(data)
print(f"Duración promedio de los anuncios: {duracion_promedio:.2f} horas")


Duración promedio de los anuncios: 84.94 horas


In [6]:
import requests
import json

# URL de la API de Reddit para obtener información sobre anuncios en el subreddit 'advertising'
url = "https://www.reddit.com/r/advertising/.json"
headers = {'User-agent': 'Mozilla/5.0'}

try:
    response = requests.get(url, headers=headers)
    response.raise_for_status()
    data = response.json()
    
    # Simulación de información relevante de los anuncios
    anuncios = []
    for post in data['data']['children']:
        anuncio = {
            'title': post['data']['title'],
            'author': post['data']['author'],
            'score': post['data']['score'],
            'num_comments': post['data']['num_comments'],
            'created_utc': post['data']['created_utc'],
            # Información de marketing simulada
            'impressions': post['data'].get('impressions', 0),  # Suponiendo que este campo podría estar disponible
            'clicks': post['data'].get('clicks', 0),            # Suponiendo que este campo podría estar disponible
            'cost': post['data'].get('cost', 0)                 # Suponiendo que este campo podría estar disponible
        }
        anuncios.append(anuncio)
    
    # Verifica la estructura de los datos
    print("Datos extraídos:")
    print(json.dumps(anuncios, indent=4))
    
    # Guardar los datos en un archivo JSON
    with open('datos_anuncios.json', 'w') as f:
        json.dump(anuncios, f, indent=4)
    print("Datos guardados en 'datos_anuncios.json'")
except requests.exceptions.RequestException as e:
    print(f"Error al realizar la solicitud: {e}")
except json.JSONDecodeError as e:
    print(f"Error al decodificar la respuesta JSON: {e}")
except Exception as e:
    print(f"Error inesperado: {e}")

Datos extraídos:
[
    {
        "title": "New Job Listings",
        "author": "AutoModerator",
        "score": 4,
        "num_comments": 2,
        "created_utc": 1720552328.0,
        "impressions": 0,
        "clicks": 0,
        "cost": 0
    },
    {
        "title": "Looking for community feedback",
        "author": "JonODonovan",
        "score": 13,
        "num_comments": 1,
        "created_utc": 1718731259.0,
        "impressions": 0,
        "clicks": 0,
        "cost": 0
    },
    {
        "title": "Best YT channels for keeping up with new ads?",
        "author": "ArchStLou15",
        "score": 20,
        "num_comments": 13,
        "created_utc": 1721226403.0,
        "impressions": 0,
        "clicks": 0,
        "cost": 0
    },
    {
        "title": "I graduated in May this year with a degree in Economics... only to realize that I hate Economics and now wish to try to break into Advertising. How can I best do this?",
        "author": "OhioOhO",
        "score