In [43]:

codigo_html = """
<!DOCTYPE html>
<html lang="es">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>CIENCIA DE DATOS</title>
    <style>
        body {
            background-color: #d0e8f2; /* Color de fondo */
            font-family: Arial, sans-serif;
            color: #333333; /* Color de texto */
        }
        header {
            text-align: center;
            padding: 1.5rem;
            background-color: #1e3d59; /* Color de encabezado */
            color: white;
        }
        section {
            margin: 20px;
            padding: 20px;
            border: 1px solid #ccc;
            border-radius: 10px;
            background-color: #ffffff; /* Fondo blanco para secciones */
        }
        h1 {
            color: #ffffff; /* Color blanco del título */
            font-size: 3rem; /* Tamaño grande del título */
            font-weight: bold;
            margin-bottom: 0;
        }
        h2, h3 {
            color: #1e3d59; /* Color oscuro para subtítulos */
            text-align: center; /* Centrar títulos secundarios */
            margin: 20px 0; /* Espacio superior e inferior para los títulos */
        }
        a {
            color: #0077b6; /* Color azul para los enlaces */
            text-decoration: none;
        }
        a:hover {
            color: #005f8c; /* Enlaces cuando se pasa el cursor */
        }
        pre {
            background-color: #f4f4f4; /* Fondo gris claro para el código */
            padding: 10px;
            border-radius: 5px;
            overflow-x: auto;
        }
    </style>
</head>
<body>

<header>
    <h1>CIENCIA DE DATOS</h1>
</header>

<section id="WEBSCRAPING">
    <h2>WEB SCRAPING</h2>
    <p>El web scraping es una técnica para extraer información de sitios web mediante programas que simulan la navegación.</p>
    <p><strong>Contexto:</strong> En la era de la información en línea, extraer datos de páginas web es vital para obtener insights significativos. Por ejemplo, una empresa puede requerir datos sobre precios de productos para realizar análisis de competencia.</p>
    <img src="ruta/a/tu/imagen_webscraping.jpg" alt="Webscraping" style="width:100%; height:auto;">
    <p>En este <a href="https://medium.com/geekculture/web-scraping-with-python-a-complete-step-by-step-guide-code-5174e52340ea">enlace</a> encontrarás más información sobre el web scraping.</p>
    <pre>
      <p>VIDEO <a href="https://youtu.be/WXK0u2yXLrU?si=AQNwymOhtPa49bDj">LINK DIRECTO</a>

import requests
from bs4 import BeautifulSoup

url = 'https://example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
data = soup.find_all('p')
for paragraph in data:
    print(paragraph.text)
    </pre>
</section>

<section id="Visualizacion">
    <h2>Técnicas de Visualización</h2>
    <p>Las técnicas de visualización de datos representan información de manera gráfica, lo que facilita su análisis e interpretación.</p>
    <p><strong>Contexto:</strong> Al tratar con grandes volúmenes de datos, puede ser complicado identificar patrones. Las visualizaciones ayudan a analistas y tomadores de decisiones a comprender mejor la información de un vistazo.</p>
    <img src="ruta/a/tu/imagen_visualizacion.jpg" alt="Visualización" style="width:100%; height:auto;">
    <p>En este <a href="https://www.tableau.com/es-es/learn/articles/data-visualization">enlace</a> puedes ver ejemplos de visualización.</p>
    <pre>
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

# Ejemplo de datos
data = pd.DataFrame({
    'categoría': ['A', 'B', 'C'],
    'valores': [10, 20, 15]
})

sns.barplot(x='categoría', y='valores', data=data)
plt.title('Ejemplo de Visualización')
plt.show()
    </pre>
</section>

<section id="TENDENCIA-CENTRAL">
    <h2>MEDIDAS DE TENDENCIA CENTRAL</h2>
    <p>Las medidas de tendencia central, como la media, mediana y moda, son estadísticas que describen el centro de un conjunto de datos.</p>
    <p><strong>Contexto:</strong> Comprender el centro de un conjunto de datos es crucial para el análisis. Por ejemplo, en estudios demográficos, estas medidas ayudan a resumir información y facilitar comparaciones.</p>
    <img src="ruta/a/tu/imagen_tendencia_central.jpg" alt="Tendencia Central" style="width:100%; height:auto;">
    <p>En este <a href="https://www.probabilidadyestadistica.net/medidas-de-tendencia-central/">enlace</a> encontrarás más ejemplos de medidas de tendencia central.</p>
    <pre>
      <p>VIDEO <a href="https://youtu.be/KFB5mWICDeQ?si=bBXW_JBYjslbkO9B">LINK DIRECTO</a>
import numpy as np
import pandas as pd

data = [1, 2, 2, 3, 4, 5]
mean = np.mean(data)
median = np.median(data)
mode = pd.Series(data).mode()[0]

print(f"Media: {mean}, Mediana: {median}, Moda: {mode}")
    </pre>
</section>

<section id="Disersion">
    <h2>Medidas de Dispersión</h2>
    <p>Las medidas de dispersión, como la varianza y la desviación estándar, indican la variabilidad de los datos respecto a la media.</p>
    <p><strong>Contexto:</strong> Comprender la variabilidad es esencial en campos como la estadística y la investigación. Por ejemplo, en un análisis de calidad, conocer la dispersión de los resultados puede influir en la interpretación de la eficacia de un producto.</p>
    <img src="ruta/a/tu/imagen_dispersión.jpg" alt="Dispersión" style="width:100%; height:auto;">
    <p>Visita este <a href="https://www.lifeder.com/medidas-de-dispersion/">enlace</a> para más información sobre el tema.</p>
    <pre>
import numpy as np

data = [1, 2, 2, 3, 4, 5]
variance = np.var(data)
std_dev = np.std(data)

print(f"Varianza: {variance}, Desviación estándar: {std_dev}")
    </pre>
</section>

<section id="Conclusiones">
    <h2>CONCLUSIONES</h2>
    <p>En esta actividad se exploraron conceptos clave en ciencia de datos, comenzando con el web scraping como herramienta esencial para extraer información de la web y su aplicación en el análisis de datos.
     Se destacó la importancia de la visualización de datos, que permite a los analistas identificar patrones y tomar decisiones informadas.</p>
    <p>Asimismo, se explicaron las medidas de tendencia central y dispersión, que son fundamentales para describir y entender los datos.
     La media, mediana y moda ofrecen una visión general del comportamiento de los datos, mientras que la varianza y desviación estándar permiten comprender la variabilidad en los conjuntos de datos.
    Estos elementos son cruciales en el análisis y la interpretación de datos en diversas áreas, incluyendo negocios, ciencias sociales y tecnología
    PROPORCIONO ALGUNOS LINK DE EJERCICIOS PRACTICOS  <p> <a href="https://colab.research.google.com/drive/1sjzVLD2FhjDR-wzVzomBgI4Or9eudwqu?usp=sharing">LINK DIRECTO</a>.</p><p>MEDIDAS DE DISPERSION <a href="https://colab.research.google.com/drive/19zRvfevN-TUVmJG-IR6skj_bwlh8maVH?usp=sharing">LINK DIRECTO</a>
</section>
 <p>Informacion Extra <a href="https://www.w3schools.com/python/python_lists_access.asp">LINK DIRECTO</a>
</body>
</html>
"""

with open("actividad_ciencia_datos.html", "w") as f:
    f.write(codigo_html)


display(HTML("actividad_ciencia_datos.html"))
