<h1>Herramientas para la Ciencia de Datos</h1>

En este cuaderno de Jupyter, exploraremos el análisis de datos con Python. Abordaremos conceptos básicos como la lectura de datos, la limpieza, la manipulación y la visualización. También aprenderemos a utilizar algunas herramientas populares de la ciencia de datos como NumPy, Pandas y Matplotlib.

<strong>A. Enumerar los lenguajes de la ciencia de datos.</strong>

<li type="disc">Python</li>

Lenguaje de propósito general, fácil de aprender y usar.
Amplia comunidad de usuarios y desarrolladores.
Gran cantidad de bibliotecas y frameworks para ciencia de datos, como NumPy, Pandas, Scikit-learn, TensorFlow y PyTorch.

<li type="disc">R</li>

Lenguaje especializado en análisis estadístico y visualización de datos.
Entorno de desarrollo integrado (RStudio) que facilita el trabajo.
Amplia gama de paquetes para análisis de datos, aprendizaje automático y visualización.
    
<li type="disc">SQL</li>

Lenguaje de consulta para bases de datos.
Esencial para trabajar con datos almacenados en bases de datos relacionales.
Permite realizar operaciones como seleccionar, insertar, actualizar y eliminar datos.
    
Otros lenguajes que se pueden utilizar en ciencia de datos son:

<li type="disc"> Java: Lenguaje robusto y escalable, utilizado para aplicaciones de Big Data.</li>
<li type="disc">Scala: Lenguaje similar a Java, con características que lo hacen ideal para el procesamiento de datos a gran escala.</li>
<li type="disc">Julia: Lenguaje relativamente nuevo, diseñado para ser rápido y eficiente para la ciencia de datos.</li>



























<strong>B. Enumerar los bibliotecas de ciencia de datos.</strong>

<ol>
  <li>Python:</li>
  <ul>
    <li type="disc">NumPy: Para computación científica con matrices.</li>
    <li type="disc">Pandas: Para análisis y manipulación de datos.</li>
    <li type="disc">Scikit-learn: Para aprendizaje automático.</li>
    <li type="disc">TensorFlow: Para aprendizaje profundo.</li>
    <li type="disc">PyTorch: Para aprendizaje profundo.</li>
    <li type="disc">Matplotlib: Para visualización de datos.</li>
    <li type="disc">Seaborn: Para visualización de datos.</li>
  </ul>
  <li>R:</li>
  <ul>
    <li type="disc">base R: Funciones básicas para análisis estadístico y visualización de datos.</li>
    <li type="disc">ggplot2: Para visualización de datos.</li>
    <li type="disc">tidyverse: Conjunto de paquetes para análisis de datos.</li>
    <li type="disc">caret: Para aprendizaje automático.</li>
    <li type="disc">xgboost: Para aprendizaje automático.</li>
  </ul>
</ol>

<strong>C. Tabla de herramientas de Ciencia de Datos</strong>

<table>
  <tr>
    <th>Lenguaje</th>
    <th>Herramienta</th>
    <th>Descripción</th>
  </tr>
  <tr>
    <td>Python</td>
    <td>NumPy</td>
    <td>Para computación científica con matrices.</td>
  </tr>
  <tr>
    <td>Python</td>
    <td>Pandas</td>
    <td>Para análisis y manipulación de datos.</td>
  </tr>
  <tr>
    <td>Python</td>
    <td>Scikit-learn</td>
    <td>Para aprendizaje automático.</td>
  </tr>
  <tr>
    <td>Python</td>
    <td>TensorFlow</td>
    <td>Para aprendizaje profundo.</td>
  </tr>
  <tr>
    <td>Python</td>
    <td>PyTorch</td>
    <td>Para aprendizaje profundo.</td>
  </tr>
  <tr>
    <td>Python</td>
    <td>Matplotlib</td>
    <td>Para visualización de datos.</td>
  </tr>
  <tr>
    <td>Python</td>
    <td>Seaborn</td>
    <td>Para visualización de datos.</td>
  </tr>
  <tr>
    <td>R</td>
    <td>base R</td>
    <td>Funciones básicas para análisis estadístico y visualización de datos.</td>
  </tr>
  <tr>
    <td>R</td>
    <td>ggplot2</td>
    <td>Para visualización de datos.</td>
  </tr>
  <tr>
    <td>R</td>
    <td>tidyverse</td>
    <td>Conjunto de paquetes para análisis de datos.</td>
  </tr>
  <tr>
    <td>R</td>
    <td>caret</td>
    <td>Para aprendizaje automático.</td>
  </tr>
  <tr>
    <td>R</td>
    <td>xgboost</td>
    <td>Para aprendizaje automático.</td>
  </tr>
  <tr>
    <td>SQL</td>
    <td>MySQL</td>
    <td>Sistema de gestión de bases de datos relacionales.</td>
  </tr>
  <tr>
    <td>SQL</td>
    <td>PostgreSQL</td>
    <td>Sistema de gestión de bases de datos relacionales.</td>
  </tr>
  <tr>
    <td>SQL</td>
    <td>Oracle</td>
    <td>Sistema de gestión de bases de datos relacionales.</td>
  </tr>
  <tr>
    <td>SQL</td>
    <td>Microsoft SQL Server</td>
    <td>Sistema de gestión de bases de datos relacionales.</td>
  </tr>
  <tr>
    <td>Otros</td>
    <td>Apache Spark</td>
    <td>Framework para el procesamiento de datos a gran escala.</td>
  </tr>
  <tr>
    <td>Otros</td>
    <td>Apache Hadoop</td>
    <td>Sistema de archivos distribuidos para Big Data.</td>
  </tr>
  <tr>
    <td>Otros</td>
    <td>Kafka</td>
    <td>Plataforma de streaming de datos.</td>
  </tr>
</table>


<strong>D. Introduciendo ejemplos de expresiones aritméticas.</strong>
<li>Suma: 2 + 3 = 5</li>

In [4]:
#Operacion aritmetica combinada
(3*2)+6

12

In [18]:
#Convertir minutos a horas
def convertir_minutos_a_horas(minutos):
  horas = minutos // 60
  minutos_restantes = minutos % 60
  return horas, minutos_restantes

# Ejemplo de uso
minutos = int(input("Ingrese el número de minutos: "))
horas, minutos_restantes = convertir_minutos_a_horas(minutos)
print(f"{minutos} minutos equivalen a {horas} horas y {minutos_restantes} minutos.")

Ingrese el número de minutos:  120


120 minutos equivalen a 2 horas y 0 minutos.


In [19]:
#Listar objetos
def listar_objetivos(objetivos):
    print("Lista de Objetivos:")
    for i, objetivo in enumerate(objetivos, start=1):
        print(f"{i}. {objetivo}")

# Ejemplo de uso
objetivos = [
    "Aprender un nuevo lenguaje de programación.",
    "Mejorar mis habilidades de comunicación.",
    "Conseguir un nuevo empleo.",
    "Viajar a un nuevo país.",
    "Hacer ejercicio regularmente.",
]
listar_objetivos(objetivos)

Lista de Objetivos:
1. Aprender un nuevo lenguaje de programación.
2. Mejorar mis habilidades de comunicación.
3. Conseguir un nuevo empleo.
4. Viajar a un nuevo país.
5. Hacer ejercicio regularmente.


<strong> Autor : Luis Felipe Gallegos Ayuque </strong>