# ✨ El Viaje de la Científica de Datos: Día 1 - Desvelando Python y el Poder de Pandas ✨
## Este es el primer paso oficial en mi emocionante aventura para convertirme en una gran cientifica de datos. Aquí, no solo sentaremos las bases técnicas, sino que también despertaremos nuestra intuición para encontrar historias fascinantes en los datos.
### **En la agenda de hoy:**
- Aprendiendo qué hace una científica de datos.
- Escribiendo mis primeras líneas en Python.
- Explorando un pequeño dataset mágico.


### Una científica de datos es como una detective del mundo moderno. Usa datos (números, textos, imágenes, etc.) para responder preguntas, resolver problemas y ayudar a tomar decisiones importantes. Por ejemplo:

* ¿Qué tipo de música recomendarle a alguien?

* ¿Qué clientes podrían cancelar un servicio?

* ¿Qué regiones necesitan más ayuda médica?


### El trabajo se puede dividir en pasos, como si fuera una receta de magia:

* **Recolectar datos:** Buscar datos en bases de datos, APIs, sensores, archivos CSV, encuestas, etc.

* **Limpiar y preparar los datos:** A veces hay errores, valores perdidos o inconsistencias que hay que arreglar. Es como pulir una gema en bruto antes de usarla.

* **Explorar los datos:** Mirar gráficos, promedios, contar cosas. Es como conocer a los personajes de una historia o descifrar pistas ocultas.

* **Modelar:** Usar matemáticas y algoritmos para predecir o clasificar. ¡Aquí es donde la magia de las predicciones cobra vida!

* **Comunicar resultados:** Explicar lo que encontraste a otras personas (a veces que no saben nada de datos), usando gráficos y lenguaje claro. Es como traducir nuestros hallazgos "mágicos" a un lenguaje que todos entiendan.


**Mi Reflexión:** Lo que más me entusiasma de este rol es la capacidad de transformar números y texto en historias y decisiones impactantes. Es como tener una lupa superpoderosa para ver lo que otros no ven.






In [1]:
# Comentarios (no se ejecutan y se escriben así)
# Esto es una línea de código en Python

# Variables (Una variable es como una caja con un nombre.)
# nombre es una variable que guarda un texto: "Luna" (tipo str, string).
# edad guarda el número 28 (tipo int, entero).

nombre = "Luna"
edad = 28

# Tipos de datos

es_cientifica = True       # Booleano   # True y False son booleanos: respuestas de sí o no.
puntuacion = 95.5          # 95.5 es un número decimal → float.
proyectos = ["Kaggle", "Tesis", "Blog de ciencia"]  # Lista. Las listas van entre corchetes [] y pueden guardar varios elementos.

# Imprimir en pantalla
print("Hola, soy", nombre, "y tengo", edad, "años.")  #  print() muestra cosas en pantalla. Sirve para ver lo que hay dentro de variables, o explicar algo.

# Condicionales
if es_cientifica:
    print("¡Sigue brillando, científica de datos!")  # El if pregunta: “¿es esto cierto?”. Si es_cientifica es True, entonces imprime el mensaje.
    # La sangría (espacios antes de la línea) es muy importante en Python.




Hola, soy Luna y tengo 28 años.
¡Sigue brillando, científica de datos!


## Dataset mágico con pandas 🐼
### Ahora vas a conocer pandas, una librería de Python que sirve para trabajar con datos en tablas, como si fueran hojas de Excel, pero con superpoderes.

In [2]:
import pandas as pd
# Esto importa la libreria de Pandas y la abreviamos con pd para usarla despues


### Desplegando el Mapa del Tesoro: Conociendo Pandas y los DataFrames

Ahora sí, ¡es hora de adentrarnos en el corazón de la manipulación de datos con **Pandas**! Pandas es como una caja de herramientas suiza para trabajar con tablas. Y la joya de la corona aquí es el **DataFrame**, nuestra "hoja de cálculo supercargada".

#### ¿Por qué el DataFrame es nuestro mejor amigo?

Un DataFrame es una estructura de datos en forma de tabla que nos ofrece la librería pandas en Python.

Es como una hoja de cálculo de Excel o una tabla de Google Sheets, pero con superpoderes: puedes buscar, transformar, filtrar, agrupar, ordenar, y más… todo con código.

### ¿Por qué necesitamos DataFrames?
Porque cuando trabajamos con datos reales, normalmente vienen en forma de tablas:

* Archivos .csv, .xlsx, .json

* Bases de datos SQL

* APIs que devuelven listas estructuradas

### Los DataFrames nos permiten:

* Leer los datos fácilmente desde archivos o internet
* Verlos y entenderlos rápidamente
* Filtrar, transformar y ordenar los datos
* Calcular estadísticas (medias, máximos, conteos…)
* Agrupar datos para comparar categorías
* Preparar los datos para visualizarlos o modelarlos

### Ventajas del DataFrame
| Ventaja                         | Ejemplo                                               |
|----------------------------------|--------------------------------------------------------|
| Acceder a columnas fácilmente   | `df["Nombre"]` devuelve la columna de nombres         |
| Filtrar por condiciones         | `df[df["Edad"] > 30]` muestra personas mayores de 30  |
| Agregar nuevos datos            | Puedes añadir filas o columnas nuevas                 |
| Usar funciones como `.mean()`   | `df["Edad"].mean()` calcula la edad promedio          |
| Es compatible con visualización | Puedes graficar usando `matplotlib` o `seaborn`       |


In [13]:
criaturas = pd.DataFrame({
    "Nombre": ["Fénix", "Dragón", "Unicornio", "Sirena"],
    "Elemento": ["Fuego", "Fuego", "Luz", "Agua"],
    "Poder": [95, 120, 80, 70],
    "Amistoso": [True, False, True, True]
})

criaturas

# Aquí estamos creando una tabla, usando pd.DataFrame(). Le estamos pasando un diccionario de listas:
# Las claves (como "Nombre", "Elemento") serán las columnas.
# Las listas (["Fénix", "Dragón", ...]) son los valores de cada fila.

Unnamed: 0,Nombre,Elemento,Poder,Amistoso
0,Fénix,Fuego,95,True
1,Dragón,Fuego,120,False
2,Unicornio,Luz,80,True
3,Sirena,Agua,70,True


### ¿Qué criatura es la más poderosa?

### ¡Hagamos Preguntas a Nuestros Datos!

Un científico de datos no solo mira números, sino que les pregunta cosas. Vamos a empezar a "charlar" con nuestro `DataFrame` de criaturas.

#### Pregunta 1: ¿Quién es la criatura con mayor *Poder* en nuestro bestiario?

Vamos a buscar el valor máximo en la columna "Poder". Es como preguntar: "¿Cuál es el hechizo más fuerte aquí?".

In [4]:
# Ver la criatura más poderosa
criaturas["Poder"].max()

# .max() busca el número más alto en la columna "Poder".


120

### ya sabemos el número. Pero, ¿qué criatura posee ese poder supremo? ¡Vamos a descubrirlo!

In [5]:
#  Esto busca la fila completa donde el "Poder" es igual al máximo. Es decir, te dice qué criatura es la más poderosa.
criaturas[criaturas["Poder"] == criaturas["Poder"].max()]


Unnamed: 0,Nombre,Elemento,Poder,Amistoso
1,Dragón,Fuego,120,False


#### Pregunta 2: ¿Qué criaturas en nuestro bestiario son consideradas *Amistosas*?

Es hora de filtrar. Queremos ver solo a aquellos seres que no nos darán problemas... o quizás sí, pero al menos son amigables según nuestros datos.

In [6]:
# Esto muestra todas las criaturas amistosas

criaturas[criaturas["Amistoso"]]


Unnamed: 0,Nombre,Elemento,Poder,Amistoso
0,Fénix,Fuego,95,True
2,Unicornio,Luz,80,True
3,Sirena,Agua,70,True


#### Pregunta 3: ¿Qué *Elemento* es el más común entre nuestras criaturas?

Vamos a ver qué elemento predomina en nuestro grupo. ¿Hay más criaturas de Fuego, Agua, Luz...? Usaremos `value_counts()` para contarlas.

In [7]:
# Esto cuenta cuantas veces aparece cada elemento y asi podemos ver cual es el más común

criaturas["Elemento"].value_counts()


Unnamed: 0_level_0,count
Elemento,Unnamed: 1_level_1
Fuego,2
Luz,1
Agua,1


## Vamos a crear nuestra propia criatura

## ¡Momento de Ser Creadores: Añadiendo una Nueva Criatura!

Hasta ahora hemos explorado, pero la ciencia de datos también nos permite *modificar* y *expandir* nuestra realidad (o al menos nuestros datasets). Vamos a introducir una nueva criatura en nuestro bestiario mágico.

Primero, la "moldeamos" en su propia pequeña tabla:

In [8]:
#Primero creamos una tabla con una sola criatura en su interior
nueva = pd.DataFrame({
    "Nombre": ["Quimera"],
    "Elemento": ["Tierra"],
    "Poder": [110],
    "Amistoso": [False]
})



Ahora, la integramos a nuestro bestiario principal. Es como fusionar dos mundos de datos. Aquí es donde `pd.concat()` entra en acción, y `ignore_index=True` se asegura de que nuestra nueva criatura tenga su propio lugar sin líos con los números de fila.

In [9]:
# A continuacion la unimos a la tabla original para que comience a formar parte de ella asi:

criaturas = pd.concat([criaturas, nueva], ignore_index=True)

# pd.concat() une dos tablas (una debajo de la otra). ignore_index=True reinicia los índices (los numeritos de la izquierda).


## La Gran Revelación: Así Queda Nuestro Bestiario Actualizado

¡Y aquí está! Nuestro `DataFrame` ha crecido y ahora es hogar de una nueva y poderosa criatura. ¡Ver para creer!

In [15]:
# ¡Siempre es bueno verificar el resultado!
criaturas
# Si es la última linea de código no hace falta poner print, colab te lo ejecuta
# Me gusta más el aspecto que tiene asi que usando print

Unnamed: 0,Nombre,Elemento,Poder,Amistoso
0,Fénix,Fuego,95,True
1,Dragón,Fuego,120,False
2,Unicornio,Luz,80,True
3,Sirena,Agua,70,True


## Vamos a explicar un poco que hemos hecho en las lineas anteriores

## ¿Qué hace pd.concat()?
* pd.concat() sirve para unir dos o más DataFrames.

### En este caso:

* criaturas es tu DataFrame original.

* nueva es otro DataFrame con más criaturas (por ejemplo, una nueva fila que quieres añadir).

### pd.concat([criaturas, nueva]) los une por filas (uno debajo del otro, como si pegaras una hoja extra al final).

## ¿Y qué significa ignore_index=True?
#### Cuando unes dos DataFrames, pandas intenta mantener el índice original de cada uno. Esto puede causar duplicados o desorden si no te importa el número de fila.
## ¿Qué hace ignore_index=True?
#### Le dice a pandas:

* "Ignora los índices anteriores y vuelve a numerar desde cero."

In [17]:
# Usando print, para comparar como se ven con las diferentes expresiones

print(criaturas)

      Nombre Elemento  Poder  Amistoso
0      Fénix    Fuego     95      True
1     Dragón    Fuego    120     False
2  Unicornio      Luz     80      True
3     Sirena     Agua     70      True
