# ‚ú® El Viaje de la Cient√≠fica de Datos: D√≠a 1 - Desvelando Python y el Poder de Pandas ‚ú®
## Este es el primer paso oficial en mi emocionante aventura para convertirme en una gran cientifica de datos. Aqu√≠, no solo sentaremos las bases t√©cnicas, sino que tambi√©n despertaremos nuestra intuici√≥n para encontrar historias fascinantes en los datos.
### **En la agenda de hoy:**
- Aprendiendo qu√© hace una cient√≠fica de datos.
- Escribiendo mis primeras l√≠neas en Python.
- Explorando un peque√±o dataset m√°gico.


### Una cient√≠fica de datos es como una detective del mundo moderno. Usa datos (n√∫meros, textos, im√°genes, etc.) para responder preguntas, resolver problemas y ayudar a tomar decisiones importantes. Por ejemplo:

* ¬øQu√© tipo de m√∫sica recomendarle a alguien?

* ¬øQu√© clientes podr√≠an cancelar un servicio?

* ¬øQu√© regiones necesitan m√°s ayuda m√©dica?


### El trabajo se puede dividir en pasos, como si fuera una receta de magia:

* **Recolectar datos:** Buscar datos en bases de datos, APIs, sensores, archivos CSV, encuestas, etc.

* **Limpiar y preparar los datos:** A veces hay errores, valores perdidos o inconsistencias que hay que arreglar. Es como pulir una gema en bruto antes de usarla.

* **Explorar los datos:** Mirar gr√°ficos, promedios, contar cosas. Es como conocer a los personajes de una historia o descifrar pistas ocultas.

* **Modelar:** Usar matem√°ticas y algoritmos para predecir o clasificar. ¬°Aqu√≠ es donde la magia de las predicciones cobra vida!

* **Comunicar resultados:** Explicar lo que encontraste a otras personas (a veces que no saben nada de datos), usando gr√°ficos y lenguaje claro. Es como traducir nuestros hallazgos "m√°gicos" a un lenguaje que todos entiendan.


**Mi Reflexi√≥n:** Lo que m√°s me entusiasma de este rol es la capacidad de transformar n√∫meros y texto en historias y decisiones impactantes. Es como tener una lupa superpoderosa para ver lo que otros no ven.






In [1]:
# Comentarios (no se ejecutan y se escriben as√≠)
# Esto es una l√≠nea de c√≥digo en Python

# Variables (Una variable es como una caja con un nombre.)
# nombre es una variable que guarda un texto: "Luna" (tipo str, string).
# edad guarda el n√∫mero 28 (tipo int, entero).

nombre = "Luna"
edad = 28

# Tipos de datos

es_cientifica = True       # Booleano   # True y False son booleanos: respuestas de s√≠ o no.
puntuacion = 95.5          # 95.5 es un n√∫mero decimal ‚Üí float.
proyectos = ["Kaggle", "Tesis", "Blog de ciencia"]  # Lista. Las listas van entre corchetes [] y pueden guardar varios elementos.

# Imprimir en pantalla
print("Hola, soy", nombre, "y tengo", edad, "a√±os.")  #  print() muestra cosas en pantalla. Sirve para ver lo que hay dentro de variables, o explicar algo.

# Condicionales
if es_cientifica:
    print("¬°Sigue brillando, cient√≠fica de datos!")  # El if pregunta: ‚Äú¬øes esto cierto?‚Äù. Si es_cientifica es True, entonces imprime el mensaje.
    # La sangr√≠a (espacios antes de la l√≠nea) es muy importante en Python.




Hola, soy Luna y tengo 28 a√±os.
¬°Sigue brillando, cient√≠fica de datos!


## Dataset m√°gico con pandas üêº
### Ahora vas a conocer pandas, una librer√≠a de Python que sirve para trabajar con datos en tablas, como si fueran hojas de Excel, pero con superpoderes.

In [2]:
import pandas as pd
# Esto importa la libreria de Pandas y la abreviamos con pd para usarla despues


### Desplegando el Mapa del Tesoro: Conociendo Pandas y los DataFrames

Ahora s√≠, ¬°es hora de adentrarnos en el coraz√≥n de la manipulaci√≥n de datos con **Pandas**! Pandas es como una caja de herramientas suiza para trabajar con tablas. Y la joya de la corona aqu√≠ es el **DataFrame**, nuestra "hoja de c√°lculo supercargada".

#### ¬øPor qu√© el DataFrame es nuestro mejor amigo?

Un DataFrame es una estructura de datos en forma de tabla que nos ofrece la librer√≠a pandas en Python.

Es como una hoja de c√°lculo de Excel o una tabla de Google Sheets, pero con superpoderes: puedes buscar, transformar, filtrar, agrupar, ordenar, y m√°s‚Ä¶ todo con c√≥digo.

### ¬øPor qu√© necesitamos DataFrames?
Porque cuando trabajamos con datos reales, normalmente vienen en forma de tablas:

* Archivos .csv, .xlsx, .json

* Bases de datos SQL

* APIs que devuelven listas estructuradas

### Los DataFrames nos permiten:

* Leer los datos f√°cilmente desde archivos o internet
* Verlos y entenderlos r√°pidamente
* Filtrar, transformar y ordenar los datos
* Calcular estad√≠sticas (medias, m√°ximos, conteos‚Ä¶)
* Agrupar datos para comparar categor√≠as
* Preparar los datos para visualizarlos o modelarlos

### Ventajas del DataFrame
| Ventaja                         | Ejemplo                                               |
|----------------------------------|--------------------------------------------------------|
| Acceder a columnas f√°cilmente   | `df["Nombre"]` devuelve la columna de nombres         |
| Filtrar por condiciones         | `df[df["Edad"] > 30]` muestra personas mayores de 30  |
| Agregar nuevos datos            | Puedes a√±adir filas o columnas nuevas                 |
| Usar funciones como `.mean()`   | `df["Edad"].mean()` calcula la edad promedio          |
| Es compatible con visualizaci√≥n | Puedes graficar usando `matplotlib` o `seaborn`       |


In [13]:
criaturas = pd.DataFrame({
    "Nombre": ["F√©nix", "Drag√≥n", "Unicornio", "Sirena"],
    "Elemento": ["Fuego", "Fuego", "Luz", "Agua"],
    "Poder": [95, 120, 80, 70],
    "Amistoso": [True, False, True, True]
})

criaturas

# Aqu√≠ estamos creando una tabla, usando pd.DataFrame(). Le estamos pasando un diccionario de listas:
# Las claves (como "Nombre", "Elemento") ser√°n las columnas.
# Las listas (["F√©nix", "Drag√≥n", ...]) son los valores de cada fila.

Unnamed: 0,Nombre,Elemento,Poder,Amistoso
0,F√©nix,Fuego,95,True
1,Drag√≥n,Fuego,120,False
2,Unicornio,Luz,80,True
3,Sirena,Agua,70,True


### ¬øQu√© criatura es la m√°s poderosa?

### ¬°Hagamos Preguntas a Nuestros Datos!

Un cient√≠fico de datos no solo mira n√∫meros, sino que les pregunta cosas. Vamos a empezar a "charlar" con nuestro `DataFrame` de criaturas.

#### Pregunta 1: ¬øQui√©n es la criatura con mayor *Poder* en nuestro bestiario?

Vamos a buscar el valor m√°ximo en la columna "Poder". Es como preguntar: "¬øCu√°l es el hechizo m√°s fuerte aqu√≠?".

In [4]:
# Ver la criatura m√°s poderosa
criaturas["Poder"].max()

# .max() busca el n√∫mero m√°s alto en la columna "Poder".


120

### ya sabemos el n√∫mero. Pero, ¬øqu√© criatura posee ese poder supremo? ¬°Vamos a descubrirlo!

In [5]:
#  Esto busca la fila completa donde el "Poder" es igual al m√°ximo. Es decir, te dice qu√© criatura es la m√°s poderosa.
criaturas[criaturas["Poder"] == criaturas["Poder"].max()]


Unnamed: 0,Nombre,Elemento,Poder,Amistoso
1,Drag√≥n,Fuego,120,False


#### Pregunta 2: ¬øQu√© criaturas en nuestro bestiario son consideradas *Amistosas*?

Es hora de filtrar. Queremos ver solo a aquellos seres que no nos dar√°n problemas... o quiz√°s s√≠, pero al menos son amigables seg√∫n nuestros datos.

In [6]:
# Esto muestra todas las criaturas amistosas

criaturas[criaturas["Amistoso"]]


Unnamed: 0,Nombre,Elemento,Poder,Amistoso
0,F√©nix,Fuego,95,True
2,Unicornio,Luz,80,True
3,Sirena,Agua,70,True


#### Pregunta 3: ¬øQu√© *Elemento* es el m√°s com√∫n entre nuestras criaturas?

Vamos a ver qu√© elemento predomina en nuestro grupo. ¬øHay m√°s criaturas de Fuego, Agua, Luz...? Usaremos `value_counts()` para contarlas.

In [7]:
# Esto cuenta cuantas veces aparece cada elemento y asi podemos ver cual es el m√°s com√∫n

criaturas["Elemento"].value_counts()


Unnamed: 0_level_0,count
Elemento,Unnamed: 1_level_1
Fuego,2
Luz,1
Agua,1


## Vamos a crear nuestra propia criatura

## ¬°Momento de Ser Creadores: A√±adiendo una Nueva Criatura!

Hasta ahora hemos explorado, pero la ciencia de datos tambi√©n nos permite *modificar* y *expandir* nuestra realidad (o al menos nuestros datasets). Vamos a introducir una nueva criatura en nuestro bestiario m√°gico.

Primero, la "moldeamos" en su propia peque√±a tabla:

In [8]:
#Primero creamos una tabla con una sola criatura en su interior
nueva = pd.DataFrame({
    "Nombre": ["Quimera"],
    "Elemento": ["Tierra"],
    "Poder": [110],
    "Amistoso": [False]
})



Ahora, la integramos a nuestro bestiario principal. Es como fusionar dos mundos de datos. Aqu√≠ es donde `pd.concat()` entra en acci√≥n, y `ignore_index=True` se asegura de que nuestra nueva criatura tenga su propio lugar sin l√≠os con los n√∫meros de fila.

In [9]:
# A continuacion la unimos a la tabla original para que comience a formar parte de ella asi:

criaturas = pd.concat([criaturas, nueva], ignore_index=True)

# pd.concat() une dos tablas (una debajo de la otra). ignore_index=True reinicia los √≠ndices (los numeritos de la izquierda).


## La Gran Revelaci√≥n: As√≠ Queda Nuestro Bestiario Actualizado

¬°Y aqu√≠ est√°! Nuestro `DataFrame` ha crecido y ahora es hogar de una nueva y poderosa criatura. ¬°Ver para creer!

In [15]:
# ¬°Siempre es bueno verificar el resultado!
criaturas
# Si es la √∫ltima linea de c√≥digo no hace falta poner print, colab te lo ejecuta
# Me gusta m√°s el aspecto que tiene asi que usando print

Unnamed: 0,Nombre,Elemento,Poder,Amistoso
0,F√©nix,Fuego,95,True
1,Drag√≥n,Fuego,120,False
2,Unicornio,Luz,80,True
3,Sirena,Agua,70,True


## Vamos a explicar un poco que hemos hecho en las lineas anteriores

## ¬øQu√© hace pd.concat()?
* pd.concat() sirve para unir dos o m√°s DataFrames.

### En este caso:

* criaturas es tu DataFrame original.

* nueva es otro DataFrame con m√°s criaturas (por ejemplo, una nueva fila que quieres a√±adir).

### pd.concat([criaturas, nueva]) los une por filas (uno debajo del otro, como si pegaras una hoja extra al final).

## ¬øY qu√© significa ignore_index=True?
#### Cuando unes dos DataFrames, pandas intenta mantener el √≠ndice original de cada uno. Esto puede causar duplicados o desorden si no te importa el n√∫mero de fila.
## ¬øQu√© hace ignore_index=True?
#### Le dice a pandas:

* "Ignora los √≠ndices anteriores y vuelve a numerar desde cero."

In [17]:
# Usando print, para comparar como se ven con las diferentes expresiones

print(criaturas)

      Nombre Elemento  Poder  Amistoso
0      F√©nix    Fuego     95      True
1     Drag√≥n    Fuego    120     False
2  Unicornio      Luz     80      True
3     Sirena     Agua     70      True
