# FORMATOS DE ARCHIVOS E IMPORTACIÓN DE DATOS

## Importar la librería

In [5]:
import pandas as pd

## Estructuras básicas

### Series

In [7]:
s = pd.Series([1, 3, 5, 7, 9])
s

0    1
1    3
2    5
3    7
4    9
dtype: int64

### DataFrame

In [None]:
data = {'Nombre': ['Ana', 'Luis', 'Carlos'],
        'Edad': [23, 30, 25],
        'Ciudad': ['CDMX', 'Monterrey', 'Guadalajara']}
df = pd.DataFrame(data)
df

## Leer y escribir archivos

### Leer archivos

In [None]:
df = pd.read_csv("archivo.csv")  # Leer un CSV
df = pd.read_excel("archivo.xlsx")  # Leer un Excel
df = pd.read_json("archivo.json")  # Leer un JSON

### Guardar archivos

In [None]:
df.to_csv("archivo_nuevo.csv", index=False)
df.to_excel("archivo_nuevo.xlsx", index=False)

## Inspeccionar el DataFrame

In [None]:
df.head()  # Muestra las primeras 5 filas
df.tail()  # Muestra las últimas 5 filas
df.info()  # Información general del DataFrame
df.describe()  # Estadísticas descriptivas
df.shape  # Tamaño del DataFrame (filas, columnas)

## Selección de datos

### Seleccionar columnas

In [None]:
df["Nombre"]  # Selecciona una columna
df[["Nombre", "Edad"]]  # Selecciona múltiples columnas

### Seleccionar filas

In [None]:
df.iloc[0]  # Primera fila (index basado en posición)
df.loc[0]   # Primera fila (index basado en etiquetas)

### Filtrado de datos

In [None]:
df[df["Edad"] > 25]  # Filtrar personas con edad mayor a 25

## Modificar datos

### Añadir una nueva columna

In [None]:
df["Salario"] = [50000, 60000, 55000]

### Eliminar columnas o filas

In [None]:
df.drop(columns=["Ciudad"], inplace=True)  # Eliminar columna
df.drop(index=0, inplace=True)  # Eliminar primera fila

### Renombrar columnas

In [None]:
df.rename(columns={"Nombre": "Nombre_Completo"}, inplace=True)

## Manejo de valores nulos

In [None]:
df.isnull().sum()  # Contar valores nulos por columna
df.dropna(inplace=True)  # Eliminar filas con valores nulos
df.fillna("Desconocido", inplace=True)  # Rellenar valores nulos

## Operaciones estadísticas


In [None]:
df["Edad"].mean()  # Promedio
df["Edad"].sum()   # Suma total
df["Edad"].min()   # Mínimo
df["Edad"].max()   # Máximo
df["Edad"].std()   # Desviación estándar

## Agrupación de datos

In [None]:
df.groupby("Ciudad")["Edad"].mean()  # Promedio de edad por ciudad

## Ordenar valores

In [None]:
df.sort_values(by="Edad", ascending=False, inplace=True)  # Ordenar por edad descendente