In [None]:
import csv

with open('data.csv', mode='r') as file:
    csv_reader = csv.DictReader(file)
    for row in csv_reader:
        print(row)


In [None]:
import json

with open('data.json', 'r') as file:
    data = json.load(file)
    print(data)

In [None]:
import pandas as pd

# Cargar datos desde un archivo CSV
df = pd.read_csv('data.csv')

# Mostrar las primeras filas del DataFrame
df.head()

In [None]:
import requests
from bs4 import BeautifulSoup

# URL de la página de Wikipedia sobre Python
url = 'https://es.wikipedia.org/wiki/Python'

# Descargar la página web
response = requests.get(url)

# Analizar el contenido HTML
soup = BeautifulSoup(response.content, 'html.parser')

# Encontrar el contenido principal de la página
content = soup.find('div', {'class': 'mw-parser-output'})

# Extraer y mostrar el zen de python
for paragraph in content.find_all('li'):
    print(paragraph.get_text())


In [None]:
import pymysql

# Conectarse a la base de datos MySQL
conn = pymysql.connect(
    host='localhost',
    user='tu_usuario',
    passwd='tu_contraseña',
    db='mi_base_de_datos'
)

# Crear un cursor
cur = conn.cursor()

# Crear una tabla
cur.execute('''
    CREATE TABLE IF NOT EXISTS Ventas (
        id INTEGER PRIMARY KEY,
        Fecha DATE,
        Producto VARCHAR(100),
        Cantidad_Vendida INT,
        Precio_Unitario INT, 
        Total_Ventas INT,
        Region VARCHAR(80)
    )
''')

# Insertar datos
cur.execute('''
    INSERT INTO  Ventas (Producto, Cantidad_Vendida, Precio_Unitario, Total_Ventas, Region)
    VALUES ('2022/01/01','Producto A', 100, 10, 1000, 'Norte')
''')

# Guardar los cambios
conn.commit()

# Realizar una consulta
cur.execute('SELECT * FROM Ventas')

# Obtener todos los resultados de la consulta
rows = cur.fetchall()

# Imprimir los resultados
for row in rows:
    print(row)

# Cerrar la conexión
conn.close()

In [None]:
import pandas as pd

df = pd.read_csv("data.csv")
print(df.info())
print(df.describe())
print(df.isnull().sum())

In [None]:
import pandas as pd

df = pd.read_csv("data.csv")

# Eliminación de valores nulos
df.dropna(inplace=True)

# Cambio de tipo de datos
df['Total de Ventas'] = df['Total de Ventas'].astype(int)

# Aplicación de funciones
df['IVA'] = df['Precio Unitario'].apply(lambda x: x * 0.18)

#Creación de nuevas Columnas
df['Precio Con IVA'] = df['Precio Unitario'] + df['IVA']

#Costo unitario
df['Costo Unitario'] = df['Precio Unitario'] - (df['Precio Unitario'] * 0.30)
df

In [None]:
import numpy as np

array = np.array([1, 2, 3, 4])
print(array * 2)

In [None]:
from scipy import stats

data = [1, 2, 3, 4, 5, 6, 7, 8, 9]
print(stats.describe(data))

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Asegurarse de que los gráficos se muestran dentro del notebook
%matplotlib inline

# Gráfico de líneas de Total de Ventas por Fecha de Venta
plt.figure(figsize=(8, 4))
plt.plot(df['Fecha de Venta'], df['Total de Ventas'], marker='o')
plt.title('Total de Ventas por Fecha de Venta')
plt.xlabel('Fecha de Venta')
plt.ylabel('Total de Ventas')
plt.xticks(rotation=45)
plt.grid(True)
plt.show()

In [None]:
import seaborn as sns

# Gráfico de barras del Total de Ventas por Región
plt.figure(figsize=(8, 4))
sns.barplot(x='Región', y='Total de Ventas', data=df)
plt.title('Total de Ventas por Región')
plt.xlabel('Región')
plt.ylabel('Total de Ventas')
plt.show()

In [None]:
#PREPRACIÓN DE LOS DATOS
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Seleccionar características (features) y la variable objetivo (target)
X = df[['Precio Unitario', 'Total de Ventas', 'IVA', 'Precio Con IVA', 'Costo Unitario']]
y = df['Cantidad Vendida']

# Dividir el dataset en conjunto de entrenamiento y conjunto de prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Escalar las características
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

#ENTRENAMIENTO DEL MODELO
from sklearn.linear_model import LinearRegression

# Crear y entrenar el modelo
model = LinearRegression()
model.fit(X_train_scaled, y_train)

#EVALUACION DEL MODELO
from sklearn.metrics import mean_squared_error, r2_score

# Hacer predicciones
y_pred = model.predict(X_test_scaled)

# Evaluar el modelo
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f'Mean Squared Error: {mse}')
print(f'R^2 Score: {r2}')