<a href="https://colab.research.google.com/github/Gus86git/prueba-datataset/blob/main/GB_Clase_5_Otros_Formatos_de_Bases_de_Datos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Acceder a Bases relacionales desde Pandas**

In [1]:
from google.colab import drive
import os
drive.mount('/content/gdrive')
# Establecer ruta de acceso en dr
import os
print(os.getcwd())
os.chdir("/content/gdrive/My Drive")

Mounted at /content/gdrive
/content


**Uso con sqlite3:**

In [2]:
import sqlite3
import pandas as pd

In [3]:
# Conectar a la base de datos
conn = sqlite3.connect('/content/nba_salary.sqlite')

In [4]:
sql= "SELECT name FROM sqlite_master WHERE type='table'"
# Leer el archivo sqllite y convertirlo a dataframe
conn =sqlite3.connect("nba_salary.sqlite")
df=pd.read_sql_query(sql,conn)
# Verificar el resultado en un dataframe
print(df)
conn.close()

                    name
0  NBA_season1718_salary
1          Seasons_Stats


In [5]:
# Cargar los datos de la tabla (cambia 'nombre_de_la_tabla' por el nombre de la tabla real)
conn =sqlite3.connect("nba_salary.sqlite")
df=pd.read_sql_query('SELECT * FROM NBA_season1718_salary',conn)
df.head()

Unnamed: 0,X1,Player,Tm,season17_18
0,1.0,Stephen Curry,GSW,34682550.0
1,2.0,LeBron James,CLE,33285709.0
2,3.0,Paul Millsap,DEN,31269231.0
3,4.0,Gordon Hayward,BOS,29727900.0
4,5.0,Blake Griffin,DET,29512900.0


In [6]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 573 entries, 0 to 572
Data columns (total 4 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   X1           573 non-null    float64
 1   Player       573 non-null    object 
 2   Tm           573 non-null    object 
 3   season17_18  573 non-null    float64
dtypes: float64(2), object(2)
memory usage: 18.0+ KB


**Uso con sqlalchemy** :

In [7]:
from sqlalchemy import create_engine

# Crear el motor de conexión
engine = create_engine('sqlite:///nba_salary.sqlite')

# Conectar y leer datos
df = pd.read_sql("SELECT * FROM NBA_season1718_salary", engine)

# Mostrar los primeros registros
df.head()

Unnamed: 0,X1,Player,Tm,season17_18
0,1.0,Stephen Curry,GSW,34682550.0
1,2.0,LeBron James,CLE,33285709.0
2,3.0,Paul Millsap,DEN,31269231.0
3,4.0,Gordon Hayward,BOS,29727900.0
4,5.0,Blake Griffin,DET,29512900.0


**Conectar a MySQL con SQLAlchemy**



```
!pip install mysql-connector-python





```
from sqlalchemy import create_engine
import pandas as pd

# Crear el motor de conexión a MySQL
engine = create_engine('mysql+mysqlconnector://username:password@host/dbname')

# Leer datos
df_mysql = pd.read_sql("SELECT * FROM nombre_de_la_tabla", engine)

# Mostrar los primeros registros
df_mysql.head()
```



**Conectar a una base de datos Oracle con cx_Oracle**

Para conectarse a Oracle, necesitarás la librería cx_Oracle y las credenciales de la base de datos (host, puerto, SID o servicio).



```
!pip install cx_Oracle
```





```
import cx_Oracle

# Crear la conexión
dsn_tns = cx_Oracle.makedsn('hostname', 'port', service_name='service_name')
conn = cx_Oracle.connect(user='username', password='password', dsn=dsn_tns)

# Leer datos
df_oracle = pd.read_sql("SELECT * FROM nombre_de_la_tabla", conn)

# Mostrar los primeros registros
print(df_oracle.head())

# Cerrar la conexión
conn.close()
```



**Microsoft SQL Server con pyODBC**

Para conectarse a una base de datos Microsoft SQL Server, se puede usar pyODBC. Necesitas instalar el driver ODBC adecuado y tener acceso a una base de datos de SQL Server.


```
!pip install pyodbc
```




```
import pyodbc
import pandas as pd

# Crear la conexión a SQL Server
conn = pyodbc.connect(
    'DRIVER={ODBC Driver 17 for SQL Server};'
    'SERVER=your_server;'
    'DATABASE=your_database;'
    'UID=your_username;'
    'PWD=your_password'
)

# Leer una tabla desde SQL Server a un DataFrame
query = "SELECT * FROM employees"
df = pd.read_sql(query, con=conn)
print(df)
```


```



# **Introducción a Git y Control de Versiones**

Git es un sistema de control de versiones distribuido que permite a múltiples desarrolladores trabajar en un proyecto al mismo tiempo sin sobrescribir los cambios del otro. También permite mantener un historial de versiones del proyecto, lo que facilita revertir a versiones anteriores, comparar cambios y colaborar de manera eficiente.

El control de versiones es una práctica que permite gestionar los cambios realizados en archivos, especialmente en proyectos de software. Cada cambio se registra como una versión, lo que permite:

Guardar el historial de cambios a lo largo del tiempo.

Revertir archivos a versiones anteriores.

Comparar versiones para identificar diferencias.

Colaborar con otros sin sobrescribir su trabajo.

**Ventajas:**

**Distribuido**: A diferencia de sistemas centralizados como SVN (Subversion), Git permite que cada colaborador tenga una copia completa del historial del proyecto.

**Velocidad**: Las operaciones en Git (como hacer commits, ver el historial) son rápidas porque la mayoría de ellas se realizan localmente.

**Flexibilidad**: Git soporta múltiples flujos de trabajo, como el branching y el merging, lo que facilita la creación de ramas para diferentes características y su posterior combinación.

**Popularidad:** Git se ha convertido en el sistema estándar para la mayoría de los proyectos open source y privados, en parte por la integración con plataformas como GitHub.

**Instalación de Git**

**Linux**



```
sudo apt update
sudo apt install git
```



**macOS:**



```
brew install git
```



**Windows:**

https://git-scm.com/


Descargar el instalador de Git.

**Comandos Básicos de Git**

**git config:** Permite configurar las opciones de Git.

Esto establece el nombre y rl email globalmente para todos los repositorios.



```
git config --global user.name "Tu Nombre"
git config --global user.email "tu_email@dominio.com"

```



**git help**: Muestra la documentación o ayuda para un comando específico.



```
git help <comando>
```



Por ejemplo, **git help commit** muestra la documentación del comando commit.

**Google Colab** también permite ejecutar comandos de Git mediante su integración con la terminal Bash. A continuación se describen los pasos para practicar en este entorno:

**Ejecutar comandos de Git en Colab:**

Para ejecutar comandos en la terminal, se usa **!** antes del comando.
Por ejemplo, para verificar la versión de Git instalada

In [8]:
!git --version

git version 2.34.1


In [None]:
!git help init

**Configuración de usuario:**

In [None]:
!git config --global user.name "Gus8####"
!git config --global user.email "gus.####@gmail.com"

**Inicializar un repositorio:**

In [None]:
!mkdir mi_proyecto_git
%cd mi_proyecto_git
!git init

# **Flujo de Trabajo en Git**

 **El Ciclo Básico en Git**

Git sigue un ciclo básico de trabajo, que consiste en varias fases clave: inicializar el repositorio, agregar archivos al área de preparación, hacer un commit y verificar el estado del repositorio

##**git init: Inicializando un Repositorio**

Este comando se utiliza para crear un nuevo repositorio de Git en el directorio actual. Crea una carpeta **.git** que contiene toda la información necesaria para el control de versiones.



```
git init
```



##**git add: Añadiendo Cambios al Área de Preparación (Staging)**

El comando **git add** mueve los archivos modificados o nuevos al área de preparación (staging area), lo que indica que están listos para ser comiteados.

Se puede agregar un archivo específico



```
git add archivo.txt
```



O agregar todos los archivos modificados


```
git add .
```



##**git commit: Guardando Cambios con un Mensaje**

Los cambios agregados al área de preparación se guardan en el historial del repositorio mediante un commit, que también debe incluir un mensaje descriptivo sobre lo que se ha modificado.




```
git commit -m "Descripción clara de los cambios"
```



##**git status: Verificando el Estado del Repositorio**

Este comando muestra el estado actual del repositorio, indicando si hay archivos modificados, si están preparados para el commit, o si hay cambios pendientes.


```
git status
```



##**git log: Ver el Historial de Commits**

Este comando muestra un registro detallado de los commits realizados en el repositorio, con información como el autor, la fecha y el mensaje del commit.




```
git log
```



##**git diff: Ver las Diferencias Entre Cambios**

Compara los cambios entre la versión más reciente y el área de trabajo. Muestra las líneas añadidas o eliminadas.



```
git diff
```



##**git show: Ver Detalles de un Commit Específico**

Muestra detalles sobre un commit específico, incluyendo las diferencias entre ese commit y el anterior.



```
git show <ID_commit>
```



#**Crear un Proyecto y Archivo en Google Colab con Git**

**Crear un directorio para el proyecto**

In [None]:
!mkdir mi_proyecto_git
%cd mi_proyecto_git

**Inicializar un nuevo repositorio de Git:**

In [None]:
!git init

**Crear un archivo de texto simple:**

In [None]:
%%writefile archivo.txt
Esta es la primera línea del archivo.

**Añadir el Archivo al Área de Preparación y Comitear**

In [None]:
!git add archivo.txt

**Verificar el estado del repositorio:**

In [None]:
!git status

**Hacer un commit con un mensaje descriptivo:**

In [None]:
!git commit -m "Añadir archivo.txt con una línea de texto"

In [None]:
!git status

**Modificar el Archivo y Realizar un Nuevo Commit**

In [None]:
%%writefile archivo.txt
Esta es la primera línea del archivo.
Esta es una segunda línea añadida al archivo.

**Añadir el archivo modificado al área de preparación:**

In [None]:
!git add archivo.txt

**Hacer un segundo commit:**

In [None]:
!git commit -m "Añadir una segunda línea al archivo.txt"

**Visualizar el Historial y Analizar los Cambios**

In [None]:
!git log

Ver las diferencias entre la versión actual y la anterior:

In [None]:
!git diff HEAD^ HEAD

Mostrar el contenido detallado del último commit:

In [None]:
!git show

**Resumen**

Inicializado un repositorio en Google Colab.

Creado y modificado un archivo.

Usado los comandos **git add**, **git commit**, y **git status** para gestionar los cambios.

Visualizado el historial de commits con **git log**, y analizado las diferencias entre versiones con **git diff** y **git show**.

# **Introducción a GitHub - Repositorio Remoto**

**GitHub** es una plataforma para alojar y gestionar repositorios remotos utilizando Git. Permite colaborar con otros, hacer seguimiento de cambios y gestionar proyectos de manera eficiente.

**Repositorio Remoto:** Un repositorio remoto es un almacenamiento de código en línea donde los usuarios pueden colaborar y sincronizar sus cambios.

**Diferencia con Repositorios Locales:** Mientras que un repositorio local está almacenado en tu máquina, el repositorio remoto se encuentra en la nube, permitiendo accesos y contribuciones desde cualquier lugar.

**Creación de Cuenta en GitHub:**

https://github.com/signup?source=login

**Conexión de Git con GitHub**

Para vincular el repositorio local con GitHub, se necesita crear un repositorio remoto en GitHub y luego conectar ambos mediante Git.

**Creación de un Repositorio Remoto en GitHub:**

Acceder a la cuenta de GitHub y hacer clic en "New Repository" en el panel principal.
Asigna un nombre al repositorio, como por ejemplo "mi_proyecto_git", y eligir si se desea que sea público o privado.

**Vinculación de Repositorios Locales y Remotos:**

Después de haber creado el repositorio en GitHub, se necesita conectarlo con el repositorio local (en este caso en Google Colab)

Comando **git remote add origin**:

Este comando vincula tu repositorio local con el remoto que has creado en GitHub.

Usar el siguiente comando, sustituyendo URL_del_repositorio con la URL del repositorio remoto (se puede obtener desde la página del repositorio en GitHub):



```
!git remote add origin https://github.com/tu_usuario/mi_proyecto.git
```



**Enviar Cambios al Repositorio Remoto con git push:**

Una vez que el repositorio esté vinculado, puedes subir (push) los cambios de tu repositorio local al remoto.



```
!git push -u origin master

```



Si es la primera vez que se hace push, pedirá el nombre de usuario y token de acceso personal de GitHub (en lugar de la contraseña clásica de GitHub, ahora se utilizan tokens). Se puede crear un token desde GitHub Settings > Developer settings > Personal access tokens.

**Obtener Cambios del Repositorio Remoto con git pull:**

Si se trabaja en un equipo o desde varias máquinas, es importante mantener el repositorio local sincronizado con el remoto. **git pull** descarga y aplica los últimos cambios del repositorio remoto:



```
!git pull origin master
```



# **Subir tu Proyecto desde Google Colab a GitHub**

**Crear un Nuevo Repositorio en GitHub**

Acceder a tu cuenta de GitHub y crear un nuevo repositorio llamado mi_proyecto_git.

Copia la URL del repositorio.

**Conectar tu Proyecto Local con el Repositorio Remoto**

In [None]:
%cd /content/mi_proyecto_git

**Agregar el repositorio remoto:**

Usar el comando git remote add origin seguido de la URL del repositorio en GitHub:

In [None]:
!git remote add origin https://github.com/######/mi_proyecto_git

**Verificar la conexión con el repositorio remoto:**

In [None]:
!git remote -v

**Lectura de un archivo RAW desde GitHub (.csv)**

In [None]:
import pandas as pd

In [None]:
url = 'https://raw.githubusercontent.com/######/mi_proyecto_coder/refs/heads/main/dnrpa-robos-recuperos-autos-202201.csv'
df = pd.read_csv(url)
df.head()

In [None]:
df.info()

**Clonar un repositorio**

In [None]:
!git clone https://github.com/Gus86git/mi_proyecto_coder_61740.git

**Puede pedir token de autorización**

In [None]:
!git clone https://<TU_USUARIO>:<TU_TOKEN>@github.com/<TU_USUARIO>/<REPOSITORIO>.git

In [None]:
!git pull

In [None]:
%cd https://github.com/Gus86git/mi_proyecto_coder.git

Trabajamos sobre nuestro código

Agrega los archivos modificados al índice

In [None]:
!git add

Hacemos un commit

In [None]:
!git commit -m "Descripción clara de los cambios realizados"

Empuja los cambios al repositorio remoto:

In [None]:
!git push

# **JSON: JavaScript Object Notation**

**JSON (JavaScript Object Notation)** es un formato ligero y fácil de leer para almacenar y transportar datos. A pesar de su nombre, no se limita a JavaScript y es ampliamente utilizado en APIs y bases de datos debido a su simplicidad y versatilidad.

omposición de un archivo JSON
Un archivo JSON está compuesto por datos en pares clave-valor (key-value) y estructurado en listas y objetos. Aquí están sus componentes básicos:

**Características clave de JSON:**

Formato Texto: JSON es un archivo de texto legible para humanos.

Pares Clave-Valor: La estructura básica consiste en un conjunto de pares clave-valor, donde las claves son cadenas y los valores pueden ser diferentes tipos de datos.

Tipos de Datos Comunes:

Strings: Cadena de texto rodeada por comillas dobles ("string").
Numbers: Enteros o números de punto flotante (10, 3.14).
Booleans: Verdadero o falso (true, false).
Null: Un valor nulo (null).
Arrays: Una lista ordenada de valores, como [1, "dos", 3].
Objects: Un conjunto de pares clave-valor rodeado por llaves { "key": "value" }.



```
{
  "nombre": "Juan",
  "edad": 30,
  "casado": false,
  "hijos": ["Pedro", "Ana"],
  "direccion": {
    "calle": "Calle 123",
    "ciudad": "Madrid"
  }
}
```



**Estructura JSON**

Objetos JSON: Definidos con {} y consisten en pares clave-valor.



```
{
  "clave1": "valor1",
  "clave2": "valor2"
}
```



Arrays JSON: Definidos con [] y contienen múltiples elementos de cualquier tipo de datos.


```
[
  "elemento1",
  "elemento2",
  3,
  true
]
```



Valores: Los valores pueden ser otro objeto, un array, o un dato simple como un string o número.



```
{
  "nombre": "Maria",
  "edad": 25,
  "amigos": ["Carlos", "Sofia"]
}

```



**Características de JSON**

Ligero y legible: Facilita la comprensión tanto para humanos como para máquinas.

Independiente del lenguaje: Se utiliza en diversos lenguajes de programación.
Compatible con APIs: Es el formato más común para intercambio de datos entre servidores y clientes (APIs).

Auto-descriptivo: Las claves proporcionan una descripción clara de los valores.

Extensible: Puedes anidar objetos y arrays para estructuras más complejas.