# CyberPandas: Extendiendo Pandas con otros tipos de datos

CyberPandas es un contenedor de datos de direcciones IP el cual pueden ser almacenados en un DataFrame

https://www.anaconda.com/blog/developer-blog/cyberpandas-extending-pandas-with-richer-types/

## Introduccón a CyberPandas

En el pasado, las direcciones IP tenían que ser almacenadas como String, pero esto es propenso al error, no todos los String son direcciones IP, y usar string hace que el proceso sea lento.

CyberPandas provee dos nuevos tipos: 
* Dirección IP
* Dirección MAC

In [1]:
#Importar librerías
from cyberpandas import IPArray
import pandas as pd


In [2]:
#Se define una dirección IP y su dirección MAC
arr = IPArray(['192.168.1.1','2001:0db8:85a3:0000:0000:8a2e:0370:7334'])
arr

IPArray(['192.168.1.1', '2001:db8:85a3::8a2e:370:7334'])

In [3]:
#Se convierte el arreglo en una Serie
ser = pd.Series(arr)
ser

0                     192.168.1.1
1    2001:db8:85a3::8a2e:370:7334
dtype: ip

El dato almacenado es un IPArray.

In [4]:
# Averiguar si se tiene una IPv6
ser.ip.is_ipv6

0    False
1     True
dtype: bool

In [5]:
## Parseo de los datos

In [6]:
#Importar
import ipaddress
import pandas as pd
from cyberpandas import IPArray, to_ipaddress

### Pasar enteros a direcciones IP

In [7]:
#Pasar una secuencia de enteros a dirección IP
to_ipaddress([3232235777,42540766452641154071740215577757643572])

IPArray(['192.168.1.1', '2001:db8:85a3::8a2e:370:7334'])

In [8]:
#Otro método:
IPArray.from_pyints([3232235777,42540766452641154071740215577757643572])

IPArray(['192.168.1.1', '2001:db8:85a3::8a2e:370:7334'])

### Pasar bytes a direcciones IP

In [9]:
stream = (b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xc0\xa8\x01'
          b'\x01 \x01\r\xb8\x85\xa3\x00\x00\x00\x00\x8a.\x03ps4')
IPArray.from_bytes(stream)

IPArray(['192.168.1.1', '2001:db8:85a3::8a2e:370:7334'])

Stream es una secuencia de bytes que representan una dirección IP, cada dirección debe ser de 128 bits.

In [10]:
### Convertir una dirección IP a bytes

In [11]:
IPArray.to_bytes(IPArray(['192.168.1.1', '2001:db8:85a3::8a2e:370:7334']))

b'\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xc0\xa8\x01\x01 \x01\r\xb8\x85\xa3\x00\x00\x00\x00\x8a.\x03ps4'

## Indexar

In [12]:
 #Obtener el primer elemento de la serie
ser[0]

IPv4Address('192.168.1.1')

In [13]:
ser

0                     192.168.1.1
1    2001:db8:85a3::8a2e:370:7334
dtype: ip

In [14]:
ser.loc[1]

IPv6Address('2001:db8:85a3::8a2e:370:7334')

### Datos perdidos
La dirección 0  (0.0.0.0) representan valores perdidos

In [15]:
#Averiguar si hay elemento NAN
ser.isna()

0    False
1    False
dtype: bool

In [16]:
#Descartar NAN
ser.dropna()

0                     192.168.1.1
1    2001:db8:85a3::8a2e:370:7334
dtype: ip

In [17]:
# Comparación con una simple red
s = IPArray(['192.168.1.1'])
s.isin('192.168.1.0/24')

array([ True], dtype=bool)