# Repaso de conceptos de Python

Este notebook pretende repasar de forma superficial y no exhaustiva  diferentes estructuras de datos de Python, lectura y escritura de archivos, calculos numéricos con Numpy, visualizaciones con Matplotlib, y manejo de tablas con Pandas.

# Estructuras de datos: Listas, diccionarios y conjuntos

## Listas

Una lista es un como un arreglo unidimensional, cuyos elementos pueden ser cualquier objeto de python: Numeros, Strings, Funciones, Otras Listas, etc. 

In [None]:
a = [0, [1,2], "elemento de mi lista"]

Utilizando el constructor `list()`, cualquier iterable puede ser transformado en una lista, por ejemplo `range(10)` que devuelve enteros consecutivos del 0 al 9

In [None]:
b = list(range(10))
print(b)

Para acceder a los elementos de una lista, pongo entre corchetes el numero de elemento (en Python, como en C, se inicia a contar desde 0). 

También, uno puede utilizar _slicing_, (rebanado o feteado, como te guste), que permite acceder a segmentos de elementos, dentro de la lista, con la notación [inicio:final:paso]

In [None]:
print(a[2])
print(a[-1]) #De reversa
print(a[1:3])

Las listas tienen diversas propiedades, por ejemplo la longitud se obtiene aplicando el método `len`

In [None]:
print(len(a))

En Python, en general, las asignaciones son por referencia, de modo que cada "variable" es un puntero hacia el objeto de python en memoria, y asignar otra variable no copia el objeto, sino solo el puntero. Para hacer una copia en memoria, poseen el método `copy()`

In [None]:
b = a

b.append("elemento nuevo que agrego a b")#agrega un elemento a la lista
print("b es :", b)
print("a es :", b)
print("\n")

c = a.copy()
c.append("elemento nuevo que agrego a c")
print("c es : ", c)
print("a es : ", a)

Uno de los aspectos mas queridos de creación de listas, es lo que se llama Lists Comprehensions, la cual permite resumir bloques condicionales y loops en las listas. 

Por ejemplo, para crear una lista con los cuadrados de los numeros pares entre 0 y 10, y los cubos de los impares

In [None]:
cuadrados = [x**2 for x in range(10)]
print(cuadrados)

cuadrados_pares = [x**2 for x in range(10) if x%2 == 0]
print(cuadrados_pares)

cuadrados_pares_cubos_impares = [x**2 if x%2==0 else x**3 for x in range(10)]
print(cuadrados_pares_cubos_impares)

#loops dobles
suma = [x+y for x in [0,5,7] for y in [1,2,3]]
print(suma)

Ya que estamos, creemos un archivo que va a ejemplificar el uso de listas

In [None]:
test1=open("archivo_1.txt", "w+")#abro el archivo que voy a crear
for i in range(100):#inicio un loop
    test1.write(str(i)+" "+str(i*i)+"\n")#escribo en el archivo
test1.close()#cierro el archivo para que quede guardado

Las listas pueden usarse para almacenar datos de archivos, abiertos utilizando el comando open

In [None]:
lista1=[]#Defino una lista vacia
with open("archivo_1.txt", "r") as f:#abro el archivo en un loop para no olvidarme de cerrarlo
    for linea in f:#itero sobre cada linea del archivo
        lista1.append(linea.split())#agrego el elemento del archivo. Dado que son dos elementos separados por un espacio, splitteo.
print(lista1)

## Diccionarios

Un diccionario es un conjunto de pares clave : valor. Podemos pensarlo como una lista no ordenada a la que se accede con su clave, y es útil por su mayor velocidad al buscar elementos (es un Hash Table, con estructura de árbol para búsquedas eficientes). Se define con corchetes, por ejemplo:

In [None]:
Jugador1 ={
  "equipo": "Boca Juniors",
  "posición": "delantero",
  "nombre": "Juan Román Riquelme",
    "dorsal": 10
}
print(Jugador1)

Para imprimir elementos del diccionario puede hacerse:

In [None]:
x = Jugador1["equipo"]
print(x)

for x, y in Jugador1.items():#aqui itero sobre los elementos del diccionario, generando tuplas.
    print(x, y) 


Pueden alterarse los elmentos, agregarlos o eliminarlos (con el método `pop`):

In [None]:
Jugador1["posición"] = "Enganche"
print(Jugador1)

Jugador1["Hincha de"] = "Boca Juniors"
print(Jugador1)

Jugador1.pop("Hincha de")
print(Jugador1) 

Los valores del diccionario, como en las listas, pueden ser cualquier cosa, incluso otros diccionarios:

In [None]:
Jugador2 ={
  "equipo": "Boca Juniors",
  "posición": "Delantero",
  "nombre": "Martin Palermo",
    "dorsal": 9
}

Jugador3 ={
  "equipo": "Boca Juniors",
  "posición": "Defensor",
  "nombre": "Rolando Schiavi",
    "dorsal": 2
}


MisJugadores = {
  "Jugador 1" : Jugador1,
  "Jugador 2" : Jugador2,
  "Jugador 3" : Jugador3
} 

print(MisJugadores)

El uso de diccionarios permite manejar datos multidimensionales de manera más eficiente. Podría hacerse con listas pero requeriria indexar y recordar ese indexado.

Por ejemplo, quiero los nombres de los jugadores que tengan determinada posición:

In [None]:
for jugador in MisJugadores.values():
    if(jugador["posición"]=="Delantero"):
        print(jugador["nombre"])

## Conjuntos

Un conjunto es, básicamente eso: un conjunto. No tiene orden en los elementos, por lo cual tampoco admite duplicados. Se pueden añadir y quitar elementos, y acceder a ellos (sin posibilidad de definir el orden en que se accede), y realizar operaciones entre conjuntos tales como Unir, Intersectar, Restar, etc.

Se crean utilizando también corchetes (como los diccionarios), salvo para crear un conjunto vacío en donde utilizamos el constructor `set()`

In [None]:
conjunto1 = {"cosa 1", " banana 2", 80.4}
conjunto2 = {"cosa 1", "manzana 3", 125}

conjunto3 = conjunto1.union(conjunto2)
print("union: ",conjunto3)
print("interseccion: ", conjunto1.intersection(conjunto2))

print("Es el conjunto2 un subset del conjunto3? ", conjunto2.issubset(conjunto3))

conjunto3.remove("manzana 3")
print(conjunto3)

conjunto1.add("nuevo elemento")
print(conjunto1)

conjunto1.clear()# limpia el conjunto
print(conjunto1)

del conjunto1 #elmina el objeto
print(conjunto1)

# Visualización: Matplotlib

Matplotlib es un paquete de visualización en 2D que puede hacer plots customizables en calidad de publicación. El principal paquete que necesitamos para plotear, es plt. Utilizamos el comando mágico de Jupyter para plotear inline:

In [None]:
import matplotlib.pyplot as plt
%matplotlib inline

Para plotear, quisiera tener dos listas. Puedo utilizar la que ya creamos anteriormente:

In [None]:
lista1_x=[float(elemento[0]) for elemento in lista1]#Acá itero sobre lista1 invocando cada elemento [i,i^2] de la lista-
lista1_y=[float(elemento[1]) for elemento in lista1]

Para plottear puntos utilizo scatter, mientras que para unir con líneas y hacer un plot continuo utilizo plot. 
Jueguen con las opciones que hay en https://matplotlib.org/3.1.3/api/_as_gen/matplotlib.pyplot.scatter.html!


In [None]:
plt.scatter(lista1_x,lista1_y,marker='+',c='red', label='Lista 1 en scatter')
plt.plot(lista1_x,lista1_y, c='yellow', label='Lista 1 en plot')
plt.title('Una figura')
plt.xlabel('x')
plt.ylabel('y')
plt.legend(loc='upper left')
plt.xlim(0,101)
plt.ylim(0,10001)
plt.show()

Mas adelante haremos mas plots, ahora veamos omnipresente paquete de Numpy

# Numpy

Numpy es una librería para aplicaciones numéricas. La convención es importarlo bajo la etiqueta "np"

In [None]:
import numpy as np

## Arreglos

El elemento básico de Numpy es el array, o arreglo. Este, a diferencia de las listas, tiene un tamaño definido y todos los elementos son de un mismo tipo (por ejemplo, double, o string, para mezclar todos son seteados tipo Object). 
La perdida de flexibilidad, en comparación a las Listas nativas de Python, permiten utilizar algoritmos (escritos en C) de mucha mayor velocidad, y vectorizando cuando sea posible.

In [None]:
# Creamos un array de zeros:
array1=np.zeros(4)
for i in range(4):
    array1[i]=i
print(array1)
#y podemos realizar operaciones en el
array1**2

Este loop para inicializarlo es en realidad innecesario, Numpy ofrece muchas formas para inicializar arreglos, para todos los gustos:



In [None]:
array_aux = np.linspace(0,10,100) #da 100 numeros equiespaciados entre 0 y 10. Útil para hacer binneados.
array_aux = np.arange(0,10,0.1) #da un array definido entre 0 y 10 con paso de 0.1. Tambien es útil para hacer binneados.
array_aux = np.array([1,2,4])   # [1,2,4]
array_aux = np.arange(1,15,2)   # [1,3,5,7,9,11,13,15]
array_aux = np.linspace(0,1,6)  # [0.0,0.2,0.4,0.6,0.8,1.0]
array_aux = np.empty((1,3))                   # array vacio de 1x3
array_aux = np.zeros((2,5,3))                 # array de ceros de 2x5x3
array_aux = np.ones((3,3))                    # array de unos de 3x3
array_aux = np.eye(4)                         # matriz identidad de 4x4
array_aux = np.identity(4)                    # matriz identidad de 4x4
array_aux = np.diag(np.array([1,2,3,4]))      # matriz diagonal con [a1,a2,a3,a4] los elementos de la diagonal
array_aux = np.diag(np.array([1,2,3,4]),k=-1) # matriz con [a1,a2,a3,a4] valores abajo de la diagonal
array_aux = np.diag(np.array([1,2,3,4]),k=2)  # matriz con [a1,a2,a3,a4] valores en la segunda fila superior de la diagonal

Todos los elementos de un Numpy array tienen un mismo tipo, lo cual permite (junto a la longitud fija) realizar operaciones mucho mas rápido, paralelizando cuando sea posible (siempre que se pueda escribir la operacion en forma vectorial, la implementación nativa de numpy paralelizará y sera la forma mas eficiente de realizarlo)

In [None]:
#vamos a comprar la velocidad para sumar elemento a elemento, dos vectores
#en Python puro usamos listas, y con Numpy arreglos:
size_of_vec = 1000
X_list = range(size_of_vec)
Y_list = range(size_of_vec)
X = np.arange(size_of_vec)
Y = np.arange(size_of_vec)

def pure_python_version():
    Z = [X_list[i] + Y_list[i] for i in range(len(X_list)) ]

def numpy_version():
    Z = X + Y

print("Python puro:")
%timeit pure_python_version()
print("Usando Numpy:")
%timeit numpy_version() #100 veces mas rapido que en listas

Los arreglos de Numpy traen de forma nativa, muchos métodos útiles:

In [None]:
print(array1.sum())#suma de elementos
print(array1.shape)#shape del array
print(array1.min())
print(np.exp(array1))
print(np.cos(array1))
print(array_aux.max(axis=0))
print(array_aux.max(axis=1))
#print(array_aux)
#print(array_aux.reshape(36,1))
#print(array_aux.ravel())
#print(array_aux.T)


Podemos leer el archivo que creamos anteriormente y plotearlo:

In [None]:
array1 = np.loadtxt("archivo_1.txt")
print(np.shape(array1))
print(array1[2:5])
print(array1[0].shape)

Como vemos, tenemos cien pares de elementos. Si accedo a un elemento del array, es un array con dos elementos: X e Y. Para plotear es más cómodo tener la lista de todos los X y todos los Y. Es bueno que Numpy nos permita transponer el arreglo:

In [None]:
array1_T=array1.T
print(np.shape(array1_T))
plt.scatter(array1_T[0],array1_T[1],marker='+',c='red', label='Array 1')
plt.title('Una figura')
plt.xlabel('x')
plt.ylabel('y')
plt.legend(loc='upper left')
plt.xlim(0,101)
plt.ylim(0,10001)
plt.show()

## Tomar pedazos de un arreglo: Indexing, Slicing y Máscaras

Python tiene una forma de acceder a elementos de una Lista conocida como _Slicing_ ( que sería algo así como _rebanar_ o _fetear_) seleccionando de la forma `inicio:final:paso`, o solamente `inicio:final` para usar un `paso=1` (nota, es inclusivo en el indice de inicio pero exclusivo en el de final)

In [None]:
lista_1 = list(range(20))
print(lista_1)
print(lista_1[1:5])
print(lista_1[0:10:2]) # de dos en dos
print(lista_1[-3:-1]) #Numeros negativos comienzan desde el final
print(lista_1[-3:]) #Ningun numero, es el default

Numpy extiende esta noción para arrays de más de una dimensión. El slice de cada dimensión se separa con coma.

In [None]:
a = np.arange(35).reshape(5,7)
print(a.shape)
a

In [None]:
#Toma el elemento en la fila 1 y columna 4 (numeracion empieza en 0)
a[1,4]

In [None]:
# selecciona las filas desde 1 a 5, con paso de 2 (es decir filas 1 y 3), 
# y las columnas desde 0 hasta 7, con un paso de 3 (es decir columnas 0,3 y 6)
a[1:5:2,::3] 

Además de hacer slicing, también podemos usar Fancy-Indexing, por ejemplo utilizar una lista de enteros para seleccionar los elementos que queremos:

In [None]:
a = np.arange(10) + 7
print(a)
a[[1,5,7]] #selecciona los elementos 1, 5 y 7 de la lista

En muchas dimensiones, pasamos una lista por cada dimensión. Cada lista contiene las coordenadas del los que queremos en esa direccion. Así, en una matriz (array bidimensional), debemos pasar dos listas de enteros [a1,b1,c1,...] y [a2,b2,c2,...], y nos devolverá una lista con los elementos en las posiciones (a1,a2), (b1,b2), (c1,c2), ...

In [None]:
a = np.arange(35).reshape(5,7)
print(a)
#Por ejemplo, el elemento en la fila 1 columna 2, y el elemento en la fila 4 y columna 5, se obtienen así:
a[[1,4],[2,5]] 

También podemos usar *máscaras* para seleccionar pedazos de nuestros arrays. Estos son siemplemente listas booleanas, que devuelven los elementos que marcamos con `True`.

In [None]:
#el mismo ejemplo de antes
a = np.arange(10) + 7
print(a[[False,True,False,False,False,True,False,True,False,False]])

In [None]:
#puede ser util para aplicar filtros:
print(a)
print(a<11)
a[a<11]

# Numpy.Random y más visualización

Numpy permite samplear números seudo-aleatoreos utilizando `numpy.random` .

In [None]:
from numpy import random

La generación de números pseudo-aleatorios se realiza mediante un algoritmo determinista, diseñado para que la correlación entre números cercanos en la secuencia que devuelve sea lo más baja posible. La secuencia es generada a partir de un número inicial, _semilla_ o _seed_. Al ser determinista, partiendo del mismo seed obtendríamos siempre la misma secuencia, algo que útil para tener reproducibilidad al experimentar. Las formas de hacerlo son:

In [None]:
random.seed(123)
print(random.rand(5))

In [None]:
print(random.rand(5))
random.seed(123)
print(random.rand(5))

Esta es la forma más práctica y facil de setear el Seed. Sin embargo, numpy permite guardar el estado del generador en una variable, para cambiar o retomar un generador con un determinado Seed. Por esto, la forma más convencional hoy en día es utilizar algo como lo que sigue:

In [None]:
from numpy.random import RandomState, SeedSequence
rs = RandomState(random.MT19937(SeedSequence(123)))
print(rs.rand(5,))
print(rs.rand(5,))
# Luego, para retomar el estado:
rs = RandomState(random.MT19937(SeedSequence(123)))
print(rs.rand(5,))

In [None]:
#y podemos definir mas estados:
rs2 = RandomState(random.MT19937(SeedSequence(123)))
print(rs.rand(5,))
print(rs2.rand(5,))

Hay muchas maneras de inicializar arrays random

In [None]:
array_aux = random.rand(4)             # array de 4 elementos en el intervalo [0,1)
array_aux = random.rand(4,3)           # array de 4x3 elementos en el intervalo [0,1)
array_aux = random.randint(1,3,(2,3))  # array  de 2x3 elementos en el intervalo [1,3)
array_aux = random.randn(4,5)          # array de 4x5 de elementos sampleados de la normal
array_aux = random.poisson(3,5)        # array de 5 elementos sampleandos de una dist. de Poisson con media 3

## Visualizaciones

Hagamos algunos plots, usando estos numeros aleatorios:

In [None]:
fig, (ax1, ax2) = plt.subplots(2,1, figsize=(15,15)) #aqui genero una figura con dos subfiguras, referenciadas en la tupla (ax1, ax2)


# Fixing random state for reproducibility
rs = RandomState(random.MT19937(SeedSequence(123)))

collection=[]

for i in [100,1000,10000]:
    random_numbers=rs.rand(i) # Creo i numeros aleatorios con distribución uniforme entre [0,1)
    ax1.hist(random_numbers,histtype='step',label="N = "+str(i),density='True')
    collection.append(random_numbers)
ax2.boxplot(collection, labels=['N = 100', 'N = 1000','N = 10000'])
x=np.linspace(0,1,100)
ax1.plot(x,np.ones(100),label='Truth', color='black')
ax1.legend(loc='upper right')
ax1.set_title("Distribución de probabilidad estimada con N tiradas")
ax1.set_xlabel('Variable aleatoria x')
ax1.set_ylabel('n(x)/N')
ax2.set_title("Boxplot estimado con N tiradas")
ax2.set_xlabel('Experimento')
ax2.set_ylabel('Variable aleatoria x')
ax2.legend(loc='upper right')
fig.savefig("abc.png")#Comando para guardar la figura. Guardamos ambos subplots en un mismo archivo

#Aqui descargamos la figura
#from google.colab import files
#files.download("abc.png")


Supongamos que quiero plottear algo con errores

In [None]:
x = np.arange(0, 2*np.pi, 0.1)
yerr = 0.3
noise = yerr * np.random.randn(*x.shape)
y = np.sin(x) + noise
plt.errorbar(x, y, yerr=yerr, fmt="o")

También podemos generar distribuciones multidimensionales y tratar de visualizarlas

In [None]:
# Fixing random state for reproducibility
random.seed(19680801)

mean = [0, 1]
cov = [[1, 0], [0, 2.5]]  # diagonal covariance

for i in [100,1000,10000]:#Generamos pseudo experimentos y vemos que obtenemos
  sampling = np.random.multivariate_normal(mean,cov,i) 
  x, y = sampling.T
  fig, (ax1, ax2) = plt.subplots(1,2, figsize=(15,5)) #aqui genero una figura con dos subfiguras, referenciadas en la tupla (ax1, ax2)
  ax1.plot(x, y, 'x')
  counts, xedges, yedges, im =ax2.hist2d(x,y,density=True,cmap='plasma')
  ax1.set_xlabel('x')
  ax1.set_ylabel('y')
  ax2.set_xlabel('x')
  ax2.set_ylabel('y')
  ax1.set_title('Eventos')
  ax2.set_title('Densidad de probabilidad estimada (con binneado)')
  plt.colorbar(im,ax=ax2)
  fig.show()


Veamos como visualizar la función de densidad verdadera. Aprovecho que la normal está descorrelacionada y armo una definición fácil

In [None]:
def f(x, y, mu, cov):
    return 1/(2*np.pi*cov[0][0]*cov[1][1]) * np.exp(-1/(2*cov[0][0]) *(x-mu[0])**2)* np.exp(-1/(2*cov[1][1]) *(y-mu[1])**2)

In [None]:
xb = np.linspace(-5, 5, 1000)
yb = np.linspace(-5, 5, 1000)

mu = [0, 1]
cov = [[1, 0], [0, 2.5]]  # diagonal covariance

X, Y = np.meshgrid(xb, yb)
Z = f(X, Y,mu,cov)
plt.contour(X, Y, Z,cmap='inferno');
plt.colorbar()
plt.hist2d(x,y,density=True,cmap='plasma');
plt.colorbar()
plt.title('Comparación entre estimado (binneado) y la verdadera distribución')
plt.scatter(0,1,c='black',marker='+',label='True $\mu$')
plt.legend(loc='upper right')
plt.xlabel('x')
plt.ylabel('y')

Puedo guardar los eventos simulados utilizando numpy

In [None]:
from google.colab import files
np.savetxt("archivo_2.txt",sampling)#Utilizo sampling porque tiene la estructura que quiero.
files.download("archivo_2.txt")#Aqui descargamos el archivo

# Lectura/Escritura

In [None]:
#Si quieren montar su google drive para guardar archivos:
#from google.colab import drive
#drive.mount('/content/drive')

#Sino, en Colab en la barra lateral izquierda, bajo el ícono de carpeta, tienen el sistema local de archivos

Como ya vimos, podemos leer y escribir archivos en python básico con el comando Open. Este archivo puede ser de solo lectura, solo escritura o ambos.

In [None]:
archivo = open("cuadrados.csv", "r") # abro el archivo en modo lectura
tabla=[]
for renglon in archivo:
  tabla.append(renglon.split(","))
archivo.close()

print(tabla)

Vemos que requeriría algo de parsing para convertir estos string en numeros, quitar caracteres especiales como el de fin de linea '\n'. 
Por suerte para nosotros, Numpy ya trae consigo metodos de lectura y escritura de arreglos con cantidad fija de elementos:

In [None]:
tabla = np.loadtxt("cuadrados.csv", delimiter=',', skiprows=1)
print(tabla.shape)
print(tabla)

In [None]:
cubos = np.array([[i,i**3] for i in range(1000)])
print(cubos)
np.savetxt('cubos.csv',cubos, fmt='%.2f',delimiter=',', header='Numeros,Cubos')

Una función más completa que `np.loadtxt` es `np.genfromtxt`,la cual puede lidiar un poco mejor con entradas incompletas y campos con distintos tipos. Para saber más, pueden leer [de la excelente documentación de Numpy.](https://docs.scipy.org/doc/numpy/user/basics.io.genfromtxt.html)



# Pandas

Pandas es una librería construída sobre Numpy, que define estructuras y métodos para análisis de datos. Esta es particularmente útil para leer tablas con muchos campos de diferente naturaleza. A continuación haremos un repaso rápido:

In [None]:
import numpy as np # Como dijimos, está construido sobre Numpy así que lo importamos también
import pandas as pd

### Data Structures

Las dos estructuras de datos importantes para conocer son Series, ~arrays unidimensionales como series de tiempo, y DataFrame, que es más como una tabla.

In [None]:
# Crearemos una Serie pasando una lista de valores, o un array de numpy
s = pd.Series([1, 4, 5, np.nan, 8, 10])
# Se puede imprimir, la primer columna es un índice y la segunda son los valores de la Serie.
print("\nSerie s:\n", s)

# También podemos crear un DataFrame a partir de un array de Numpy de numeros aleatorios.
# Lo haremos de 4 columnas, etiquetadas con letras, y como índice será una lista de fechas 
# (Pandas tiene un tipo especial para manejar fechas)
fechas = pd.date_range(start="20200101", periods=6)
print("\nFechas:\n", fechas)

df = pd.DataFrame(np.random.randn(6, 4), index=fechas, columns=list('ABCD'))

print("\nDataFrame df:\n", df)


In [None]:
# También podemos crear el DataFrame a partir de un diccionario de objetos que se puedan transformar en Series
# (internamente, cada columna del DataFrame es una serie, y por lo tanto pueden tener tipos diferentes)
# Todas las series deben ser del mismo tamaño, o en su defecto de un único elemento, que se convertirá en Serie constante
df2 = pd.DataFrame({'A': 1.,
                    'B': pd.Timestamp('20130102'),
                    'C': pd.Series(1, index=list(range(4)), dtype='float32'),
                    'D': np.array([3] * 4, dtype='int32'),
                    'E': pd.Categorical(["test", "train", "test", "train"]),
                    'F': 'foo'})

print("\nDataFrame df2:\n", df2)

# Podemos examinar los tipos que tiene cada columna
print("\nTipos de df2:\n", df2.dtypes)

### Lectura/Escritura

Pandas viene equipado con sus propios métodos para leer y escribir archivos en múltiples formatos. 

(Experimenten con pd.read_ y miren lo que aparece)

In [None]:
df2.to_csv("foo.csv")

In [None]:
df = pd.read_csv('sample_data/california_housing_test.csv')
df

### Visualización

Podemos visualizar el comienzo y el final de un DataFrame con los comandos `.head()` y `.tail()`

In [None]:
df.head()

In [None]:
df.tail(3)

Podemos también visualizar la lista de índices, los nombres de las columnas, y acceder a las columnas como si estuvieramos accediendo a una variable interna del DataFrame. También podemos convertir el DataFrame a un array bidimensional de Numpy (así como inicializar un DataFrame a partir de un NumpyArray).

In [None]:
print(df.index)
print(df.columns)

In [None]:
print(df.A)
print(type(df.A))

In [None]:
df.to_numpy()

In [None]:
#Si las columnas tienen distintos typos, la conversión a numpy lleva mas tiempo ya que se convierte a un NumpyArray tipo Object
df2.to_numpy()

Podemos ver también un pequeño resumen de estadísticas del DataFrame facilmente:

In [None]:
df.describe()

Y transponer, ordenar ya sea por ejes (indices o columnas) o por valor de alguna columna:

In [None]:
df.T #Transpose

In [None]:
df.sort_index(axis=1, ascending=False) #ordenar por nombre de columna descendente

In [None]:
df.sort_values(by='B') #ordenar ascendente por los valores de la columna B

Y muchas más cosas que pueden chusmear en la [excelente documentación de Pandas](https://pandas.pydata.org/docs/getting_started/10min.html).