Bienvenidxs al taller "De Datos, Python y otros cuentos" a cargo de la comunidad de [Mujeres en Bioinformática y Ciencia de Datos de America Latin (WBDS LA)](https://wbds.la) y el [Observatorio de datos con perspectiva de género](https://gad.uy/por-que-necesitamos-datos-con-perspectiva-de-genero/).

Parte de este recorrido se basa en el material de [Fundamentos de Informática](https://github.com/AJVelezRueda/Fundamentos_de_informatica) y [recursos python](https://github.com/flbulgarelli/recursos-python), donde podés encontrar más material para aprender Python.


**Docentes: Ana Julia Velez Rueda, Lucy Jimenez e Ivana Feldfeber**


# **Antes que nada**
Hoy aprenderemos a manipular y analizar datos con Pandas, una biblioteca de Python. Para este recorrido necesitarás las librerías [Pandas](https://pandas.pydata.org/), [Seaborn](https://seaborn.pydata.org/) y [Scipy](https://www.scipy.org/)


Podes corroborar si las tienes instaladas corriendo las siguientes líneas en tu intérprete de Python:

```python
import pandas as pd
import seaborn as sns
import scipy.stats as ss
```

Si correr estas lineas no tira ningún error, etonces están felizmente instaladas las bibliotecas enc uestión. De lo contrario, obtendremos un mensaje de error `ModuleNotFoundError: No module named` al correr las lineas anteriores. En tal caso, podés instalar las bibliotecas desde la consola, con el comando:

```bash
        pip install pandas
        pip install seaborn
        pip install scipy
```

# **Introduccióón a Pandas**

En este recorrido vamos a adentrarnos en el mundo de los datos, y para ello utilizaremos Pandas, una biblioteca de Python que nos permite trabajar con archivos de formato definido: CSV, un excel, etc. Además, Pandas proporciona estructuras de datos rápidas, flexibles y expresivas diseñadas para que trabajar con datos "relacionales" o "etiquetados" sea fácil e intuitivo. En criollo: Pandas es como en excel, pero super duper!

> Para pensar 🤔: Si hasta aquí no te has preguntado qué es una bliblioteca, ¡es momento de hacerse esa pregunta! ¿Para qué creés que nos puede resultar útil esta biblioteca? ¿Cuál es la ventaja de usar Pandas? ¿Por qué no solo usar Python `"de a pie"`?
>

Pandas soporta múltipes tipos de datos:

- Datos tabulares con columnas de tipo heterogéneo, como en una tabla SQL o en una hoja de cálculo de Excel
- Datos ordenados y desordenados (no necesariamente frecuencia fija).
- Datos matriciales arbitrarios (homogéneamente tipados o heterogéneos) con etiquetas de fila y columna
- Cualquier otra forma de conjuntos de datos observacionales/estadísticos. 

Los datos en realidad no necesitan ser etiquetados para ser colocados en una estructura de datos de pandas. Estas estructuras se construyen a partir de arrays(listas), pero agregando nuevas funcionalidades. Pandas maneja dos estructuras de datos: Series y DataFrames.

### **Series (1-dimensional)**


Las series pueden contener cualquier tipo de datos (enteros, cadenas, números de punto flotante, etc.). Y se pueden crear del siguiente modo:


In [2]:
import pandas as pd
una_serie = pd.Series(['Peru', 'Argentina', 'Bolivia', 'Uruguay', 'Brasil', 'Chile'], dtype='string')

print(una_serie)

0         Peru
1    Argentina
2      Bolivia
3      Uruguay
4       Brasil
5        Chile
dtype: string


### **DataFrame (2-dimensiones)**

Un **DataFrame** es una estructura tabular bidimensional de datos tabulares, potencialmente heterogéneos, con ejes etiquetados (filas y columnas). 

Podemos crear un DataFrame del sigueinte modo:

In [3]:
paises_latam = pd.DataFrame(data ={"Pais": ['Peru', 'Argentina', 'Bolivia', 'Uruguay', 'Brasil', 'Chile'], "Lengua oficial": ['Español', 'Español', 'Español', 'Español', 'Portugues', 'Español']}, index = [1,2,3,4,5,6])

print(paises_latam)

        Pais Lengua oficial
1       Peru        Español
2  Argentina        Español
3    Bolivia        Español
4    Uruguay        Español
5     Brasil      Portugues
6      Chile        Español


🛑 Alerta: los valores asociados a las claves del diccionario deben ser listas del mismo tamaño

`df` es el nombre génerico para designar DataFrame y es el nombre que utilizaremos de ahora en más para mayor simplicidad.


### **Nuestros datos**
Otra forma muy usual de generar DataFrames es mediante la lectura de **archivos estructurados**. Existen muchas formas de cargar/leer información desde archivos la información desde archivos pero en general la diferencia radica principalmente en los parámetros por defecto que toman para definir las columnas. Por ejemplo: 

- El caracter de separación de columnas por defecto del método `read_cvs` es una coma (',') 
- El caracter de separación de columnas por defecto del método `read_fwf` es una tab ('\t').


In [25]:
url = 'https://drive.google.com/file/d/1hlPxSAg-A345_PEAcbh2uWJ9NX3_OkqU/view?usp=sharing'
path = 'https://drive.google.com/uc?export=download&id='+url.split('/')[-2]
tabla_genero = pd.read_csv(path, error_bad_lines=False)

Vamos a inspeccionar la tabla usando el método .head():

In [27]:
tabla_genero.head(2)

Unnamed: 0,N,NRO_REGISTRO,TOMO,FECHA_RESOLUCION,N_EXPTE_EJE,FIRMA,MATERIA,ART_INFRINGIDO,CODIGO_O_LEY,CONDUCTA,CONDUCTA_DESCRIPCION,VIOLENCIA_DE_GENERO,V_FISICA,V_PSIC,V_ECON,V_SEX,V_SOC,V_AMB,V_SIMB,V_POLIT,MODALIDAD_DE_LA_VIOLENCIA,FRASES_AGRESION,GENERO_ACUSADO/A,NACIONALIDAD_ACUSADO/A,EDAD_ACUSADO/A AL MOMENTO DEL HECHO,NIVEL_INSTRUCCION_ACUSADO/A,GENERO_DENUNCIANTE,NACIONALIDAD_DENUNCIANTE,EDAD_DENUNCIANTE_AL_MOMENTO_DEL_HECHO,NIVEL_INSTRUCCION_DENUNCIANTE,TRABAJO_REMUNERADO_DENUNCIANTE,NIVEL_DE_INGRESOS_DENUCIANTE,DOMICILIO_DENUNCIANTE,ASENTAMIENTO_O_VILLA,FRECUENCIA_EPISODIOS,RELACION_Y_TIPO_ENTRE_ACUSADO/A_Y_DENUNCIANTE,HIJOS_HIJAS_EN_COMUN,MEDIDAD_DE_PROTECCION_VIGENTES_AL_MOMENTO_DEL_HECHO,ZONA_DEL_HECHO,LUGAR_DEL_HECHO\n,ASENTAMIENTO_O_VILLA.1,FECHA_DEL_HECHO,FECHA_DE_INICIO_DEL_HECHO,FECHA_DE_FINALIZACIÓN_DEL_HECHO,TIPO_DE_RESOLUCION,OBJETO_DE_LA_RESOLUCION,DETALLE,DECISION,ORAL_ESCRITA,HORA_DE_INICIO,HORA_DE_CIERRE,LINK,DURACION,SI_NO_RECURRENTE,DECISION_CAMARA_DE_APELACIONES,N_REGISTRO_Y_TOMO_CAMARA,LINK_CAMARA,SI_NO_RECURRENTE_CAMARA,DECISION_DE_ADMISIBILIDAD_CAMARA,N_REGISTRO_Y_TOMO_CAMARA_1,LINK_CAMARA_1,QUEJA_Y_RECURRENTE,DECISION_DE_ADMISIBILIDAD_TSJ,N_REGISTRO_Y_TOMO_TSJ,LINK_TSJ,DECISION_DE_FONDO_TSJ,N_REGISTRO_Y_TOMO_TSJ_1,LINK_TSJ_1,RECURSO_EXTRAORDINARIO_Y_RECURRENTE,DECISION_CSJN,N_REGISTRO_Y_TOMO_CSJN,LINK_CSJN
0,1,453,4.0,1_8_2016,9498_16,Pablo_Casas,penal,1,ley_14346,proteccion_animal,no_corresponde,no,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no corresponde,usuario_de_facebook,argentina,no_corresponde,s/d,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,s/d,s/d,no,27_03_16,,,definitiva,prision_preventiva,hasta_agotar_investigacion,hace_lugar,escrita,,,https://drive.google.com/open?id=0B9wNhp3Gjjaz...,0:00:00,no,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde
1,2,454,4.0,1_8_2016,9904_16,Pablo_Casas,penal,149bis,codigo_penal_de_la_nacion,amenazas,simples,si,no,si,no,no,no,no,si,no,domestica,me la vas a pagar,varon cis,s/d,17,s/d,mujer,argentina,17,secundario_en_curso,,,zona_oeste,no,primera_vez,ex_pareja,no,no,zona_oeste,en_domicilio_particular,no,25_3_16,,,definitiva,archivo_fiscal,convalidacion_otras_causales,hace_lugar,escrita,,,https://drive.google.com/open?id=0B9wNhp3Gjjaz...,0:00:00,no,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde


Podemos operar con las columnas con los operadores relacionales y matemáticos que ya conoces:

``` python
tabla_genero['TOMO'] * 2
tabla_genero['TOMO'] + 2
tabla_genero['TOMO'] > 2  
tabla_genero['TOMO'] == 2  
```          
> Para pensar 🤔: ¿Qué resultado nos daría en cada caso? 

Pero los operadores tambien nos sirven también para filtrar nuestro DataFrame:

In [6]:
tabla_genero[tabla_genero['GENERO_DENUNCIANTE'] == 'mujer' ]

Unnamed: 0,N,NRO_REGISTRO,TOMO,FECHA_RESOLUCION,N_EXPTE_EJE,FIRMA,MATERIA,ART_INFRINGIDO,CODIGO_O_LEY,CONDUCTA,CONDUCTA_DESCRIPCION,VIOLENCIA_DE_GENERO,V_FISICA,V_PSIC,V_ECON,V_SEX,V_SOC,V_AMB,V_SIMB,V_POLIT,MODALIDAD_DE_LA_VIOLENCIA,FRASES_AGRESION,GENERO_ACUSADO/A,NACIONALIDAD_ACUSADO/A,EDAD_ACUSADO/A AL MOMENTO DEL HECHO,NIVEL_INSTRUCCION_ACUSADO/A,GENERO_DENUNCIANTE,NACIONALIDAD_DENUNCIANTE,EDAD_DENUNCIANTE_AL_MOMENTO_DEL_HECHO,NIVEL_INSTRUCCION_DENUNCIANTE,TRABAJO_REMUNERADO_DENUNCIANTE,NIVEL_DE_INGRESOS_DENUCIANTE,DOMICILIO_DENUNCIANTE,ASENTAMIENTO_O_VILLA,FRECUENCIA_EPISODIOS,RELACION_Y_TIPO_ENTRE_ACUSADO/A_Y_DENUNCIANTE,HIJOS_HIJAS_EN_COMUN,MEDIDAD_DE_PROTECCION_VIGENTES_AL_MOMENTO_DEL_HECHO,ZONA_DEL_HECHO,LUGAR_DEL_HECHO\n,ASENTAMIENTO_O_VILLA.1,FECHA_DEL_HECHO,FECHA_DE_INICIO_DEL_HECHO,FECHA_DE_FINALIZACIÓN_DEL_HECHO,TIPO_DE_RESOLUCION,OBJETO_DE_LA_RESOLUCION,DETALLE,DECISION,ORAL_ESCRITA,HORA_DE_INICIO,HORA_DE_CIERRE,LINK,DURACION,SI_NO_RECURRENTE,DECISION_CAMARA_DE_APELACIONES,N_REGISTRO_Y_TOMO_CAMARA,LINK_CAMARA,SI_NO_RECURRENTE_CAMARA,DECISION_DE_ADMISIBILIDAD_CAMARA,N_REGISTRO_Y_TOMO_CAMARA_1,LINK_CAMARA_1,QUEJA_Y_RECURRENTE,DECISION_DE_ADMISIBILIDAD_TSJ,N_REGISTRO_Y_TOMO_TSJ,LINK_TSJ,DECISION_DE_FONDO_TSJ,N_REGISTRO_Y_TOMO_TSJ_1,LINK_TSJ_1,RECURSO_EXTRAORDINARIO_Y_RECURRENTE,DECISION_CSJN,N_REGISTRO_Y_TOMO_CSJN,LINK_CSJN
1,2,454,4.0,1_8_2016,9904_16,Pablo_Casas,penal,149bis,codigo_penal_de_la_nacion,amenazas,simples,si,no,si,no,no,no,no,si,no,domestica,me la vas a pagar,varon cis,s/d,17,s/d,mujer,argentina,17,secundario_en_curso,,,zona_oeste,no,primera_vez,ex_pareja,no,no,zona_oeste,en_domicilio_particular,no,25_3_16,,,definitiva,archivo_fiscal,convalidacion_otras_causales,hace_lugar,escrita,,,https://drive.google.com/open?id=0B9wNhp3Gjjaz...,0:00:00,no,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde
2,3,455,4.0,2_8_2016,1313_16,Pablo_Casas,contravencional,52,codigo_contravencional,hostigamiento,no_corresponde,si,si,si,si,no,no,no,si,no,domestica,despues se llenan la boca hablando de ni una m...,varon cis,argentina,50,terciario_incompleto,mujer,argentina,23,s/d,,,zona_oeste,no,esporadico,ex_pareja,si,no,zona_oeste,en_domicilio_particular,no,24_7_14,,,interlocutoria,medida_cautelar,rebeldia_y_captura,hace_lugar,escrita,,,https://drive.google.com/open?id=0B9wNhp3Gjjaz...,0:00:00,si_defensa,rechaza_in_limine,CA_36_1,https://drive.google.com/file/d/1uZ7Kk2EkuvHOp...,no,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde
4,5,457,4.0,2_8_2016,3024_14,Pablo_Casas,penal,149bis,codigo_penal_de_la_nacion,amenazas,simples,si,no,si,si,no,si,no,si,no,domestica,"para que queres saber, esa plata es mia, me la...",varon cis,s/d,34,s/d,mujer,s/d,s/d,primario_incompleto,,,zona_oeste,no,habitual,pareja,s/d,s/d,zona_oeste,s/d,no,5_01_14,,,interlocutoria,suspension_del_proceso_a_prueba,admisibilidad,hace_lugar,oral,13:40:00,13:55:00,https://drive.google.com/open?id=0B9wNhp3Gjjaz...,0:15:00,no,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde
9,10,462,4.0,3_8_2016,10441_16,Pablo_Casas,penal,149bis,codigo_penal_de_la_nacion,amenazas,simples,si,si,si,no,no,si,no,si,no,domestica,ya los voy a matar,varon cis,s/d,s/d,s/d,mujer,peruana,s/d,s/d,,,zona_este,no,habitual,familiar,no,si,zona_este,en_domicilio_particular,no,8_07_16,,,interlocutoria,cuestion_de_competencia,declina_competencia,hace_lugar,escrita,,,https://drive.google.com/open?id=0B9wNhp3Gjjaz...,0:00:00,no,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde
20,21,473,4.0,18_8_2016,3756_15,Pablo_Casas,penal,149bis,codigo_penal_de_la_nacion,amenazas,simples,si,no,si,si,no,no,no,si,no,domestica,"yo hago lo que\rquiero, nadie me dice nada yo ...",varon cis,argentina,25,primario_completo,mujer,argentina,52,primario_completo,,,zona_sur,si,habitual,familiar,no,no,zona_sur,en_domicilio_particular,si,21_8_14,,,interlocutoria,recurso,reposicion,no_hace_lugar,escrita,,,https://drive.google.com/open?id=0B9wNhp3Gjjaz...,0:00:00,no,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde,no_corresponde
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
4198,4197,3548,38.0,17_06_2021,135558_21,Pablo_Casas,penal,92,codigo_penal_de_la_nacion,lesiones,agravado_violencia_de_genero,si,si,si,no,no,no,si,si,no,domestica,cuando te vea en la calle te voy a cagar a palos,varon cis,peruana,28/01/1900,primario_incompleto,mujer,argentina,26,secundario_incompleto,no,no_corresponde,zona_oeste,si,habitual,ex_pareja,si,si,zona_oeste,en_domicilio_particular,si,08_08_2020,,,interlocutoria,prorroga_investigacion_penal_preparatoria,90_dias,hace_lugar,escrita,,,https://drive.google.com/file/d/1O3-okVxAHjpLg...,0:00:00,,,,,,,,,,,,,,,,,,,
4199,4198,3548,38.0,17_06_2021,135558_21,Pablo_Casas,penal,189bis,codigo_penal_de_la_nacion,tenencia_de_arma,de_fuego_uso_civil,si,si,si,no,no,no,si,si,no,domestica,cuando te vea en la calle te voy a cagar a palos,varon cis,peruana,28/01/1900,primario_incompleto,mujer,argentina,26,secundario_incompleto,no,no_corresponde,zona_oeste,si,habitual,ex_pareja,si,si,zona_oeste,en_domicilio_particular,si,08_08_2020,,,interlocutoria,prorroga_investigacion_penal_preparatoria,90_dias,hace_lugar,escrita,,,https://drive.google.com/file/d/1O3-okVxAHjpLg...,0:00:00,,,,,,,,,,,,,,,,,,,
4200,4199,3549,38.0,17_06_2021,99105_21,Pablo_Casas,penal,53bis,codigo_contravencional,hostigamiento,agravado_violencia_de_genero,si,no,si,si,no,no,si,si,no,domestica,hija de puta_puta de mierda me estas abandonan...,varon cis,argentina,23/01/1900,s/d,mujer,argentina,21,s/d,no,s/d,zona_sur,no,habitual,pareja,si,no,zona_sur,en_domicilio_particular,no,01_02_2020,,,interlocutoria,prorroga_investigacion_penal_preparatoria,45_dias,hace_lugar,escrita,,,https://drive.google.com/file/d/1DDh0H7945cW2u...,0:00:00,,,,,,,,,,,,,,,,,,,
4201,4200,3550,38.0,17_06_2021,17425_20,Pablo_Casas,penal,149bis,codigo_penal_de_la_nacion,amenazas,simples,si,si,si,no,no,no,no,si,no,domestica,vos vas a trabajar ahi porque estas caliente c...,varon cis,argentina,1/02/1900,s/d,mujer,argentina,35,s/d,si,s/d,zona_oeste,no,habitual,pareja,si,si,zona_oeste,en_domicilio_particular,no,09_08_20,,,interlocutoria,suspension_del_proceso_a_prueba,mantiene,hace_lugar,oral,14:47:00,15:00:00,https://drive.google.com/file/d/1kMroAjOKIaSb4...,0:13:00,,,,,,,,,,,,,,,,,,,


Podemos acceder a la lista de datos de una columna dada con el método `tolist()`:

``` python
tabla_genero['CONDUCTA'].tolist()
```

Por ejemplo podemos extraer la lista de conductas denunciadas por mujeres:

In [7]:
tabla_genero[tabla_genero['GENERO_DENUNCIANTE'] == 'mujer' ]['CONDUCTA'].tolist()

['amenazas',
 'hostigamiento',
 'amenazas',
 'amenazas',
 'amenazas',
 'amenazas',
 'amenazas',
 'hostigamiento',
 'amenazas',
 'amenazas',
 'amenazas',
 'incumplimiento_deberes_familiares',
 'amenazas',
 'amenazas',
 'amenazas',
 'incumplimiento_deberes_familiares',
 'amenazas',
 'amenazas',
 'amenazas',
 'hostigamiento',
 'amenazas',
 'amenazas',
 'amenazas',
 'maltrato',
 'incumplimiento_deberes_familiares',
 'incumplimiento_deberes_familiares',
 'amenazas',
 'hostigamiento',
 'daños',
 'incumplimiento_deberes_familiares',
 'amenazas',
 'incumplimiento_deberes_familiares',
 'amenazas',
 'hostigamiento',
 'intimidacion',
 'amenazas',
 'amenazas',
 'amenazas',
 'hostigamiento',
 'amenazas',
 'hostigamiento',
 'amenazas',
 'amenazas',
 'daños',
 'amenazas',
 'usurpacion',
 'usurpacion',
 'amenazas',
 'maltrato',
 'hostigamiento',
 'amenazas',
 'amenazas',
 'incumplimiento_deberes_familiares',
 'amenazas',
 'incumplimiento_deberes_familiares',
 'amenazas',
 'amenazas',
 'amenazas',
 'ho

> Para pensar 🤔: ¿Cómo obtendrías los valores únicos de la lista anterior? 


Podríamos contar un tipo de denuncia en particular, utilizando el método `count()`:

In [10]:
tabla_genero[(tabla_genero['GENERO_DENUNCIANTE'] == 'mujer') & (tabla_genero['CONDUCTA'] == 'amenazas')].count()

N                                      478
NRO_REGISTRO                           478
TOMO                                   478
FECHA_RESOLUCION                       478
N_EXPTE_EJE                            478
                                      ... 
LINK_TSJ_1                             445
RECURSO_EXTRAORDINARIO_Y_RECURRENTE    445
DECISION_CSJN                          445
N_REGISTRO_Y_TOMO_CSJN                 445
LINK_CSJN                              445
Length: 72, dtype: int64




O grupar según el tipo de denuncia en particular, utilizando el método `groupby()`:

In [16]:
tabla_genero[(tabla_genero['GENERO_DENUNCIANTE'] == 'mujer')].groupby('CONDUCTA')[["N"]].count()

Unnamed: 0_level_0,N
CONDUCTA,Unnamed: 1_level_1
abandono_de_personas,1
abuso_de_armas,6
abuso_de_autoridad_e_incumplimiento_deberes_funcionario_publico,1
abuso_sexual,16
acoso_sexual_callejero,26
amenazas,478
atentado_contra_la_autoridad,5
daños,30
desobediencia_a_cargas_procesales,3
desobediencia_a_la_autoridad,57


In [24]:
tabla_genero[(tabla_genero['GENERO_DENUNCIANTE'] == 'lgbtiq+')].groupby('CONDUCTA')[["N"]].count()

Unnamed: 0_level_0,N
CONDUCTA,Unnamed: 1_level_1
amenazas,1
hostigamiento,1


### **Métodos de los DataFrames**

Veamos un resumen de los métodos que podés encontrar en Pandas para trabajar con DataFrames: 

| Lectura/carga de datos | Limpieza de los datos | Estdistica de los datos |
|-------------	|----------	|---	|
| pd.read_csv() | pd.head() | pd.describe() |
| pd.read_table() | pd.fillna() |df.sample()|
| pd.read_excel() | pd.dropna() | pd.mean() |
| pd.read_sql() | pd.sort_values() | pd.median() |
| pd.read_json() | pd.groupby() | pd.std() |
| pd.to_csv() |pd.apply() | pd.min() |
| pd.DataFrame() | pd.append() | pd.max() |
| pd.concat() | pd.rename()  | pd.count() |
| pd.Series() | pd.set_index() | pd.corr() |
| pd.DataFrame.from_dict() |  pd.tail() | pd.hist() |

## Análisis del dataset