## 1. Investiga un caso en la vida real donde podremos aplicar un modelo de Regresión Logística. Fundamenta.

#  Caso de aplicación de Regresión Logística: **Cobro**

##  Descripción del caso
El objetivo es predecir si una persona **realiza o no realiza un cobro** (por ejemplo, de un subsidio o beneficio social). Esta decisión puede depender de características personales y laborales.

##  Variables del modelo

- **Variables independientes (predictoras):**
  - `Edad`: número de años de la persona.
  - `Sexo`: masculino o femenino.
  - `Jerarquía`: nivel del cargo o puesto que ocupa (por ejemplo, operario, administrativo, directivo).
  - `Trabajo`: si la persona trabaja actualmente (`1` para sí, `0` para no).

- **Variable dependiente (respuesta):**
  - `Cobro`: si la persona realiza el cobro (`1`) o no (`0`).

##  Aplicación de la regresión logística
La regresión logística se utiliza para predecir una variable binaria (Cobro: sí o no) a partir de un conjunto de variables independientes. En este caso, permite estimar la 
**probabilidad de que una persona reciba un cobro** según sus características.


La regresión logística es el modelo adecuado porque:
- El resultado es binario (1 o 0).
- Permite interpretar la influencia de cada variable en la probabilidad de cobro.
- Es útil para tomar decisiones o hacer evaluaciones en políticas sociales o económicas.



### Para empezar el desarrollo realizaremos las importaciones de las librerias que vamos a utilizar.

In [13]:
import pandas as pd

### ahora utilizaremos el dataset seleccionado

In [14]:
df=pd.read_csv("salarios.csv")
df.head(2)

Unnamed: 0,estoy_trabajando_en,donde_estas_trabajando,dedicacion,tipo_de_contrato,ultimo_salario_mensual_o_retiro_bruto_en_tu_moneda_local,ultimo_salario_mensual_o_retiro_neto_en_tu_moneda_local,pagos_en_dolares,si_tu_sueldo_esta_dolarizado_cual_fue_el_ultimo_valor_del_dolar_que_tomaron,pagos_en_criptomonedas,que_porcentaje_o_monto_recibis_en_criptomonedas,...,salir_o_seguir_contestando_sobre_las_guardias,tenes_guardias,cuanto_cobras_por_guardia,porcentajebruto_o_neto,salir_o_seguir_contestando_sobre_estudios,tengo_edad,me_identifico_genero,sueldo_dolarizado,seniority,me_id_extra
0,Argentina,Buenos Aires,Full-Time,Staff (planta permanente),475480.0,396346,,,,,...,,,,,,25,Varón Cis,False,Semi-Senior,Hombre Cis
1,Argentina,Ciudad Autónoma de Buenos Aires,Full-Time,Staff (planta permanente),260000.0,220000,,,,,...,,,,,,27,Mujer Cis,False,Junior,Mujer Cis


In [15]:
df["label"]=df["sueldo_dolarizado"].map({False:0, True:1})
df

Unnamed: 0,estoy_trabajando_en,donde_estas_trabajando,dedicacion,tipo_de_contrato,ultimo_salario_mensual_o_retiro_bruto_en_tu_moneda_local,ultimo_salario_mensual_o_retiro_neto_en_tu_moneda_local,pagos_en_dolares,si_tu_sueldo_esta_dolarizado_cual_fue_el_ultimo_valor_del_dolar_que_tomaron,pagos_en_criptomonedas,que_porcentaje_o_monto_recibis_en_criptomonedas,...,tenes_guardias,cuanto_cobras_por_guardia,porcentajebruto_o_neto,salir_o_seguir_contestando_sobre_estudios,tengo_edad,me_identifico_genero,sueldo_dolarizado,seniority,me_id_extra,label
0,Argentina,Buenos Aires,Full-Time,Staff (planta permanente),475480.0,396346,,,,,...,,,,,25,Varón Cis,False,Semi-Senior,Hombre Cis,0
1,Argentina,Ciudad Autónoma de Buenos Aires,Full-Time,Staff (planta permanente),260000.0,220000,,,,,...,,,,,27,Mujer Cis,False,Junior,Mujer Cis,0
2,Argentina,Ciudad Autónoma de Buenos Aires,Full-Time,Staff (planta permanente),106350.0,88560,,,,,...,,,,,21,Varón Cis,False,Junior,Hombre Cis,0
3,Argentina,Ciudad Autónoma de Buenos Aires,Full-Time,Staff (planta permanente),339000.0,283700,,,,,...,No,0.0,Porcentaje de mi sueldo bruto,Responder sobre mis estudios,25,Varón Cis,False,Semi-Senior,Hombre Cis,0
4,Argentina,Río Negro,Full-Time,Staff (planta permanente),380000.0,320000,Mi sueldo está dolarizado (pero cobro en moned...,179,,,...,,,,,24,Varón Cis,True,Junior,Hombre Cis,1
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
5762,Argentina,Ciudad Autónoma de Buenos Aires,Full-Time,Staff (planta permanente),897000.0,540000,,,,,...,No,0.0,Bruto,Terminar encuesta,39,Varón Cis,False,Senior,Hombre Cis,0
5763,Argentina,Tucumán,Full-Time,Staff (planta permanente),130000.0,295000,,,,,...,,,,,40,Varón Cis,False,Senior,Hombre Cis,0
5764,Argentina,Buenos Aires,Part-Time,Freelance,250000.0,250000,,,,,...,,,,,21,Varón Cis,False,Senior,Hombre Cis,0
5765,Argentina,Ciudad Autónoma de Buenos Aires,Full-Time,Staff (planta permanente),230000.0,160000,,,,,...,,,,,29,Varón Cis,False,Semi-Senior,Hombre Cis,0


In [16]:
from sklearn.feature_extraction.text import TfidfVectorizer

vectorizer=TfidfVectorizer(max_features=5000, stop_words="english")
x =vectorizer.fit_transform(df["sueldo_dolarizado"].astype(str))
y=df["label"]

In [17]:
from sklearn.linear_model import LogisticRegression
model=LogisticRegression(max_iter=1000)

In [18]:
model.fit(x, y)