In [120]:
import pandas as pd
import pyreadstat
from collections import Counter


In [3]:
df = pd.read_spss('BBDD Alcohol.sav')

In [4]:
df.head(5)

Unnamed: 0,caso,FILTRO_A,FILTRO_B,FILTRO_C,FILTRO_C2,NSE,NSE2,P1,P2,LIMAS,...,P34_4,P34_5,P34_6,P34_7,P34_8,P34_NR,p159v1,vpond,VPOND1,VPOND2
0,1.0,No,Sí,39.0,36 a 45 años [36-45,NSE C1,C1,Masculino,San Juan de Lurigancho,LIMA ESTE,...,,3,,,1.0,,7,1.0,1.297614,1.111111
1,2.0,No,Sí,41.0,36 a 45 años [36-45,NSE C1,C1,Masculino,San Juan de Lurigancho,LIMA ESTE,...,,1 botella,,,,,8,1.0,1.297614,1.111111
2,3.0,No,Sí,43.0,36 a 45 años [36-45,NSE C1,C1,Masculino,San Juan de Lurigancho,LIMA ESTE,...,,1,,,,,9,1.0,1.297614,1.111111
3,4.0,No,Sí,51.0,46 a 55 años [46-55,NSE B2,B2,Masculino,Comas,LIMA ESTE,...,,,,1.0,,,10,1.0,0.893146,0.933333
4,5.0,No,Sí,51.0,46 a 55 años [46-55,NSE C1,C1,Femenino,Lima,LIMA CENTRO,...,,1,,1.0,,,11,1.0,1.183471,1.230769


# Primera parte que son los `FILTROS`

In [5]:
filtros = df.iloc[:, :7]

filtros

Unnamed: 0,caso,FILTRO_A,FILTRO_B,FILTRO_C,FILTRO_C2,NSE,NSE2
0,1.0,No,Sí,39.0,36 a 45 años [36-45,NSE C1,C1
1,2.0,No,Sí,41.0,36 a 45 años [36-45,NSE C1,C1
2,3.0,No,Sí,43.0,36 a 45 años [36-45,NSE C1,C1
3,4.0,No,Sí,51.0,46 a 55 años [46-55,NSE B2,B2
4,5.0,No,Sí,51.0,46 a 55 años [46-55,NSE C1,C1
...,...,...,...,...,...,...,...
295,296.0,No,Sí,52.0,46 a 55 años [46-55,NSE B1,B1
296,297.0,No,Sí,39.0,36 a 45 años [36-45,NSE D,D
297,298.0,No,Sí,36.0,36 a 45 años [36-45,NSE D,D
298,299.0,No,Sí,42.0,36 a 45 años [36-45,NSE D,D


Verficamos la columna `FILTRO_A`

Se puede ver todas las respuestas fueron ``no``

In [6]:
df['FILTRO_A'].unique()

['No']
Categories (1, object): ['No']

Verficamos la columna `FILTRO_B`

Se puede ver todas las respuestas fueron ``si`

In [7]:
df['FILTRO_B'].unique()

['Sí']
Categories (1, object): ['Sí']

Verficamos la columna `FILTRO_C`, el cual es la edad de los encuestados. 

Veremos los datos estadísticos de edades de los encuestados. 

* count   -> 300.000000 -> Tenemos un total de 300 usuarios. 
* media ->     38.233333 -> la edad promedio de los encuestados es de 38 años. 
* desviación estándar ->     10.604736
* mínimo   ->    18.000000 -> edad mínima de los encuestados. 
* 25%   ->    29.000000 
* 50%    ->   39.000000
* 75%  ->     46.000000
* máximo   ->    62.000000 -> edad maxima de los encuestados. 

In [8]:
df['FILTRO_C'].unique()

array([39., 41., 43., 51., 33., 50., 24., 22., 40., 54., 38., 28., 35.,
       31., 32., 49., 26., 56., 21., 27., 62., 55., 37., 36., 34., 29.,
       60., 20., 45., 42., 58., 46., 30., 53., 25., 47., 52., 48., 19.,
       44., 18., 23., 61.])

In [9]:
#cambiamos el tipo de dato a entero
df['FILTRO_C'].astype(int)

0      39
1      41
2      43
3      51
4      51
       ..
295    52
296    39
297    36
298    42
299    30
Name: FILTRO_C, Length: 300, dtype: int32

In [10]:
#Ahora veremos los datos estadisticos que se obtiene de las edades de los encuestados 
df['FILTRO_C'].describe()

count    300.000000
mean      38.233333
std       10.604736
min       18.000000
25%       29.000000
50%       39.000000
75%       46.000000
max       62.000000
Name: FILTRO_C, dtype: float64

In [11]:
#verificamos datos unicos 
df['FILTRO_C2'].unique()

['36 a 45 años [36-45', '46 a 55 años [46-55', '25 a 35 años [25-35', '18 a 24 años [18-24', '56 a 65 años  [56-65']
Categories (5, object): ['18 a 24 años [18-24', '25 a 35 años [25-35', '36 a 45 años [36-45', '46 a 55 años [46-55', '56 a 65 años  [56-65']

Reducimos el rango de edades a una version mas resumida, por ejemplo:
 ``'36 a 45 años [36-45'`` -> ``'36 a 45 años'``

In [12]:
df['FILTRO_C2'] =df['FILTRO_C2'].apply(lambda x: x[:12])

# Segundo apartado `DATOS DEL PERFIL`

In [13]:
datos_perfil = df.iloc[:, 7:11]

datos_perfil

Unnamed: 0,P1,P2,LIMAS,P3
0,Masculino,San Juan de Lurigancho,LIMA ESTE,Trabajador dependiente
1,Masculino,San Juan de Lurigancho,LIMA ESTE,Trabajador dependiente
2,Masculino,San Juan de Lurigancho,LIMA ESTE,Trabajador dependiente
3,Masculino,Comas,LIMA ESTE,Trabajador dependiente
4,Femenino,Lima,LIMA CENTRO,Trabajador independiente
...,...,...,...,...
295,Masculino,Villa el Salvador,LIMA SUR,Trabajador independiente
296,Femenino,San Juan de Lurigancho,LIMA ESTE,Su casa
297,Femenino,Callao,CALLAO,Su casa
298,Masculino,Lima,LIMA CENTRO,Trabajador independiente


Verificamos los datos unicos en la columna, y como era de esperarse solo existen dos categorias masculino y femenino. 

In [14]:
df['P1'].unique()

['Masculino', 'Femenino']
Categories (2, object): ['Femenino', 'Masculino']

In [15]:
df['P2'].unique()

['San Juan de Lurigancho', 'Comas', 'Lima', 'Villa María del Triunfo', 'Los Olivos', ..., 'Rímac', 'Carmen de la Legua', 'Surquillo', 'San Luis', 'La Perla']
Length: 36
Categories (36, object): ['Ate', 'Breña', 'Callao', 'Carabayllo', ..., 'Surquillo', 'Ventanilla', 'Villa María del Triunfo', 'Villa el Salvador']

Eliminaremos la columna ´LIMAS´, debido a que no se encuentra en el formulario, por ahora se considera irrelevante. 

In [16]:
df = df.drop('LIMAS', axis=1)

Verfificamos los datos unicos de la columna `P3` el cual es la ocupacion de los encuestados. 

Se puede ver que hay ocho categorias, por lo tanto no hay datos nulos. 

Ahora veremos los datos estadisticos:
* Total ->                         300
* unique ->                          8
* top    ->   Trabajador independiente
* freq  ->                         134


Se puede ver que la mayoria de encuestados con trabajadores independientes. 


In [17]:
df['P3'].unique()

['Trabajador dependiente', 'Trabajador independiente', 'Su casa', 'Eventual / cachuelos', 'Desempleado', 'Estudia', 'Jubilado', 'Sus rentas']
Categories (8, object): ['Desempleado', 'Estudia', 'Eventual / cachuelos', 'Jubilado', 'Su casa', 'Sus rentas', 'Trabajador dependiente', 'Trabajador independiente']

In [18]:
df['P3'].describe()

count                          300
unique                           8
top       Trabajador independiente
freq                           134
Name: P3, dtype: object

In [19]:
df['P3'].value_counts()

P3
Trabajador independiente    134
Su casa                      81
Trabajador dependiente       67
Eventual / cachuelos         10
Desempleado                   3
Estudia                       3
Jubilado                      1
Sus rentas                    1
Name: count, dtype: int64

# Tercer apartado `HABITOS DE PÚBLICO OBJETIVO`

In [20]:
# todo se ve hab_publi_obj = df.iloc[:, 10:62]
hab_publi_obj = df.iloc[:, 10:30]

hab_publi_obj

Unnamed: 0,P4,P5_1,P5_2,P5_3,P5_4,P5_5,P6_1,P6_2,P6_3,P6_4,P6_5,P7_1_1,P7_1_2,P7_1_3,P7_2_1,P7_2_2,P7_2_3,P7_2_4,P7_3_1,P7_3_2
0,Sí,Spray,Botella,Con pulverizador,,,Spray,Con pulverizador,,,,Desinfección de objetos y superficies,,,,,,,,
1,Sí,Spray,Botella,,,,Spray,,,,,,,,Desinfección de manos,Desinfección de objetos y superficies,,,Desinfección de objetos y superficies,
2,Sí,Botella,,,,,Spray,,,,,,,,Desinfección de manos,Desinfección de objetos y superficies,,,Desinfección de objetos y superficies,
3,Sí,Spray,Botella,,,,Spray,Botella,,,,Desinfección del cuerpo / personas que entran ...,,,,,,,Desinfección de manos,Desinfección de objetos y superficies
4,Sí,Spray,Botella,,,,Spray,,,,,,,,Desinfección de manos,,,,Desinfección de objetos y superficies,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
295,Sí,Spray,Botella,,,,Spray,,,,,,,,Desinfección de manos,Desinfección de objetos y superficies,,,Desinfección de manos,Curar heridas
296,Sí,Botella,,,,,Botella,,,,,,,,,,,,Desinfección de manos,Desinfección de objetos y superficies
297,Sí,Spray,Botella,Con pulverizador,,,Spray,Botella,Con pulverizador,,,,,,Desinfección de manos,Desinfección de objetos y superficies,,,Lo uso para llenar el spray o algún frasco,
298,Sí,Spray,Botella,,,,Spray,,,,,,,,Desinfección de manos,,,,Desinfección de manos,Desinfección de objetos y superficies


Verificamos si la columna `P4` tiene datos nulos o respuestas `no`.

Se puede ver que todas las respuestas son `si`, por lo tanto no hay incongruencias. 

In [21]:
df['P4'].unique()

['Sí']
Categories (1, object): ['Sí']

Verificamos la columna `P5_1`, donde el usuario debe indicar que presentaciones usa 'Pensando en un uso familiar'. 



In [22]:
columnas = ['P5_1', 'P5_2', 'P5_3', 'P5_4', 'P5_5']

def combine_columns(row):
    values = [str(row[col]) for col in columnas if not pd.isna(row[col])]
    return ','.join(values)

df['P5'] = df.apply(combine_columns, axis=1)



Unimos toda la columna y hallamos la palabra mas mencionada. 

In [23]:
palabras = []
for fila in df['P5']:
    palabras += fila.split(',') 

In [24]:
contador_palabras = Counter(palabras)

In [25]:
for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Spray' - Conteo: 197
Palabra: 'Botella' - Conteo: 282
Palabra: 'Con pulverizador' - Conteo: 117
Palabra: 'Dispensador' - Conteo: 118
Palabra: 'Con chupón' - Conteo: 32
Palabra: 'Galonera' - Conteo: 1


Eliminarmos las colummas ``['P5_1', 'P5_2', 'P5_3', 'P5_4', 'P5_5']``

In [26]:
df.drop(columns=['P5_1', 'P5_2', 'P5_3', 'P5_4', 'P5_5'], axis=1, inplace=True)

In [27]:
df['P5']

0      Spray,Botella,Con pulverizador
1                       Spray,Botella
2                             Botella
3                       Spray,Botella
4                       Spray,Botella
                    ...              
295                     Spray,Botella
296                           Botella
297    Spray,Botella,Con pulverizador
298                     Spray,Botella
299                     Spray,Botella
Name: P5, Length: 300, dtype: object

In [28]:
df['P5'].describe()

count         300
unique         23
top       Botella
freq           56
Name: P5, dtype: object

In [29]:
df['P5'].value_counts()

P5
Botella                                                  56
Spray,Botella                                            55
Dispensador,Spray,Botella,Con pulverizador               48
Spray,Botella,Con pulverizador                           38
Dispensador,Spray,Botella                                25
Dispensador,Botella                                      19
Spray,Botella,Con chupón                                 10
Dispensador,Spray,Botella,Con chupón,Con pulverizador     9
Botella,Con pulverizador                                  9
Botella,Con chupón                                        5
Dispensador,Botella,Con pulverizador                      4
Dispensador                                               4
Spray,Con pulverizador                                    3
Dispensador,Spray                                         3
Con chupón                                                3
Dispensador,Spray,Con pulverizador                        2
Dispensador,Con pulverizador         

Verificamos la columna `P6_1, 2,3,4 y 5`, donde el usuario debe indicar que presentaciones usa 'Pensando en un uso personal'. 

In [30]:
columnasp6 = ['P6_1', 'P6_2', 'P6_3', 'P6_4', 'P6_5']

def combine_columns(row):
    values = [str(row[col]) for col in columnasp6 if not pd.isna(row[col])]
    return ','.join(values)

df['P6'] = df.apply(combine_columns, axis=1)

Eliminamos las columnas ``['P6_1', 'P6_2', 'P6_3', 'P6_4', 'P6_5']``

In [31]:
df.drop(columns=['P6_1', 'P6_2', 'P6_3', 'P6_4', 'P6_5'], axis=1, inplace=True)

In [32]:
palabras = []
for fila in df['P6']:
    palabras += fila.split(',') 

In [33]:
contador_palabras = Counter(palabras)

In [34]:
for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Spray' - Conteo: 240
Palabra: 'Con pulverizador' - Conteo: 51
Palabra: 'Botella' - Conteo: 89
Palabra: 'Dispensador' - Conteo: 56
Palabra: 'Con chupón' - Conteo: 15


In [35]:
df['P6'].describe()

count       300
unique       20
top       Spray
freq        148
Name: P6, dtype: object

In [36]:
df['P6'].value_counts()

P6
Spray                                                    148
Botella                                                   28
Spray,Botella                                             21
Spray,Con pulverizador                                    18
Dispensador,Spray                                         16
Spray,Botella,Con pulverizador                            10
Dispensador                                               10
Dispensador,Spray,Botella,Con pulverizador                 9
Dispensador,Spray,Botella                                  7
Con chupón                                                 6
Dispensador,Botella                                        6
Spray,Con chupón                                           4
Con pulverizador                                           4
Dispensador,Spray,Con pulverizador                         3
Botella,Con pulverizador                                   2
Dispensador,Spray,Botella,Con chupón,Con pulverizador      2
Spray,Botella,Con chu

Unimos las columnas de respuestas dadas para ``dispensador``

In [37]:
columnasD = ['P7_1_1', 'P7_1_2','P7_1_3']

def combine_columns(row):
    values = [str(row[col]) for col in columnasD if not pd.isna(row[col])]
    return ','.join(values)

df['P7_1'] = df.apply(combine_columns, axis=1)

Eliminamos las columnas ``['P7_1_1', 'P7_1_2','P7_1_3']``

In [38]:
df.drop(columns=['P7_1_1', 'P7_1_2','P7_1_3'], axis=1, inplace=True)

In [39]:
palabras = []
for fila in df['P7_1']:
    palabras += fila.split(',') 

In [40]:
contador_palabras = Counter(palabras)

In [41]:
for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Desinfección de objetos y superficies' - Conteo: 45
Palabra: '' - Conteo: 167
Palabra: 'Desinfección del cuerpo / personas que entran a la casa' - Conteo: 6
Palabra: 'Desinfección de manos' - Conteo: 123
Palabra: 'Curar heridas' - Conteo: 10
Palabra: 'Desinfección de ropa' - Conteo: 2
Palabra: 'Lo uso para llenar el spray o algún frasco' - Conteo: 1
Palabra: 'Desinfectar las compras' - Conteo: 1


Unimos las columnas de respuestas dadas para ``Spray``

In [42]:
columnasS= ['P7_2_1', 'P7_2_2', 'P7_2_3' ,'P7_2_4' ]

def combine_columns(row):
    values = [str(row[col]) for col in columnasS if not pd.isna(row[col])]
    return ','.join(values)

df['P7_2'] = df.apply(combine_columns, axis=1)

Eliminamos las columnas ``['P7_2_1', 'P7_2_2', 'P7_2_3' ,'P7_2_4' ]``

In [43]:
df.drop(columns=['P7_2_1', 'P7_2_2', 'P7_2_3' ,'P7_2_4' ], axis=1, inplace=True)

In [44]:
palabras = []
for fila in df['P7_2']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: '' - Conteo: 50
Palabra: 'Desinfección de manos' - Conteo: 227
Palabra: 'Desinfección de objetos y superficies' - Conteo: 142
Palabra: 'Desinfección de alimentos' - Conteo: 1
Palabra: 'Desinfección del cuerpo / personas que entran a la casa' - Conteo: 10
Palabra: 'Curar heridas' - Conteo: 13
Palabra: 'Desinfección de vehículos' - Conteo: 2
Palabra: 'Desinfectar monedas en la calle' - Conteo: 6
Palabra: 'Desinfección de ropa' - Conteo: 12
Palabra: 'Para llevarlo en la cartera o mochila' - Conteo: 2
Palabra: 'Para el dolor de cabeza' - Conteo: 2
Palabra: 'Para bajar la fiebre' - Conteo: 2
Palabra: 'Desinfectar las compras' - Conteo: 3


In [45]:
df['P7_2'].value_counts()

P7_2
Desinfección de manos,Desinfección de objetos y superficies                                                                          107
Desinfección de manos                                                                                                                 82
                                                                                                                                      50
Desinfección de objetos y superficies                                                                                                 13
Desinfección de manos,Desinfección de objetos y superficies,Curar heridas                                                              6
Desinfección de manos,Desinfectar monedas en la calle                                                                                  5
Desinfección de manos,Desinfección de ropa                                                                                             5
Desinfección de manos,Desinfección d

Unimos las columnas de respuestas dadas para ``Botella``

In [46]:
columnasB= ['P7_3_1', 'P7_3_2', 'P7_3_3' ,'P7_3_4' ]

def combine_columns(row):
    values = [str(row[col]) for col in columnasB if not pd.isna(row[col])]
    return ','.join(values)

df['P7_3'] = df.apply(combine_columns, axis=1)

Eliminamos las colunmas  ``['P7_3_1', 'P7_3_2', 'P7_3_3' ,'P7_3_4' ]``

In [47]:
df.drop(columns=['P7_3_1', 'P7_3_2', 'P7_3_3' ,'P7_3_4' ], axis=1, inplace=True)

In [48]:
palabras = []
for fila in df['P7_3']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: '' - Conteo: 20
Palabra: 'Desinfección de objetos y superficies' - Conteo: 161
Palabra: 'Desinfección de manos' - Conteo: 133
Palabra: 'Curar heridas' - Conteo: 87
Palabra: 'Lo uso para llenar el spray o algún frasco' - Conteo: 51
Palabra: 'Desinfección del cuerpo / personas que entran a la casa' - Conteo: 8
Palabra: 'Para bajar la fiebre' - Conteo: 3
Palabra: 'Desinfección de ropa' - Conteo: 11
Palabra: 'Desinfección de alimentos' - Conteo: 4
Palabra: 'No precisa' - Conteo: 1
Palabra: 'Desinfectar las compras' - Conteo: 3
Palabra: 'Para limpieza del hogar' - Conteo: 6
Palabra: 'Para llevarlo en la cartera o mochila' - Conteo: 4
Palabra: 'Desinfectar monedas en la calle' - Conteo: 1


Unimos las columnas de respuestas dadas para ``Chupon``

Unimos las columnas de los comentarios de uso para ``con Chupon`` 

In [49]:
columnasC= ['P7_4_1', 'P7_4_2', 'P7_4_3' ]

def combine_columns(row):
    values = [str(row[col]) for col in columnasC if not pd.isna(row[col])]
    return ','.join(values)

df['P7_4'] = df.apply(combine_columns, axis=1)

Eliminamos als columnas ``['P7_4_1', 'P7_4_2', 'P7_4_3' ]``

In [50]:
df.drop(columns=['P7_4_1', 'P7_4_2', 'P7_4_3' ], axis=1, inplace=True)

In [51]:
palabras = []
for fila in df['P7_4']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: '' - Conteo: 262
Palabra: 'Curar heridas' - Conteo: 8
Palabra: 'Desinfección del cuerpo / personas que entran a la casa' - Conteo: 1
Palabra: 'Desinfección de manos' - Conteo: 34
Palabra: 'Desinfección de objetos y superficies' - Conteo: 9
Palabra: 'Para limpieza del hogar' - Conteo: 1


In [52]:
df['P7_4'].value_counts()

P7_4
                                                                             262
Desinfección de manos                                                         22
Desinfección de manos,Desinfección de objetos y superficies                    5
Desinfección de manos,Desinfección de objetos y superficies,Curar heridas      3
Desinfección de manos,Curar heridas                                            3
Curar heridas                                                                  2
Desinfección del cuerpo / personas que entran a la casa                        1
Desinfección de manos,Para limpieza del hogar                                  1
Desinfección de objetos y superficies                                          1
Name: count, dtype: int64

Unimos las columnas de respuestas dadas para ``Con pulverizador``

In [53]:
columnasP= ['P7_5_1', 'P7_5_2', 'P7_5_3' ]

def combine_columns(row):
    values = [str(row[col]) for col in columnasP if not pd.isna(row[col])]
    return ','.join(values)

df['P7_5'] = df.apply(combine_columns, axis=1)

Eliminamos las columasn ``['P7_5_1', 'P7_5_2', 'P7_5_3' ]``

In [54]:
df.drop(columns=['P7_5_1', 'P7_5_2', 'P7_5_3' ], axis=1, inplace=True)

In [55]:
palabras = []
for fila in df['P7_5']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Desinfección de objetos y superficies' - Conteo: 97
Palabra: '' - Conteo: 175
Palabra: 'Curar heridas' - Conteo: 6
Palabra: 'Desinfección de manos' - Conteo: 41
Palabra: 'Desinfección de ropa' - Conteo: 24
Palabra: 'Desinfección del cuerpo / personas que entran a la casa' - Conteo: 20
Palabra: 'Desinfectar las compras' - Conteo: 4
Palabra: 'Para bajar la fiebre' - Conteo: 1
Palabra: 'Desinfección de alimentos' - Conteo: 1


In [56]:
df['P7_5'].value_counts()

P7_5
                                                                                                                         175
Desinfección de objetos y superficies                                                                                     54
Desinfección de manos,Desinfección de objetos y superficies                                                               19
Desinfección del cuerpo / personas que entran a la casa                                                                    9
Desinfección de objetos y superficies,Desinfección de ropa                                                                 7
Desinfección de manos,Desinfección de ropa                                                                                 5
Desinfección de manos,Desinfección de objetos y superficies,Curar heridas                                                  4
Desinfección de ropa                                                                                                    

Unimos las columnas de respuestas dadas para ``Otras respuestas``

In [57]:
df['P7_6_4'].unique()

[NaN, 'Desinfección del cuerpo / personas que entran..., 'Desinfección de ropa']
Categories (2, object): ['Desinfección de ropa', 'Desinfección del cuerpo / personas que entran...]

In [58]:
columnaO= ['P7_6_1', 'P7_6_2', 'P7_6_3', 'P7_6_4']

def combine_columns(row):
    values = [str(row[col]) for col in columnaO if not pd.isna(row[col])]
    return ','.join(values)

df['P7_6'] = df.apply(combine_columns, axis=1)

Eliminamos las columnas ``['P7_6_1', 'P7_6_2', 'P7_6_3', 'P7_6_4']``

In [59]:
df.drop(columns=['P7_6_1', 'P7_6_2', 'P7_6_3', 'P7_6_4'], axis=1, inplace=True)

In [60]:
palabras = []
for fila in df['P7_6']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: '' - Conteo: 293
Palabra: 'Desinfección de manos' - Conteo: 5
Palabra: 'Desinfección de objetos y superficies' - Conteo: 3
Palabra: 'Desinfección de ropa' - Conteo: 5
Palabra: 'Desinfección del cuerpo / personas que entran a la casa' - Conteo: 3
Palabra: 'Curar heridas' - Conteo: 1
Palabra: 'Desinfectar monedas en la calle' - Conteo: 1
Palabra: 'Desinfección de alimentos' - Conteo: 1
Palabra: 'Desinfectar las compras' - Conteo: 1


In [61]:
df['P7_6'].value_counts()

P7_6
                                                                                                                                            293
Desinfección de manos,Desinfección de objetos y superficies,Desinfección de ropa,Desinfección del cuerpo / personas que entran a la casa      1
Desinfección de manos,Desinfección de objetos y superficies,Curar heridas,Desinfección de ropa                                                1
Desinfección de manos,Desinfectar monedas en la calle                                                                                         1
Desinfección de manos,Desinfección de objetos y superficies                                                                                   1
Desinfección de ropa,Desinfección del cuerpo / personas que entran a la casa,Desinfección de alimentos                                        1
Desinfección de ropa,Desinfectar las compras                                                                                       

Unimos las columnas de la pregunta 8, par aluego analizarlas de manera conjunta. 

In [62]:
columnaP8= ['P8_1', 'P8_2', 'P8_3', 'P8_4', 'P8_5']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP8 if not pd.isna(row[col])]
    return ','.join(values)

df['P8'] = df.apply(combine_columns, axis=1)

Eliminamos las columnas ``['P8_1', 'P8_2', 'P8_3', 'P8_4', 'P8_5']``

In [63]:
df.drop(columns=['P8_1', 'P8_2', 'P8_3', 'P8_4', 'P8_5'], axis=1, inplace=True)

In [64]:
df['P8'].value_counts()

P8
Botica/Farmacia de mi barrio                                                                                                                   49
Botica/Farmacia de cadena                                                                                                                      46
Botica/Farmacia de mi barrio,Botica/Farmacia de cadena                                                                                         40
Botica/Farmacia de cadena,Supermercado                                                                                                         22
Botica/Farmacia de mi barrio,Bodega                                                                                                            13
Botica/Farmacia de mi barrio,Mercado                                                                                                            9
Botica/Farmacia de mi barrio,Supermercado                                                                                

In [65]:
palabras = []
for fila in df['P8']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Botica/Farmacia de mi barrio' - Conteo: 187
Palabra: 'Botica/Farmacia de cadena' - Conteo: 171
Palabra: 'Mercado' - Conteo: 27
Palabra: 'Farmacias dentro de supermercados' - Conteo: 35
Palabra: 'Bodega' - Conteo: 49
Palabra: 'Vendedor independiente amigo/conocido' - Conteo: 29
Palabra: 'Supermercado' - Conteo: 55
Palabra: 'Mayoristas' - Conteo: 3
Palabra: 'Autoservicios' - Conteo: 1
Palabra: 'Tiendas de artículos de aseo' - Conteo: 2
Palabra: 'Minimarket' - Conteo: 3


Verificamos la Pregunta 9, donde el usuario repsonde el lugar donde compra alcohol con mayor frecuencia. 

In [66]:
df['P9'].value_counts()

P9
Botica/Farmacia de cadena                124
Botica/Farmacia de mi barrio             120
(no responde)                             19
Bodega                                    11
Vendedor independiente amigo/conocido     11
Supermercado                              10
Farmacias dentro de supermercados          5
Name: count, dtype: int64

Verificamos la Pregunta 10, donde el usuario repsonde el lugar donde le genere mayor confianza.  

In [67]:
df['P10'].value_counts()

P10
Botica/Farmacia de cadena                148
Botica/Farmacia de mi barrio             105
(no responde)                             11
Supermercado                              10
Bodega                                     9
Vendedor independiente amigo/conocido      9
Farmacias dentro de supermercados          8
Name: count, dtype: int64

Verificamos la Pregunta 11, donde el usuario repsonde que tan satisfecho se encuentra con la marca de alcohol que usa.  

In [68]:
df['P11'].value_counts()

P11
4. Satisfecho                       188
5. Muy satisfecho                   100
3. Ni satisfecho ni insatisfecho     10
2. Insatisfecho                       2
Name: count, dtype: int64

In [69]:
df['P11'].describe()

count               300
unique                4
top       4. Satisfecho
freq                188
Name: P11, dtype: object

Unimos las columnas de la pregunta 12, el cual dice porque se siente satsifecho, muy satisfecho, etc. 

In [70]:
columnaP12= ['P12_1_1','P12_1_2',	'P12_2_1',	'P12_2_2',	'P12_3_1',	'P12_3_2',	'P12_3_3',	'P12_3_4',	'P12_3_5']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP12 if not pd.isna(row[col])]
    return ','.join(values)

df['P12'] = df.apply(combine_columns, axis=1)

In [71]:
df['P12'].describe()

count                                               300
unique                                              146
top       Porque desinfecta (mata gérmenes y bacterias)
freq                                                 20
Name: P12, dtype: object

In [72]:
palabras = []
for fila in df['P12']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Porque es de una marca reconocida' - Conteo: 20
Palabra: 'Porque desinfecta (mata gérmenes y bacterias)' - Conteo: 97
Palabra: 'Porque me protege contra el COVID' - Conteo: 22
Palabra: 'Porque no me da inconvenientes' - Conteo: 18
Palabra: 'Porque puedo desinfectar objetos' - Conteo: 9
Palabra: 'Porque no irrita la piel' - Conteo: 61
Palabra: 'Porque tiene buen aroma / se siente el alcohol' - Conteo: 64
Palabra: 'Porque puedo desinfectar superficies' - Conteo: 7
Palabra: 'Porque es puro' - Conteo: 60
Palabra: 'Porque es de calidad' - Conteo: 36
Palabra: 'Porque no me genera alergia' - Conteo: 2
Palabra: 'Porque es económico' - Conteo: 33
Palabra: 'Porque me da confianza' - Conteo: 29
Palabra: 'Porque no es pegajoso' - Conteo: 6
Palabra: 'Porque cura las heridas' - Conteo: 1
Palabra: 'Porque es práctico' - Conteo: 5
Palabra: 'Porque desinfecta la piel' - Conteo: 29
Palabra: 'Porque no se ha renovado el empaque' - Conteo: 1
Palabra: 'Porque demora en evaporarse' - Conteo: 15
Pa

Eliminamos las columnas ``['P12_1_1','P12_1_2',	'P12_2_1',	'P12_2_2',	'P12_3_1',	'P12_3_2',	'P12_3_3',	'P12_3_4',	'P12_3_5']``

In [73]:
df.drop(columns=['P12_1_1','P12_1_2',	'P12_2_1',	'P12_2_2',	'P12_3_1',	'P12_3_2',	'P12_3_3',	'P12_3_4',	'P12_3_5'], axis=1, inplace=True)

# Cuarto apartado `ATRIBUTOS VALORADOS - ALCOHOL LIQUIDO EN BOTELLA`

Ahora vamos a hablar sobre los atributos de las marcas que venden alcohol líquido en botella.

In [74]:
# alc_liqu_botella = df.iloc[:, 62:112]
alc_liqu_botella = df.iloc[:, 130:146]

alc_liqu_botella

Unnamed: 0,P27_6,P27_7,P27_8,P28_1,P28_2,P28_3,P28_4,P28_5,P28_6,P29_1,P29_2,P29_3,P29_4,P29_5,P29_6,P29_7
0,,,,Alcohol puro 96°,,,,,,,Una vez cada 6 meses,Una vez al año,,Una vez cada 2 o 3 meses,,
1,,,,Alcohol puro 96°,,,,,,Una vez al mes,,,,Una vez cada 2 o 3 meses,,
2,,,,Alcohol puro 96°,,,,,,Una vez cada 2 o 3 meses,,,,Una vez al año,,
3,,,,Alcohol puro 96°,Alcohol en gel,,,,,,Una vez al año,,,Una vez cada 6 meses,,Nunca
4,,,,Alcohol puro 96°,,,,,,,,Una vez al año,,Una vez al año,,Nunca
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
295,,,,Alcohol puro 96°,,,,,,,,Una vez cada 6 meses,,Una vez cada 6 meses,,
296,,,,Alcohol medicinal 70%,,,,,,,,2. Una vez a la semana,Una vez cada 6 meses,,,
297,,,,Alcohol puro 96°,,,,,,Una vez cada 6 meses,,,,Una vez al año,,
298,,,,Alcohol puro 96°,,,,,,,,,,Una vez cada 2 o 3 meses,,


verificamos la pregunta 13 el cual dice -> ¿cuál es la razón más importante para que usted escoja una marca?

``Para ranking positivo``

In [75]:
# Para la evaluacion '1'
df['P13_1'].value_counts()

P13_1
Que el producto sea de calidad                                  77
Que no dañe la piel                                             45
Que tenga un precio accesible                                   37
Que la marca sea prestigiosa                                    29
Que tenga un empaque práctico                                   28
Que tenga todas las certificaciones de calidad                  24
Que sea fácil de encontrar en distintos establecimientos        20
Que se venda en puntos de venta de confianza                    16
Que el producto me genere confianza                             12
Que sea la que siempre compran en mi casa                        6
Que esté en promoción/oferta                                     3
Que sea la que me recomiende el vendedor/Boticario/farmacéut     3
Name: count, dtype: int64

In [76]:
# Para la evaluacion '2'
df['P13_2'].value_counts()

P13_2
Que no dañe la piel                                             70
Que el producto sea de calidad                                  48
Que tenga un precio accesible                                   46
Que tenga todas las certificaciones de calidad                  30
Que el producto me genere confianza                             27
Que sea fácil de encontrar en distintos establecimientos        17
Que tenga un empaque práctico                                   17
Que la marca sea prestigiosa                                    13
Que se venda en puntos de venta de confianza                     9
Que esté en promoción/oferta                                     8
Que sea la que me recomiende el vendedor/Boticario/farmacéut     6
Que sea la que siempre compran en mi casa                        6
Que tenga trayectoria                                            3
Name: count, dtype: int64

In [77]:
# Para la evaluacion '3'
df['P13_3'].value_counts()

P13_3
Que no dañe la piel                                             53
Que tenga todas las certificaciones de calidad                  42
Que tenga un precio accesible                                   40
Que el producto me genere confianza                             35
Que el producto sea de calidad                                  27
Que se venda en puntos de venta de confianza                    21
Que la marca sea prestigiosa                                    17
Que sea fácil de encontrar en distintos establecimientos        16
Que esté en promoción/oferta                                    14
Que sea la que me recomiende el vendedor/Boticario/farmacéut    12
Que tenga un empaque práctico                                   11
Que sea la que siempre compran en mi casa                        7
Que tenga trayectoria                                            5
Name: count, dtype: int64

In [78]:
# Para la evaluacion '4'
df['P13_4'].value_counts()

P13_4
Que no dañe la piel                                             40
Que el producto me genere confianza                             39
Que tenga un precio accesible                                   34
Que el producto sea de calidad                                  33
Que tenga todas las certificaciones de calidad                  31
Que sea fácil de encontrar en distintos establecimientos        30
Que se venda en puntos de venta de confianza                    29
Que tenga un empaque práctico                                   22
Que esté en promoción/oferta                                    12
Que la marca sea prestigiosa                                    10
Que sea la que me recomiende el vendedor/Boticario/farmacéut     9
Que tenga trayectoria                                            6
Que sea la que siempre compran en mi casa                        5
Name: count, dtype: int64

verificamos la pregunta 14 el cual dice -> ¿cuál es la razón menos importante para que usted escoja una marca?

``Para ranking negativo``

In [79]:
# Para la evaluacion '1'
df['P14_1'].value_counts()

P14_1
Que tenga un empaque práctico                                   67
Que esté en promoción/oferta                                    52
Que tenga trayectoria                                           50
Que sea la que me recomiende el vendedor/Boticario/farmacéut    35
Que la marca sea prestigiosa                                    27
Que sea la que siempre compran en mi casa                       19
Que sea fácil de encontrar en distintos establecimientos        14
Que tenga un precio accesible                                   14
Que no dañe la piel                                              7
Que se venda en puntos de venta de confianza                     7
Que el producto me genere confianza                              4
Que el producto sea de calidad                                   2
Que tenga todas las certificaciones de calidad                   2
Name: count, dtype: int64

In [80]:
# Para la evaluacion '2'
df['P14_2'].value_counts()

P14_2
Que sea la que me recomiende el vendedor/Boticario/farmacéut    49
Que esté en promoción/oferta                                    48
Que sea la que siempre compran en mi casa                       39
Que tenga un empaque práctico                                   36
Que tenga trayectoria                                           33
Que la marca sea prestigiosa                                    31
Que sea fácil de encontrar en distintos establecimientos        18
Que tenga un precio accesible                                   15
Que se venda en puntos de venta de confianza                    11
Que el producto me genere confianza                              9
Que tenga todas las certificaciones de calidad                   7
Que el producto sea de calidad                                   3
Que no dañe la piel                                              1
Name: count, dtype: int64

In [81]:
# Para la evaluacion '3'
df['P13_3'].value_counts()

P13_3
Que no dañe la piel                                             53
Que tenga todas las certificaciones de calidad                  42
Que tenga un precio accesible                                   40
Que el producto me genere confianza                             35
Que el producto sea de calidad                                  27
Que se venda en puntos de venta de confianza                    21
Que la marca sea prestigiosa                                    17
Que sea fácil de encontrar en distintos establecimientos        16
Que esté en promoción/oferta                                    14
Que sea la que me recomiende el vendedor/Boticario/farmacéut    12
Que tenga un empaque práctico                                   11
Que sea la que siempre compran en mi casa                        7
Que tenga trayectoria                                            5
Name: count, dtype: int64

In [82]:
# Para la evaluacion '4'
df['P14_4'].value_counts()

P14_4
Que tenga trayectoria                                           42
Que sea la que siempre compran en mi casa                       41
Que sea la que me recomiende el vendedor/Boticario/farmacéut    37
Que tenga un empaque práctico                                   37
Que esté en promoción/oferta                                    32
Que la marca sea prestigiosa                                    26
Que sea fácil de encontrar en distintos establecimientos        24
Que se venda en puntos de venta de confianza                    22
Que tenga un precio accesible                                   14
Que tenga todas las certificaciones de calidad                  12
Que el producto me genere confianza                              7
Que no dañe la piel                                              5
Que el producto sea de calidad                                   1
Name: count, dtype: int64

Verificamos la pregunta 15 el cual obtiene las marcas de los alcoholes comerciales.

In [83]:
columnaP15= ['P15_1', 'P15_2', 'P15_3',	'P15_4', 'P15_5']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP15 if not pd.isna(row[col])]
    return ','.join(values)

df['P15'] = df.apply(combine_columns, axis=1)

Eliminamos las columnas`` ['P15_1', 'P15_2', 'P15_3',	'P15_4', 'P15_5']``

In [84]:
df.drop(columns=['P15_1', 'P15_2', 'P15_3',	'P15_4', 'P15_5'], axis=1, inplace=True)

In [85]:
df['P15'].value_counts()

P15
Ninguna                          79
Alkofarma                        53
Casa Grande                      27
Inkafarma                         8
No precisa                        7
                                 ..
Hersil,Alkofarma                  1
Casa Grande,Balanze               1
Martel,Casa Grande,Boreal         1
Sanakol                           1
Alkofarma,Casa Grande,Experto     1
Name: count, Length: 104, dtype: int64

In [86]:
palabras = []
for fila in df['P15']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Casa Grande' - Conteo: 73
Palabra: 'Jemfarma' - Conteo: 4
Palabra: 'Alkofarma' - Conteo: 108
Palabra: 'Boreal' - Conteo: 28
Palabra: 'Ninguna' - Conteo: 79
Palabra: 'Inkafarma' - Conteo: 19
Palabra: 'Erza' - Conteo: 3
Palabra: 'Integración Química' - Conteo: 1
Palabra: 'Alkamedic' - Conteo: 2
Palabra: 'Doña María' - Conteo: 3
Palabra: 'Ahryfarma' - Conteo: 1
Palabra: 'Aval' - Conteo: 9
Palabra: 'Hersil' - Conteo: 7
Palabra: 'No precisa' - Conteo: 10
Palabra: 'Portugal' - Conteo: 21
Palabra: 'Experto' - Conteo: 3
Palabra: 'Álicorp' - Conteo: 1
Palabra: 'Vick' - Conteo: 1
Palabra: 'Mifarma' - Conteo: 9
Palabra: 'Purol' - Conteo: 8
Palabra: 'Instant Clean' - Conteo: 4
Palabra: 'Sanakol' - Conteo: 5
Palabra: 'Sante' - Conteo: 1
Palabra: 'Mundofar' - Conteo: 1
Palabra: 'Mr. Brillo' - Conteo: 1
Palabra: 'Martel' - Conteo: 1
Palabra: 'Balanze' - Conteo: 1
Palabra: 'Aky' - Conteo: 1
Palabra: 'Productos Leo' - Conteo: 1
Palabra: 'Representaciones J y L' - Conteo: 1
Palabra: 'Natura' -

Verificamos la pregunta 16 -> ¿Cuál de las siguientes marcas que conoce aunque sea de nombre?

In [87]:
columnaP16= ['P16_1', 'P16_2', 'P16_3', 'P16_4', 'P16_5', 'P16_6',	'P16_7', 'P16_8', 'P16_9', 'P16_10']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP16 if not pd.isna(row[col])]
    return ','.join(values)

df['P16'] = df.apply(combine_columns, axis=1)

In [88]:
df.drop(columns=['P16_1', 'P16_2', 'P16_3', 'P16_4', 'P16_5', 'P16_6',	'P16_7', 'P16_8', 'P16_9', 'P16_10'], axis=1, inplace=True)

In [89]:
df['P16'].value_counts()

P16
Alkofarma                                                              11
Casa Grande                                                            11
Alkofarma,Casa Grande                                                   8
Alkofarma,Boreal,Portugal                                               7
Ninguno [NN                                                             7
                                                                       ..
Alkofarma,Boreal,Portugal,Hersil                                        1
Alkofarma,Purol,Hersil                                                  1
Casa Grande,Portugal,Alkofarma                                          1
Jemfarma,Portugal,Alkofarma                                             1
Alkofarma,Jemfarma,Casa Grande,Coderal,Boreal,Sanakol,Purol,Experto     1
Name: count, Length: 198, dtype: int64

In [90]:
palabras = []
for fila in df['P16']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Jemfarma' - Conteo: 37
Palabra: 'Casa Grande' - Conteo: 136
Palabra: 'Boreal' - Conteo: 121
Palabra: 'Hersil' - Conteo: 92
Palabra: 'Alkofarma' - Conteo: 176
Palabra: 'Erza' - Conteo: 25
Palabra: 'Purol' - Conteo: 69
Palabra: 'Ninguno [NN' - Conteo: 7
Palabra: 'Portugal' - Conteo: 113
Palabra: 'Inkafarma' - Conteo: 21
Palabra: 'CKF' - Conteo: 12
Palabra: 'Integración Química' - Conteo: 1
Palabra: 'Alkamedic' - Conteo: 3
Palabra: 'Alessi' - Conteo: 10
Palabra: 'Natura' - Conteo: 2
Palabra: 'Don Emilio' - Conteo: 10
Palabra: 'Doña María' - Conteo: 3
Palabra: 'Ahryfarma' - Conteo: 1
Palabra: 'Coderal' - Conteo: 7
Palabra: 'Aval' - Conteo: 10
Palabra: 'Experto' - Conteo: 3
Palabra: 'Álicorp' - Conteo: 1
Palabra: 'Vick' - Conteo: 1
Palabra: 'Mifarma' - Conteo: 10
Palabra: 'Nex' - Conteo: 2
Palabra: 'Sanakol' - Conteo: 16
Palabra: 'Instant Clean' - Conteo: 5
Palabra: 'Sante' - Conteo: 1
Palabra: 'Mundofar' - Conteo: 1
Palabra: 'Tapmedic' - Conteo: 1
Palabra: 'Martel' - Conteo: 2
Pa

verificamos la pregunta 17 -> ¿Qué marcas ha comprado alguna vez?

In [91]:
columnaP17= ['P17_1', 'P17_2', 'P17_3',	'P17_4', 'P17_5','P17_6']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP17 if not pd.isna(row[col])]
    return ','.join(values)

df['P17'] = df.apply(combine_columns, axis=1)

Eliminamos las columnas -> ``['P17_1', 'P17_2', 'P17_3',	'P17_4', 'P17_5','P17_6']``

In [92]:
df.drop(columns=['P17_1', 'P17_2', 'P17_3',	'P17_4', 'P17_5','P17_6'], axis=1, inplace=True)

In [116]:
palabras = []
for fila in df['P17']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Casa Grande' - Conteo: 100
Palabra: 'Jemfarma' - Conteo: 8
Palabra: 'Boreal' - Conteo: 49
Palabra: 'Purol' - Conteo: 26
Palabra: 'Hersil' - Conteo: 39
Palabra: 'No precisa [NN' - Conteo: 25
Palabra: 'Inkafarma' - Conteo: 13
Palabra: 'Alkofarma' - Conteo: 142
Palabra: 'Erza' - Conteo: 11
Palabra: 'Integración Química' - Conteo: 1
Palabra: 'Alkamedic' - Conteo: 1
Palabra: 'CKF' - Conteo: 5
Palabra: 'Portugal' - Conteo: 58
Palabra: 'Alessi' - Conteo: 6
Palabra: 'Natura' - Conteo: 1
Palabra: 'Doña María' - Conteo: 2
Palabra: 'Ahryfarma' - Conteo: 1
Palabra: 'Don Emilio' - Conteo: 5
Palabra: 'Aval' - Conteo: 4
Palabra: 'Experto' - Conteo: 2
Palabra: 'Sanakol' - Conteo: 6
Palabra: 'Instant Clean' - Conteo: 2
Palabra: 'Sante' - Conteo: 1
Palabra: 'Mundofar' - Conteo: 1
Palabra: 'Tapmedic' - Conteo: 1
Palabra: 'Martel' - Conteo: 2
Palabra: 'Botica y Salud' - Conteo: 1
Palabra: 'Mr. Brillo' - Conteo: 1
Palabra: 'Balanze' - Conteo: 1
Palabra: 'Aky' - Conteo: 2
Palabra: 'Marca D' - Cont

In [94]:
df['P17'].value_counts()

P17
Alkofarma                                        46
Casa Grande                                      29
No precisa [NN                                   25
Alkofarma,Casa Grande                            19
Alkofarma,Portugal                               10
                                                 ..
Alkofarma,Portugal,Purol,Hersil                   1
Alkofarma,Casa Grande,Portugal,Hersil,Marca D     1
Balanze                                           1
Alkofarma,Erza                                    1
Alkofarma,Casa Grande,Boreal                      1
Name: count, Length: 126, dtype: int64

verificamos la pregunta 18 -> ¿Cuál es la marca que compra más?

In [95]:
df['P18'].value_counts()

P18
Alkofarma                   110
Casa Grande                  56
No precisa                   29
Portugal                     15
La que tenga el vendedor     13
Hersil                        9
Purol                         8
Boreal                        7
Inkafarma                     5
Mifarma                       5
Erza                          4
Jemfarma                      3
Aval                          2
Experto                       2
Disproquin                    2
CKF                           2
Sanakol                       2
Mundofar                      1
Mr. Brillo                    1
Nex                           1
Medical                       1
Sante                         1
Martel                        1
MPH Farm                      1
Productos Leo                 1
Ahryfarma                     1
Fabrimedic                    1
Integración Química           1
Instant Clean                 1
Free Clean                    1
Aky                           1
Duof

In [96]:
df['P18'].describe()

count           300
unique           43
top       Alkofarma
freq            110
Name: P18, dtype: object

In [97]:
df['NPS_Alkofarma'].value_counts()

NPS_Alkofarma
10: Definitivamente lo recomendaría      63
9                                        32
8                                        30
7                                         9
6                                         5
0: Definitivamente no lo recomendaría     1
3                                         1
5                                         1
Name: count, dtype: int64

In [98]:
df['NPS_Jemfarma'].value_counts()

NPS_Jemfarma
9                                      3
10: Definitivamente lo recomendaría    2
3                                      1
6                                      1
8                                      1
Name: count, dtype: int64

In [99]:
df['NPS_Erza'].value_counts()

NPS_Erza
9                                      4
6                                      2
8                                      2
10: Definitivamente lo recomendaría    1
5                                      1
7                                      1
Name: count, dtype: int64

In [100]:
df['NPS_Casa_Grande'].value_counts()

NPS_Casa_Grande
10: Definitivamente lo recomendaría    34
8                                      26
9                                      18
7                                      13
6                                       6
5                                       3
Name: count, dtype: int64

In [101]:
df['NPS_Coderal'].value_counts()

NPS_Coderal
8    1
Name: count, dtype: int64

In [102]:
df['NPS_CKF'].value_counts()

NPS_CKF
10: Definitivamente lo recomendaría    3
5                                      1
9                                      1
Name: count, dtype: int64

In [103]:
df['NPS_Boreal'].value_counts()

NPS_Boreal
8                                      12
9                                      11
7                                      10
6                                       5
5                                       4
10: Definitivamente lo recomendaría     3
4                                       2
3                                       1
Name: count, dtype: int64

In [104]:
df['NPS_Portugal'].value_counts()

NPS_Portugal
8                                      16
10: Definitivamente lo recomendaría    10
7                                       9
9                                       9
6                                       8
5                                       4
4                                       2
Name: count, dtype: int64

In [105]:
df['NPS_Sanakol'].value_counts()

NPS_Sanakol
10: Definitivamente lo recomendaría    2
7                                      2
5                                      1
9                                      1
Name: count, dtype: int64

In [106]:
df['NPS_Purol'].value_counts()

NPS_Purol
8                                      9
10: Definitivamente lo recomendaría    5
7                                      4
9                                      4
6                                      2
1                                      1
5                                      1
Name: count, dtype: int64

In [107]:
df['NPS_Don_Emilio'].value_counts()

NPS_Don_Emilio
7    2
5    1
6    1
8    1
Name: count, dtype: int64

In [108]:
df['NPS_Hersil'].value_counts()

NPS_Hersil
8                                        16
9                                         7
10: Definitivamente lo recomendaría       6
6                                         3
7                                         3
5                                         2
0: Definitivamente no lo recomendaría     1
3                                         1
Name: count, dtype: int64

In [109]:
df['NPS_Alessi'].value_counts()

NPS_Alessi
6                                      2
9                                      2
10: Definitivamente lo recomendaría    1
8                                      1
Name: count, dtype: int64

In [110]:
df['NPS_NR'].value_counts()

NPS_NR
8                                      19
10: Definitivamente lo recomendaría    18
9                                      13
7                                       9
6                                       4
4                                       3
5                                       2
2                                       1
Name: count, dtype: int64

Verificamos la pregunta 20 -> El cual dice Si no existiera la marca... (MENCIONAR RESPUESTA EN P18). ¿Por cuál marca la reemplazaría?

In [119]:
df['P20'].unique()

['Jemfarma', 'Sanakol', 'Hersil', 'Ninguno', NaN, ..., 'Mifarma', 'AQD Medic', 'Marfam', 'Om', 'Idogel']
Length: 27
Categories (26, object): ['AQD Medic', 'Alessi', 'Alkofarma', 'Boreal', ..., 'Portugal', 'Purol', 'Sanakol', 'Tottus']

In [118]:
df['P20'].value_counts()

P20
Casa Grande                 36
Ninguno                     34
Boreal                      33
Alkofarma                   32
Portugal                    31
Hersil                      25
Purol                       22
La que tenga el vendedor    14
Jemfarma                    10
Inkafarma                    8
Mifarma                      3
Erza                         3
CKF                          3
Don Emilio                   2
Coderal                      2
No precisa                   2
Sanakol                      2
Om                           1
AQD Medic                    1
Natura                       1
Marfam                       1
Losaro                       1
Alessi                       1
Idogel                       1
Experto                      1
Tottus                       1
Name: count, dtype: int64

Verificamos la pregunta 21 -> El cual dice ¿Cuál de todas las marcas que conoce es su preferida?

In [124]:
df['P21'].unique()

['Casa Grande', 'Jemfarma', 'Purol', 'Hersil', 'Ninguno', ..., 'Nex', 'Mathfarm', 'Instant Clean', 'Medical', 'Gleen']
Length: 35
Categories (35, object): ['Ahryfarma', 'Aky', 'Alessi', 'Alkofarma', ..., 'Purol', 'Sanakol', 'Sante', 'Tanb']

In [123]:
df['P21'].describe()

count           300
unique           35
top       Alkofarma
freq            113
Name: P21, dtype: object

Verificamos la pregunta 22 el cual es -> ¿Cuál nunca compraría?

In [113]:
# Renombramos la columna P22_1 por P22
df.rename(columns={'P22_1': 'P22'}, inplace=True)

In [114]:
df['P22'].value_counts()

P22
Ninguno [NN    240
Boreal          15
No precisa       7
Hersil           6
Purol            6
Alessi           4
Don Emilio       4
Casa Grande      4
Erza             3
Portugal         3
Alkofarma        2
Doña María       1
Jemfarma         1
Magistral        1
Marca D          1
CKF              1
Sanakol          1
Name: count, dtype: int64

In [125]:
columnaP23= ['P23_1', 'P23_2', 'P23_3']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP23 if not pd.isna(row[col])]
    return ','.join(values)

df['P23'] = df.apply(combine_columns, axis=1)

Eliminamos las columnas -> ``['P23_1', 'P23_2', 'P23_3']``

In [126]:
df.drop(columns=['P23_1', 'P23_2', 'P23_3'], axis=1, inplace=True)

In [127]:
df['P23'].value_counts()

P23
                                                                                                          240
Es desconocido                                                                                              9
Porque no me da confianza                                                                                   9
Porque no tenia buen aroma/su olor no es intenso                                                            8
Porque no parece de calidad                                                                                 6
Irrita la piel                                                                                              5
No precisa                                                                                                  4
Porque es cara                                                                                              2
Porque no siento que sea efectivo                                                                           2
Porque

In [128]:
palabras = []
for fila in df['P23']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: '' - Conteo: 240
Palabra: 'Porque no tenia buen aroma/su olor no es intenso' - Conteo: 12
Palabra: 'Porque no me da confianza' - Conteo: 15
Palabra: 'Porque no tiene demasiado alcohol' - Conteo: 3
Palabra: 'Porque no siento que sea efectivo' - Conteo: 4
Palabra: 'Porque no tiene prestigio' - Conteo: 3
Palabra: 'Porque no parece de calidad' - Conteo: 11
Palabra: 'Porque es cara' - Conteo: 3
Palabra: 'No precisa' - Conteo: 4
Palabra: 'Es desconocido' - Conteo: 15
Palabra: 'Irrita la piel' - Conteo: 5
Palabra: 'No tiene certificado de salud/registro sanitario' - Conteo: 1


Eliminamos las columnas, por ahora se consideran irrelevantes para realizar un analisis, y dejamos solo las repsuestas relevantes. 

In [None]:
df.drop(columns=['P24_1_2','P24_1_3','P24_1_4', 'P24_2_2','P24_2_3','P24_2_4', 'P24_3_2','P24_3_3','P24_3_4', 'P24_4_2', 'P24_4_3','P24_4_4', 'P24_5_2','P24_5_3','P24_5_4',	'P24_5_5', 'P24_6_2','P24_6_3','P24_6_4', 'P24_7_2','P24_7_3','P24_7_4','P24_7_5',	'P24_7_6', 'P24_8_2','P24_8_3','P24_8_4', 'P24_9_2','P24_9_3','P24_9_4', 'P24_10_2','P24_10_3','P24_10_4', 'P24_11_2','P24_11_3','P24_11_4','P24_11_5','P24_11_6', 'P24_12_2','P24_12_3','P24_12_4'], axis=1, inplace=True)


Verificamos la pregunta 25, donde dice que ¿alguna vez escucharon hablar de alkofarma?

In [129]:
df['P25'].value_counts()

P25
Sí    174
No    126
Name: count, dtype: int64

In [130]:
df['P25'].unique()

['No', 'Sí']
Categories (2, object): ['No', 'Sí']

Verificamos la pregunta 26  Donde dice que productos vende la marca Alkofarma? 
P26_1	P26_2	P26_3	P26_4	P26_5	

Uniremos las columnas -> ``P26_1	P26_2	P26_3	P26_4	P26_5``	

In [131]:

columnaP26= ['P26_1', 'P26_2', 'P26_3',	'P26_4', 'P26_5']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP26 if not pd.isna(row[col])]
    return ','.join(values)

df['P26'] = df.apply(combine_columns, axis=1)

Eliminamos las columnas -> ``['P26_1', 'P26_2', 'P26_3',	'P26_4', 'P26_5']``

In [132]:
df.drop(columns=['P26_1', 'P26_2', 'P26_3',	'P26_4', 'P26_5'], axis=1, inplace=True)


In [133]:
palabras = []
for fila in df['P26']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: '' - Conteo: 126
Palabra: 'Alcohol' - Conteo: 152
Palabra: 'Gel' - Conteo: 4
Palabra: 'No precisa' - Conteo: 6
Palabra: 'Jabón' - Conteo: 5
Palabra: 'Cremas' - Conteo: 3
Palabra: 'Bicarbonato' - Conteo: 3
Palabra: 'Alcohol puro' - Conteo: 5
Palabra: 'Alcohol en gel' - Conteo: 22
Palabra: 'Desinfectantes' - Conteo: 1
Palabra: 'Medicina' - Conteo: 3
Palabra: 'Alcohol liquido' - Conteo: 10
Palabra: 'Agua oxigenada' - Conteo: 15
Palabra: 'Algodón' - Conteo: 5
Palabra: 'Agua de azahar' - Conteo: 5
Palabra: 'Antibacteriales' - Conteo: 1
Palabra: 'Pastillas' - Conteo: 2
Palabra: 'Pañitos humedos' - Conteo: 2
Palabra: 'Vinagre Bully' - Conteo: 3
Palabra: 'Óxido de zinc' - Conteo: 1
Palabra: 'Jarabe' - Conteo: 1
Palabra: 'Yodo' - Conteo: 1
Palabra: 'Guantes' - Conteo: 1
Palabra: 'Glicerina' - Conteo: 1
Palabra: 'Vaselina' - Conteo: 1
Palabra: 'Alcohol yodado' - Conteo: 1


In [None]:
df['P26'].value_counts()

P26
                                                               126
Alcohol                                                        106
Alcohol,Agua oxigenada                                           8
Alcohol,Alcohol en gel                                           8
No precisa                                                       6
Alcohol liquido,Alcohol en gel                                   5
Alcohol liquido                                                  3
Alcohol puro,Alcohol en gel                                      2
Alcohol,Jabón                                                    2
Alcohol,Algodón                                                  2
Alcohol,Gel                                                      2
Agua oxigenada,Alcohol                                           2
Alcohol,Jabón,Cremas                                             1
Gel,Alcohol,Alcohol en gel                                       1
Alcohol,Algodón,Vinagre Bully,Alcohol                     

# Quinto aparatado  `ATRIBUTOS VALORADOS - ALCOHOL LIQUIDO`

In [None]:
alc_liquido = df.iloc[:, 95:112]
alc_liquido

Unnamed: 0,P29_1,P29_2,P29_3,P29_4,P29_5,P29_6,P29_7,P29_8,P30_1,P30_2,P30_3,P30_4,P30_5,P30_6,P30_7,P30_8,P31_1
0,,Una vez cada 6 meses,Una vez al año,,Una vez cada 2 o 3 meses,,,Una vez al año,Una vez al año,Una vez cada 6 meses,Una vez cada 6 meses,,Una vez cada 15 días,,,Una vez cada 6 meses,Bicarbonato de sodio
1,Una vez al mes,,,,Una vez cada 2 o 3 meses,,,,Una vez cada 15 días,,,,Una vez al mes,,,,Agua oxigenada
2,Una vez cada 2 o 3 meses,,,,Una vez al año,,,,Una vez al mes,,,,Una vez cada 15 días,,,,Bicarbonato de sodio
3,,Una vez al año,,,Una vez cada 6 meses,,Nunca,,,,,,Una vez al mes,,Una vez cada 15 días,,Alcohol en gel
4,,,Una vez al año,,Una vez al año,,Nunca,,Una vez cada 2 o 3 meses,,Una vez al año,,Una vez al mes,,Una vez cada 2 o 3 meses,,Bicarbonato de sodio
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
295,,,Una vez cada 6 meses,,Una vez cada 6 meses,,,,,,Una vez cada 6 meses,,Una vez al mes,,,,Agua oxigenada
296,,,2. Una vez a la semana,Una vez cada 6 meses,,,,,,,Una vez cada 6 meses,2. Una vez a la semana,,,,,Agua oxigenada
297,Una vez cada 6 meses,,,,Una vez al año,,,,,,,,Una vez al mes,,,,Alcohol puro 96°
298,,,,,Una vez cada 2 o 3 meses,,,,,,,,Una vez cada 15 días,,,,Alcohol puro 96°


verificamos la pregunta 27 -> ``¿Qué productos consume actualmente?``

In [135]:
#Unimos las columnas para obteneruna cadena
columnaP27= ['P27_1','P27_2','P27_3','P27_4','P27_5','P27_6','P27_7','P27_8']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP27 if not pd.isna(row[col])]
    return ','.join(values)

df['P27'] = df.apply(combine_columns, axis=1)

Eliminamos la columnas individuales. 

In [None]:
df.drop(columns=['P27_1','P27_2','P27_3','P27_4','P27_5','P27_6','P27_7','P27_8'], axis=1, inplace=True)


In [136]:
palabras = []
for fila in df['P27']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Bicarbonato de sodio' - Conteo: 103
Palabra: 'Agua azahar' - Conteo: 38
Palabra: 'Agua oxigenada' - Conteo: 102
Palabra: 'Alcohol puro 96°' - Conteo: 239
Palabra: 'Vinagre Bully (Aromático)' - Conteo: 41
Palabra: 'Alcohol en gel' - Conteo: 166
Palabra: 'Alcohol medicinal 70%' - Conteo: 119
Palabra: 'Alcohol yodado' - Conteo: 37


In [None]:
df['P27'].value_counts()

P27
Alcohol puro 96°                                                                                        44
Alcohol puro 96°,Alcohol en gel                                                                         34
Alcohol medicinal 70%,Alcohol puro 96°,Alcohol en gel                                                   14
Bicarbonato de sodio,Alcohol puro 96°,Alcohol en gel                                                    12
Alcohol medicinal 70%                                                                                   11
                                                                                                        ..
Bicarbonato de sodio,Agua oxigenada,Alcohol puro 96°,Alcohol yodado                                      1
Bicarbonato de sodio,Agua azahar,Alcohol medicinal 70%,Alcohol puro 96°,Vinagre Bully (Aromático)        1
Bicarbonato de sodio,Agua oxigenada,Alcohol medicinal 70%,Alcohol puro 96°,Vinagre Bully (Aromático)     1
Alcohol puro 96°,Vinagre Bully (A

verificamos la pregunta 28 -> ¿En qué productos has incrementado tu consumo a raíz de la pandemia?

In [137]:
#Unimos las columnas para obteneruna cadena
columnaP28= ['P28_1','P28_2','P28_3', 'P28_4', 'P28_5',	'P28_6']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP28 if not pd.isna(row[col])]
    return ','.join(values)

df['P28'] = df.apply(combine_columns, axis=1)

In [138]:
df.drop(columns=['P28_1','P28_2','P28_3', 'P28_4', 'P28_5',	'P28_6'], axis=1, inplace=True)


In [140]:
palabras = []
for fila in df['P28']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Alcohol puro 96°' - Conteo: 220
Palabra: 'Alcohol en gel' - Conteo: 123
Palabra: 'Bicarbonato de sodio' - Conteo: 21
Palabra: 'Alcohol medicinal 70%' - Conteo: 95
Palabra: 'Agua azahar' - Conteo: 5
Palabra: 'Agua oxigenada' - Conteo: 10
Palabra: 'Alcohol yodado' - Conteo: 2
Palabra: 'Vinagre Bully (Aromático)' - Conteo: 3


In [139]:
df['P28'].value_counts()

P28
Alcohol puro 96°                                                                                              113
Alcohol puro 96°,Alcohol en gel                                                                                51
Alcohol medicinal 70%                                                                                          36
Alcohol en gel                                                                                                 20
Alcohol medicinal 70%,Alcohol puro 96°,Alcohol en gel                                                          19
Alcohol medicinal 70%,Alcohol en gel                                                                           17
Alcohol medicinal 70%,Alcohol puro 96°                                                                         12
Bicarbonato de sodio,Alcohol puro 96°,Alcohol en gel                                                            5
Bicarbonato de sodio,Alcohol puro 96°                                               

Verificamos la pregunta 29 -> ``¿Con qué frecuencia compraba antes de la pandemia?``

In [141]:
#Unimos las columnas para obteneruna cadena
columnaP29= ['P29_1','P29_2','P29_3','P29_4','P29_5','P29_6','P29_7','P29_8']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP29 if not pd.isna(row[col])]
    return ','.join(values)

df['P29'] = df.apply(combine_columns, axis=1)

In [142]:
df.drop(columns=['P29_1','P29_2','P29_3','P29_4','P29_5','P29_6','P29_7','P29_8'], axis=1, inplace=True)


In [144]:
palabras = []
for fila in df['P29']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Una vez cada 6 meses' - Conteo: 179
Palabra: 'Una vez al año' - Conteo: 156
Palabra: 'Una vez cada 2 o 3 meses' - Conteo: 151
Palabra: 'Una vez al mes' - Conteo: 173
Palabra: 'Nunca' - Conteo: 58
Palabra: 'Con menor frecuencia' - Conteo: 59
Palabra: '' - Conteo: 2
Palabra: '2. Una vez a la semana' - Conteo: 29
Palabra: 'Diario/ interdiario' - Conteo: 4
Palabra: '2 o 3 veces por semana' - Conteo: 8
Palabra: 'Una vez cada 15 días' - Conteo: 23


In [143]:

df['P29'].value_counts()

P29
Una vez cada 6 meses                                                                                                        19
Una vez al año                                                                                                              12
Una vez cada 2 o 3 meses                                                                                                    11
Una vez cada 2 o 3 meses,Una vez cada 2 o 3 meses                                                                           10
Una vez al mes                                                                                                               9
                                                                                                                            ..
Una vez al mes,Una vez cada 6 meses,Una vez cada 2 o 3 meses,Una vez cada 2 o 3 meses,Una vez cada 6 meses                   1
Una vez cada 6 meses,Una vez cada 6 meses,Una vez al mes                                                   

In [145]:
#Unimos las columnas para obteneruna cadena
columnaP30= ['P30_1', 'P30_2','P30_3',	'P30_4', 'P30_5', 	'P30_6', 'P30_7','P30_8']

def combine_columns(row):
    values = [str(row[col]) for col in columnaP30 if not pd.isna(row[col])]
    return ','.join(values)

df['P30'] = df.apply(combine_columns, axis=1)

In [146]:
df.drop(columns=['P30_1', 'P30_2','P30_3',	'P30_4', 'P30_5', 	'P30_6', 'P30_7','P30_8'], axis=1, inplace=True)


In [147]:
palabras = []
for fila in df['P30']:
    palabras += fila.split(',') 

contador_palabras = Counter(palabras)

for palabra, conteo in contador_palabras.items():
    print(f"Palabra: '{palabra}' - Conteo: {conteo}")

Palabra: 'Una vez al año' - Conteo: 29
Palabra: 'Una vez cada 6 meses' - Conteo: 55
Palabra: 'Una vez cada 15 días' - Conteo: 160
Palabra: 'Una vez al mes' - Conteo: 266
Palabra: 'Una vez cada 2 o 3 meses' - Conteo: 92
Palabra: '2. Una vez a la semana' - Conteo: 176
Palabra: '' - Conteo: 1
Palabra: '2 o 3 veces por semana' - Conteo: 36
Palabra: 'Diario/ interdiario' - Conteo: 8
Palabra: 'Con menor frecuencia' - Conteo: 23
Palabra: 'Nunca' - Conteo: 1


In [None]:
df['P30'].value_counts()

P30
2. Una vez a la semana                                                                                                   27
Una vez al mes                                                                                                           20
Una vez cada 15 días                                                                                                     10
Una vez cada 15 días,Una vez cada 15 días                                                                                 9
Una vez al mes,Una vez al mes                                                                                             9
                                                                                                                         ..
2. Una vez a la semana,Una vez cada 15 días,Una vez cada 15 días                                                          1
2. Una vez a la semana,Una vez cada 2 o 3 meses,Una vez al mes                                                            1
Una 

In [None]:
cambio_consumo = df.iloc[:, 171:201]
cambio_consumo

Unnamed: 0,P27_2,P27_3,P27_4,P27_5,P27_6,P27_7,P27_8,P28_1,P28_2,P28_3,...,P29_8,P30_1,P30_2,P30_3,P30_4,P30_5,P30_6,P30_7,P30_8,P31_1
0,Agua azahar,Agua oxigenada,Alcohol puro 96°,Vinagre Bully (Aromático),,,,Alcohol puro 96°,,,...,Una vez al año,Una vez al año,Una vez cada 6 meses,Una vez cada 6 meses,,Una vez cada 15 días,,,Una vez cada 6 meses,Bicarbonato de sodio
1,Alcohol puro 96°,,,,,,,Alcohol puro 96°,,,...,,Una vez cada 15 días,,,,Una vez al mes,,,,Agua oxigenada
2,Alcohol puro 96°,,,,,,,Alcohol puro 96°,,,...,,Una vez al mes,,,,Una vez cada 15 días,,,,Bicarbonato de sodio
3,Alcohol en gel,,,,,,,Alcohol puro 96°,Alcohol en gel,,...,,,,,,Una vez al mes,,Una vez cada 15 días,,Alcohol en gel
4,Agua oxigenada,Alcohol puro 96°,Alcohol en gel,,,,,Alcohol puro 96°,,,...,,Una vez cada 2 o 3 meses,,Una vez al año,,Una vez al mes,,Una vez cada 2 o 3 meses,,Bicarbonato de sodio
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
295,Alcohol puro 96°,,,,,,,Alcohol puro 96°,,,...,,,,Una vez cada 6 meses,,Una vez al mes,,,,Agua oxigenada
296,Alcohol medicinal 70%,,,,,,,Alcohol medicinal 70%,,,...,,,,Una vez cada 6 meses,2. Una vez a la semana,,,,,Agua oxigenada
297,,,,,,,,Alcohol puro 96°,,,...,,,,,,Una vez al mes,,,,Alcohol puro 96°
298,,,,,,,,Alcohol puro 96°,,,...,,,,,,Una vez cada 15 días,,,,Alcohol puro 96°


Visualizamos la primera parte que son los `PRODUCTOS DE COMSUMO - HOGAR`

In [None]:
consumo_hogar = df.iloc[:, 201:238]
consumo_hogar

Unnamed: 0,P31_2,P31_3,P31_4,P31_5,P31_6,P32_1_1,P32_2_1,P32_3_1,P32_3_2,P32_4_1,...,P34_1,P34_2,P34_3,P34_4,P34_5,P34_6,P34_7,P34_8,P34_NR,p159v1
0,Agua azahar,Agua oxigenada,Alcohol puro 96°,Vinagre Bully (Aromático),,Alkofarma,Jenfarma,Jenfarma,,,...,1,1,1,,3,,,1,,7
1,Alcohol puro 96°,,,,,,,Jenfarma,,,...,,,1,,1 botella,,,,,8
2,Agua oxigenada,Alcohol puro 96°,,,,Sin marca/A granel,,Sante,,,...,1/4 de kilo,,1,,1,,,,,9
3,,,,,,,,,,,...,,,,,,,1,,,10
4,Agua oxigenada,Alcohol puro 96°,Alcohol en gel,,,Sin marca/A granel,,Sante,,,...,1,,1,,1,,1,,,11
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
295,Alcohol puro 96°,,,,,,,Alkofarma,,,...,,,1,,1,,,,,323
296,Alcohol medicinal 70°,,,,,,,Alkomed,,Alkofarma,...,,,1,1,,,,,,324
297,,,,,,,,,,,...,,,,,1,,,,,325
298,,,,,,,,,,,...,,,,,2,,,,,326


In [None]:
dat = df.iloc[:, 238:]
dat

Unnamed: 0,vpond,VPOND1,VPOND2,P5
0,1.0,1.297614,1.111111,"Spray,Botella,Con pulverizador"
1,1.0,1.297614,1.111111,"Spray,Botella"
2,1.0,1.297614,1.111111,Botella
3,1.0,0.893146,0.933333,"Spray,Botella"
4,1.0,1.183471,1.230769,"Spray,Botella"
...,...,...,...,...
295,1.0,1.990974,1.400000,"Spray,Botella"
296,1.0,0.943324,0.954545,Botella
297,1.0,0.810299,0.800000,"Spray,Botella,Con pulverizador"
298,1.0,0.772890,0.933333,"Spray,Botella"


In [148]:
df

Unnamed: 0,caso,FILTRO_A,FILTRO_B,FILTRO_C,FILTRO_C2,NSE,NSE2,P1,P2,P3,...,P12,P15,P16,P17,P23,P26,P27,P28,P29,P30
0,1.0,No,Sí,39.0,36 a 45 años,NSE C1,C1,Masculino,San Juan de Lurigancho,Trabajador dependiente,...,Porque es de una marca reconocida,Casa Grande,"Jemfarma,Casa Grande",Casa Grande,,,"Bicarbonato de sodio,Agua azahar,Agua oxigenad...",Alcohol puro 96°,"Una vez cada 6 meses,Una vez al año,Una vez ca...","Una vez al año,Una vez cada 6 meses,Una vez ca..."
1,2.0,No,Sí,41.0,36 a 45 años,NSE C1,C1,Masculino,San Juan de Lurigancho,Trabajador dependiente,...,"Porque desinfecta (mata gérmenes y bacterias),...","Jemfarma,Alkofarma,Boreal","Jemfarma,Boreal,Hersil,Alkofarma","Jemfarma,Boreal",Porque no tenia buen aroma/su olor no es intenso,"Alcohol,Gel","Bicarbonato de sodio,Alcohol puro 96°",Alcohol puro 96°,"Una vez al mes,Una vez cada 2 o 3 meses","Una vez cada 15 días,Una vez al mes"
2,3.0,No,Sí,43.0,36 a 45 años,NSE C1,C1,Masculino,San Juan de Lurigancho,Trabajador dependiente,...,"Porque no me da inconvenientes,Porque puedo de...",Ninguna,"Erza,Purol",Purol,,,"Bicarbonato de sodio,Alcohol puro 96°",Alcohol puro 96°,"Una vez cada 2 o 3 meses,Una vez al año","Una vez al mes,Una vez cada 15 días"
3,4.0,No,Sí,51.0,46 a 55 años,NSE B2,B2,Masculino,Comas,Trabajador dependiente,...,"Porque desinfecta (mata gérmenes y bacterias),...",Ninguna,Hersil,Hersil,,No precisa,"Alcohol puro 96°,Alcohol en gel","Alcohol puro 96°,Alcohol en gel","Una vez al año,Una vez cada 6 meses,Nunca","Una vez al mes,Una vez cada 15 días"
4,5.0,No,Sí,51.0,46 a 55 años,NSE C1,C1,Femenino,Lima,Trabajador independiente,...,Porque no irrita la piel,Ninguna,Ninguno [NN,No precisa [NN,,,"Bicarbonato de sodio,Agua oxigenada,Alcohol pu...",Alcohol puro 96°,"Una vez al año,Una vez al año,Nunca","Una vez cada 2 o 3 meses,Una vez al año,Una ve..."
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
295,296.0,No,Sí,52.0,46 a 55 años,NSE B1,B1,Masculino,Villa el Salvador,Trabajador independiente,...,"Porque desinfecta (mata gérmenes y bacterias),...","Alkofarma,Aval","Alkofarma,Casa Grande,Purol,Don Emilio,Aval","Alkofarma,Casa Grande,Don Emilio",Irrita la piel,"Alcohol liquido,Alcohol en gel","Agua oxigenada,Alcohol puro 96°",Alcohol puro 96°,"Una vez cada 6 meses,Una vez cada 6 meses","Una vez cada 6 meses,Una vez al mes"
296,297.0,No,Sí,39.0,36 a 45 años,NSE D,D,Femenino,San Juan de Lurigancho,Su casa,...,"Porque no irrita la piel,Porque es puro","Alkofarma,Casa Grande,Experto","Alkofarma,Jemfarma,Casa Grande,Coderal,Boreal,...","Alkofarma,Casa Grande,Boreal",,"Alcohol,Agua oxigenada,Agua de azahar,Alcohol ...","Agua oxigenada,Alcohol medicinal 70%",Alcohol medicinal 70%,"2. Una vez a la semana,Una vez cada 6 meses","Una vez cada 6 meses,2. Una vez a la semana"
297,298.0,No,Sí,36.0,36 a 45 años,NSE D,D,Femenino,Callao,Su casa,...,Porque tiene buen aroma / se siente el alcohol...,Ninguna,Ninguno [NN,No precisa [NN,,,Alcohol puro 96°,Alcohol puro 96°,"Una vez cada 6 meses,Una vez al año",Una vez al mes
298,299.0,No,Sí,42.0,36 a 45 años,NSE D,D,Masculino,Lima,Trabajador independiente,...,"Porque es puro,Porque es de 96%",Ninguna,"Alkofarma,Casa Grande","Alkofarma,Casa Grande",,"Alcohol,Agua de azahar",Alcohol puro 96°,Alcohol puro 96°,Una vez cada 2 o 3 meses,Una vez cada 15 días


In [149]:
df.to_csv('BBDD Alcohol_Limpio.csv', index=False)