# Myers-Brigs Type Indicator - MBTI
MBTI identifica cuatro dicotomías separadas:
Extraversión vs Introversión, Sensación vs Intuición, Pensamiento vs Sentimiento, y Juicio vs Percepción. Se supone que un individuo tiene preferencia por una de cada par de opuestos sobre la otra. 

<table align='center'>
<tr>
<th colspan=2> Extraversión - Introversión <br/> (actitudes u orientaciones de energía) </th>
</tr>

<tr>
<th> Extraversión (E) </th>
<th> Introversión (I) </th>
</tr>
<tr>
<td>
    Están orientados principalmente hacia el mundo exterior, tienden a enfocar su energía en las personas y los objetos.
</td>
<td>
    Están orientados principalmente hacia el mundo interior, tienden a enfocar su energía en conceptos, ideas y experiencias internas.  
</td>
</tr>

<tr>
<th colspan=2> Sensación - Intuición <br/> (funciones o procesos de percepción) </th>
</tr>
<tr>
<th> Sensación (S) </th>
<th> Intuición (N) </th>
</tr>
<tr>
<td>
    Están orientados principalmente hacia lo que se puede percibir por los cinco sentidos.
</td>
<td>
    Están enfocados principalmente en percibir patrones e interrelaciones.  
</td>
</tr>

<tr>
<th colspan=2> Sensación - Intuición <br/> (funciones o procesos de juicio) </th>
</tr>
<tr>
<th> Pensamiento (T) </th>
<th> Sentimiento (F) </th>
</tr>
<tr>
<td>
    Basando conclusiones en análisis lógicos con un enfoque en la objetividad y la distancia emocional.
</td>
<td>
    Basando conclusiones en valores personales o sociales con un enfoque en la comprensión y la armonía.  
</td>
</tr>

<tr>
<th colspan=2> Sensación - Intuición <br/> (actitudes u orientaciones hacia cómo se enfrenta el mundo exterior) </th>
</tr>
<tr>
<th> Juicio (J) </th>
<th> Percepción (P) </th>
</tr>
<tr>
<td>
    Prefiriendo la determinación y el cierre que resultan al lidiar con el mundo exterior utilizando uno de los procesos de Juicio.
</td>
<td>
    Prefiriendo la flexibilidad y espontaneidad que resulta al lidiar con el mundo exterior utilizando uno de los procesos de Percepción.  
</td>
</tr>
</table>

![](mbti.jpg)

## EDA → Análisis exploratorio de las palabras más repetidas por cada tipo de personalidad

In [1]:
# importaciones
import pandas as pd

In [6]:
# Leemos el dataset
mbti = pd.read_csv('../data/MBTI500.data.enriched.txt', sep='\t', header=0, encoding='utf-8')

# Exploramos para ver qué información tenemos y como está dispuesta
mbti.head()

Unnamed: 0,type,count,actually,also,always,come,could,de,det,en,...,u,use,want,way,well,work,would,yeah,year,Unnamed: 89
0,ENFJ,1534,0,3437,0,2409,0,0,0,3817,...,2421,2421,4354,3903,2921,2824,5231,0,0,
1,ENFP,6167,0,13704,10250,10208,0,0,0,18756,...,0,0,19387,15935,11149,13580,16753,0,0,
2,ENTJ,2955,0,6325,0,4292,0,0,0,8349,...,4990,4990,8172,6828,5514,6942,9739,0,0,
3,ENTP,11725,0,24268,0,16825,17334,0,0,27712,...,21804,21804,30172,29124,22458,25334,37707,0,0,
4,ESFJ,181,0,450,332,314,0,0,0,0,...,335,335,507,488,381,0,626,0,0,


In [8]:
mbti.info

<bound method DataFrame.info of     type  count  actually   also  always   come  could   de   det     en  ...  \
0   ENFJ   1534         0   3437       0   2409      0    0     0   3817  ...   
1   ENFP   6167         0  13704   10250  10208      0    0     0  18756  ...   
2   ENTJ   2955         0   6325       0   4292      0    0     0   8349  ...   
3   ENTP  11725         0  24268       0  16825  17334    0     0  27712  ...   
4   ESFJ    181         0    450     332    314      0    0     0      0  ...   
5   ESFP    360         0    774       0    585      0    0     0      0  ...   
6   ESTJ    482         0    926       0      0      0  780  1753    810  ...   
7   ESTP   1986      2550   4787       0      0   2764    0     0      0  ...   
8   INFJ  14963         0  33727       0  24270      0    0     0      0  ...   
9   INFP  12134         0  26719   20017  18875      0    0     0      0  ...   
10  INTJ  22427         0  48949       0  33612  32442    0     0      0  ...

In [10]:
mbti.dtypes

type            object
count            int64
actually         int64
also             int64
always           int64
                ...   
work             int64
would            int64
yeah             int64
year             int64
Unnamed: 89    float64
Length: 90, dtype: object

In [11]:
# Comprobamos si hay valores faltantes
mbti.isna().sum()

type            0
count           0
actually        0
also            0
always          0
               ..
work            0
would           0
yeah            0
year            0
Unnamed: 89    16
Length: 90, dtype: int64

Existen valores faltantes en la última columna. La eliminamos para que no nos genere problemas.

In [15]:
mbti = mbti.drop('Unnamed: 89', axis=1)

In [17]:
mbti

Unnamed: 0,type,count,actually,also,always,come,could,de,det,en,...,type.1,u,use,want,way,well,work,would,yeah,year
0,ENFJ,1534,0,3437,0,2409,0,0,0,3817,...,4462,2421,2421,4354,3903,2921,2824,5231,0,0
1,ENFP,6167,0,13704,10250,10208,0,0,0,18756,...,12209,0,0,19387,15935,11149,13580,16753,0,0
2,ENTJ,2955,0,6325,0,4292,0,0,0,8349,...,7091,4990,4990,8172,6828,5514,6942,9739,0,0
3,ENTP,11725,0,24268,0,16825,17334,0,0,27712,...,25091,21804,21804,30172,29124,22458,25334,37707,0,0
4,ESFJ,181,0,450,332,314,0,0,0,0,...,891,335,335,507,488,381,0,626,0,0
5,ESFP,360,0,774,0,585,0,0,0,0,...,1458,648,648,810,857,692,552,1277,622,0
6,ESTJ,482,0,926,0,0,0,780,1753,810,...,1862,807,807,1047,979,710,828,1529,0,0
7,ESTP,1986,2550,4787,0,0,2764,0,0,0,...,3167,2705,3778,4199,3626,3759,3014,7024,0,2585
8,INFJ,14963,0,33727,0,24270,0,0,0,0,...,29741,23748,23748,44660,40800,27674,32591,44185,0,0
9,INFP,12134,0,26719,20017,18875,0,0,0,0,...,24522,18247,18247,34838,30809,22687,23215,35937,0,0


Vamos a eliminar las palabras que tengan menos de tres letras, ya que no nos van a servir

In [18]:
# eliminando columnas cuyo nombre es menor a 3

mbti = mbti.drop([columna for columna in mbti.columns if len(columna) < 3], axis=1)

In [20]:
mbti.shape

(16, 79)

→ Se eliminaron 10 columnas

→ Vamos a ver qué palabras hay en el dataset

In [24]:
mbti.columns

Index(['type', 'count', 'actually', 'also', 'always', 'come', 'could', 'det',
       'enfj', 'enfp', 'entj', 'entp', 'esfj', 'esfp', 'estj', 'estp', 'even',
       'feel', 'find', 'friend', 'function', 'german', 'germany', 'get',
       'give', 'good', 'help', 'ikke', 'infj', 'infp', 'interest', 'intj',
       'intp', 'isfj', 'isfp', 'istj', 'istp', 'jeg', 'know', 'life', 'like',
       'lol', 'look', 'lot', 'love', 'make', 'mean', 'much', 'need', 'one',
       'people', 'person', 'pretty', 'really', 'right', 'say', 'see', 'seem',
       'someone', 'something', 'still', 'take', 'talk', 'thank', 'thing',
       'think', 'though', 'til', 'time', 'try', 'type.1', 'use', 'want', 'way',
       'well', 'work', 'would', 'yeah', 'year'],
      dtype='object')

Como podemos observar dntro de las palabras están las abreviaciones de personalidades, las eliminamos ya que no nos proporcionarán información relevante.

In [26]:
abv = ['enfj', 'enfp', 'entj', 'entp', 'esfj', 'esfp', 'estj', 'estp', 'infj', 'infp', 'intj', 'intp', 'isfj', 'isfp', 'istj', 'istp',]

mbti.drop([column for column in  mbti.columns if column in abv], axis=1)

Unnamed: 0,type,count,actually,also,always,come,could,det,even,feel,...,try,type.1,use,want,way,well,work,would,yeah,year
0,ENFJ,1534,0,3437,0,2409,0,0,2714,7462,...,3357,4462,2421,4354,3903,2921,2824,5231,0,0
1,ENFP,6167,0,13704,10250,10208,0,0,11539,29093,...,13685,12209,0,19387,15935,11149,13580,16753,0,0
2,ENTJ,2955,0,6325,0,4292,0,0,5160,8126,...,5769,7091,4990,8172,6828,5514,6942,9739,0,0
3,ENTP,11725,0,24268,0,16825,17334,0,22196,33042,...,23214,25091,21804,30172,29124,22458,25334,37707,0,0
4,ESFJ,181,0,450,332,314,0,0,333,694,...,314,891,335,507,488,381,0,626,0,0
5,ESFP,360,0,774,0,585,0,0,0,1138,...,603,1458,648,810,857,692,552,1277,622,0
6,ESTJ,482,0,926,0,0,0,1753,721,1065,...,724,1862,807,1047,979,710,828,1529,0,0
7,ESTP,1986,2550,4787,0,0,2764,0,3921,2826,...,2702,3167,3778,4199,3626,3759,3014,7024,0,2585
8,INFJ,14963,0,33727,0,24270,0,0,30179,72805,...,34270,29741,23748,44660,40800,27674,32591,44185,0,0
9,INFP,12134,0,26719,20017,18875,0,0,24743,59917,...,25455,24522,18247,34838,30809,22687,23215,35937,0,0


Según lo investigado sobre los tipos de personalidad los podemos dividir en 4 subgrupos:

![](subgrupos-mbti.jpg)

1. NF 
    a. ENFJ
    b. ENFP
    a. INFJ
    b. INFP
2. NT
    a. ENTJ
    b. ENTP
    a. INTJ
    b. INTP
3. SF
    a. ESFJ
    b. ESFP
    a. ISFJ
    b. ISFP
4. ST
    a. ENTJ
    b. ENTP
    a. INTJ
    b. INTP