# Clasificador de genero del hablante

Definimos una función para extraer atributos (Pitch, RMS, Jitter, Shimmer, NHR) de un audio:

In [None]:
import re, string, sys

# Nombres de los atributos.
nombres_atributos = [
  'longitud',
  'cant_vocales',
  'cant_consonantes',
  'prop_vocales',
  'prop_consonantes',
  'cant_consonantes_vecinas',
  'cant_vocales_vecinas',
  'cant_consonantes_distintas',
  'cant_vocales_distintas',
  'cant_consonantes_iniciales',
  'cant_vocales_iniciales',
  'cant_consonantes_finales',
  'cant_vocales_finales',
]
for i in string.uppercase:
  nombres_atributos.append('cant_letra_'+i)

# Función para extraer atributos.
def extraer(sigla):
  atr = []
  
  # longitud
  longitud = len(sigla)
  atr.append(longitud)
  
  # cant_vocales
  cant_vocales = len([x for x in sigla if x in 'AEIOU'])
  atr.append(cant_vocales)
  
  # cant_consonantes
  cant_consonantes = longitud - cant_vocales
  atr.append(cant_consonantes)
  
  # prop_consonantes
  atr.append(float(cant_consonantes) / float(longitud))

  # prop_vocales
  atr.append(float(cant_vocales) / float(longitud))

  # patron
  patron = ''
  for x in sigla:
    patron += 'v' if x in 'AEIOU' else 'c'

  # cant_consonantes_vecinas
  n = longitud
  found = False
  while not found:
    # buscamos ccc..c en el patron
    if 'c'*n in patron: found = True
    else: n -= 1
  atr.append(n)
  
  # cant_vocales_vecinas
  n = longitud
  found = False
  while not found:
    # buscamos vvv..v en el patron
    if 'v'*n in patron: found = True
    else: n -= 1
  atr.append(n)

  # cant_consonantes_distintas
  atr.append(len(set([x for x in sigla if x not in 'AEIOU'])))
  
  # cant_vocales_distintas
  atr.append(len(set([x for x in sigla if x in 'AEIOU'])))
  
  # cant_consonantes_iniciales
  m = re.search('^c+',patron)
  atr.append(len(m.group(0)) if m else 0)

  # cant_vocales_iniciales
  m = re.search('^v+',patron)
  atr.append(len(m.group(0)) if m else 0)

  # cant_consonantes_finales
  m = re.search('c+$',patron)
  atr.append(len(m.group(0)) if m else 0)

  # cant_vocales_finales
  m = re.search('v+$',patron)
  atr.append(len(m.group(0)) if m else 0)
  
  # cant_letra_?
  for i in string.uppercase:
    atr.append(len([x for x in sigla if x==i]))

  return atr

Ejemplo de uso de la función extraer, con una sigla inventada:

In [None]:
import pprint
pprint.pprint(zip(nombres_atributos, extraer("VIVPEP")))

Armamos el dataset: leemos la tabla con siglas y clases del archivo CSV, y extraemos atributos de cada sigla.

In [None]:
import csv

x = []    # atributos de las instancias (lista de listas)
y = []    # clases de las instancias

with open('siglas.csv', 'rb') as csvfile:
  myreader = csv.reader(csvfile, delimiter=',')
  for row in myreader:
    x.append(extraer(row[0]))
    y.append(row[1])

Entrenamos y evaluamos modelos con 5-fold cross validation:

In [None]:
import numpy as np
from sklearn.model_selection import cross_val_score
from sklearn import svm

clf = svm.SVC(kernel='linear', C=0.25)
scores = cross_val_score(clf, x, y, cv=5)
print "Mean accuracy: %.2f%%" % (np.mean(scores)*100.0)

Finalmente, entrenamos un modelo con todos los datos, y lo usamos para predecir:

In [None]:
clf = svm.SVC(kernel='linear', C=0.25)
clf.fit(x, y)
print clf.predict([extraer("VIVPEP"), extraer("FPFDN")])