In [96]:
import pandas as pandas
import itertools as itertools

listaItemsPosibles = []

def establecerListaItemsPosibles(transacciones):
    ''' Establece los items que pueden estar presentes en las transacciones '''
    listaConjuntoItems = transacciones['Conjunto-Items']
    listaItemsPresentes = [];
    
    for conjuntoItems in listaConjuntoItems:
        conjuntoItems = conjuntoItems.replace(' ', '')
        items = conjuntoItems.split(',')
        
        for item in items:
            if item not in listaItemsPresentes:
                listaItemsPresentes.append(item)
                
    return listaItemsPresentes

def obtenerConjuntoSoporte(transacciones):
    listaConjuntoItems = transacciones['Conjunto-Items']
    listaFrecuenciaItems = [];
    
    for itemPosible in listaItemsPosibles:
        frecuenciaItemActual = 0
        for conjuntoItems in listaConjuntoItems:
            conjuntoItems = conjuntoItems.replace(' ', '')
            listaItemsTransaccion = conjuntoItems.split(',')
            frecuenciaItemActual += listaItemsTransaccion.count(itemPosible)

        listaFrecuenciaItems.append(frecuenciaItemActual)                
                
    conjuntoSoporte = {
        'Conjunto-Items': listaItemsPosibles,
        'Soporte': listaFrecuenciaItems
    }
    return conjuntoSoporte

def eliminarElementosInfrecuentes(listaItemSoporte):
    listaItems = listaItemSoporte['Conjunto-Items']
    listaItemSoporte = listaItemSoporte['Soporte']
    
    indiceActual = 0
    for soporte in listaItemSoporte:
        if soporte <= 1:
            del listaItemSoporte[indiceActual]
            del listaItems[indiceActual]
        indiceActual += 1
    
    conjuntoSoporte = {
        'Conjunto-Items': listaItems,
        'Soporte': listaItemSoporte
    }
    return conjuntoSoporte

def obtenerParesConjuntoSoporte(listaItemSoporte, transacciones):
    listaConjuntoItems = transacciones['Conjunto-Items']
    listaItems = listaItemSoporte['Conjunto-Items']
    listaParesItems = list(itertools.combinations(listaItems,2))
    listaSoporteParesItems = []
    
    for parejaItem in listaParesItems:                    
        parejaItem = list(parejaItem)
        frecuenciaItemActual = 0
        
        for conjuntoItems in listaConjuntoItems:
            conjuntoItems = conjuntoItems.replace(' ', '')
            items = conjuntoItems.replace(',', '')
            
            coincidenciaParejaA = items.count(parejaItem[0])
            coincidenciaParejaB = items.count(parejaItem[1])
            
            if coincidenciaParejaA > 0 and coincidenciaParejaB > 0:                
                frecuenciaItemActual += 1
            
        listaSoporteParesItems.append(frecuenciaItemActual)
        
    paresConjuntoSoporte = {
        'Conjunto-Items': listaParesItems,
        'Soporte': listaSoporteParesItems
    }
    return paresConjuntoSoporte
    
def obtenerConfianzaAsociacion(paresConjuntoSoporte, transacciones):
    listaConjuntoItems = transacciones['Conjunto-Items']
    listaParejasItems = paresConjuntoSoporte['Conjunto-Items']
    listaSoporteParejasItems = paresConjuntoSoporte['Soporte']
    
    listaReglasAsociacion = []
    listaSoporteAsociacion = []
    listaConfianzaAsociacion = []
    
    indiceActual = 0
    for parejaItem in listaParejasItems:
        parejaItem = list(parejaItem)
        
        frecuenciaItemA = 0
        frecuenciaItemB = 0
        for conjuntoItems in listaConjuntoItems:
            conjuntoItems = conjuntoItems.replace(' ', '')
            items = conjuntoItems.replace(',', '')
            
            frecuenciaItemA += items.count(parejaItem[0])
            frecuenciaItemB += items.count(parejaItem[1])
            
        listaReglasAsociacion.append(parejaItem[0] + '=>' + parejaItem[1])
        listaReglasAsociacion.append(parejaItem[1] + '=>' + parejaItem[0])
        
        listaSoporteAsociacion.append(listaSoporteParejasItems[indiceActual])
        listaSoporteAsociacion.append(listaSoporteParejasItems[indiceActual])
        
        listaConfianzaAsociacion.append((listaSoporteParejasItems[indiceActual] / frecuenciaItemA))
        listaConfianzaAsociacion.append((listaSoporteParejasItems[indiceActual] / frecuenciaItemB))
        indiceActual += 1
    
    confianzaAsociacion = {
        'Regla de asociacion': listaReglasAsociacion,        
        'Soporte': listaSoporteAsociacion,
        'Confianza': listaConfianzaAsociacion
    }
    return confianzaAsociacion
    
def obtenerSoporteMasAlto(confianzaAsociacion, umbralConfianza):
    ''' Obtiene la asociacion con mayor soporte usando el umbral dado '''
    listaAsociaciones = confianzaAsociacion['Regla de asociacion']
    listaSoporte = confianzaAsociacion['Soporte']
    listaConfianza = confianzaAsociacion['Confianza']
    
    asociacionMayor = None
    soporteMayor = listaSoporte[0]
    confianzaMayor = listaConfianza[0]    
    
    indiceActual = 0
    for confianza in listaConfianza:
        if confianza >= umbralConfianza and confianza >= confianzaMayor and listaSoporte[indiceActual] >= soporteMayor:
            asociacionMayor = listaAsociaciones[indiceActual]
            soporteMayor = listaSoporte[indiceActual]
            confianzaMayor = confianza
        indiceActual += 1
    
    if confianzaMayor < umbralConfianza:
        asociacionMayor = None
        soporteMayor = -1
        confianzaMayor = -1
    
    soporteMasAlto = {
        'asociacionMayor': asociacionMayor,        
        'soporteMayor': soporteMayor,
        'confianzaMayor': confianzaMayor
    }
    return soporteMasAlto 
# -------------------------------------------------- Init --------------------------------------------------
transacciones = {
    'Transacción ID': [1, 2, 3, 4, 5],
    'Conjunto-Items': ['A, B, C, E', 'B, E', 'C, D, E', 'A, C, D', 'A, C, E']
}

listaItemsPosibles = establecerListaItemsPosibles(transacciones)
transaccionesFrame = pandas.DataFrame(data=transacciones)
print('\033[94mTransacciones\033[0m \n', transaccionesFrame)

conjuntoSoporte = obtenerConjuntoSoporte(transacciones)
conjuntoSoporteFrame = pandas.DataFrame(data=conjuntoSoporte)
print('\n\033[94mSoporte\033[0m\n', conjuntoSoporteFrame)

conjuntoSoporteSinInfrecuentes = eliminarElementosInfrecuentes(conjuntoSoporte)
conjuntoSoporteSinInfrecuentesFrame = pandas.DataFrame(data=conjuntoSoporteSinInfrecuentes)
print('\n\033[94mSoporte sin elementos infrecuentes\033[0m\n', conjuntoSoporteSinInfrecuentesFrame)

paresConjuntoSoporte = obtenerParesConjuntoSoporte(conjuntoSoporte, transacciones)
paresConjuntoSoporteSinInfrecuentes = eliminarElementosInfrecuentes(paresConjuntoSoporte)
paresConjuntoSoporteSinInfrecuentesFrame = pandas.DataFrame(data=paresConjuntoSoporteSinInfrecuentes)
print('\n\033[94mPares frecuentes en las transacciones\033[0m\n', paresConjuntoSoporteSinInfrecuentesFrame)

confianzaSoporte = obtenerConfianzaAsociacion(paresConjuntoSoporteSinInfrecuentes, transacciones)
confianzaSoporteFrame = pandas.DataFrame(data=confianzaSoporte)
print('\n\033[94mReglas de asociación obtenidas\033[0m\n', confianzaSoporteFrame)

umbralConfianza = 0.5
soporteMasAlto = obtenerSoporteMasAlto(confianzaSoporte, umbralConfianza)
print('\n\033[94mSoporte mas alto: \033[0m', soporteMasAlto['soporteMayor'])
print('\n\033[94mConfianza mas alta: \033[0m', soporteMasAlto['confianzaMayor'])
print('\n\033[94mAsociación: \033[0m', soporteMasAlto['asociacionMayor'])

[94mTransacciones[0m 
    Transacción ID Conjunto-Items
0               1     A, B, C, E
1               2           B, E
2               3        C, D, E
3               4        A, C, D
4               5        A, C, E

[94mSoporte[0m
   Conjunto-Items  Soporte
0              A        3
1              B        2
2              C        4
3              E        4
4              D        2

[94mSoporte sin elementos infrecuentes[0m
   Conjunto-Items  Soporte
0              A        3
1              B        2
2              C        4
3              E        4
4              D        2

[94mPares frecuentes en las transacciones[0m
   Conjunto-Items  Soporte
0         (A, C)        3
1         (A, E)        2
2         (B, C)        1
3         (B, E)        2
4         (C, E)        3
5         (C, D)        2

[94mReglas de asociación obtenidas[0m
    Regla de asociacion  Soporte  Confianza
0                 A=>C        3   1.000000
1                 C=>A        3   0.75000