# FP Growth Function

In [13]:
def fpgrowthFromFile(fname, minSupRatio, minConf):
    itemSetList, frequency = pd.read_csv(fname)
    minSup = len(itemSetList) * minSupRatio
    fpTree, headerTable, _ = constructTree(itemSetList, frequency, minSup)

    freqItems = []
    mineTree(headerTable, minSup, set(), freqItems)
    rules = associationRule(freqItems, itemSetList, minConf)
    print(freqItems, rules)

# Tree Construction


In [77]:
from collections import defaultdict
    
# Fonction pour construire l'arbre FP
def constructTree(itemSetList, frequency, minSup):
    headerTable = defaultdict(int)  # Initialise un dictionnaire pour compter les fréquences des items

    # Comptage des fréquences et création de la table des entêtes
    for idx, itemSet in enumerate(itemSetList):
        for item in itemSet:
            headerTable[item] += frequency[idx]  # Ajoute la fréquence de l'item dans la table

    # Suppression des items dont la fréquence est inférieure au seuil de support minimal
    headerTable = dict((item, sup) for item, sup in headerTable.items() if sup >= minSup)
    
    # Si après nettoyage la table est vide, il n'y a pas d'items fréquents, on retourne None
    if len(headerTable) == 0:
        return None, None

    # Prépare la table des entêtes avec la fréquence et un pointeur vers le premier nœud
    for item in headerTable:
        headerTable[item] = [headerTable[item], None]

    # Initialisation du nœud racine de l'arbre FP (appelé "Null")
    fpTree = Node('Null', 1, None)

    # Mise à jour de l'arbre FP pour chaque ensemble d'items nettoyé et trié
    for idx, itemSet in enumerate(itemSetList):
        # Filtrer les items qui ne sont pas dans la table des entêtes
        itemSet = [item for item in itemSet if item in headerTable]
        # Trier les items par fréquence décroissante
        itemSet.sort(key=lambda item: headerTable[item][0], reverse=True)

        # Parcourir l'arbre à partir de la racine pour ajouter les éléments dans les branches
        currentNode = fpTree
        for item in itemSet:
            # Mettre à jour l'arbre avec l'item
            currentNode = updateTree(item, currentNode, headerTable, frequency[idx])

    # Retourner l'arbre FP et la table des entêtes
    return fpTree, headerTable


# Fonction pour mettre à jour l'arbre FP avec un nouvel item
def updateTree(item, treeNode, headerTable, frequency):
    if item in treeNode.children:
        # Si l'item existe déjà dans l'arbre, on incrémente sa fréquence
        treeNode.children[item].increment(frequency)
    else:
        # Sinon, on crée un nouveau nœud pour cet item
        newItemNode = Node(item, frequency, treeNode)
        treeNode.children[item] = newItemNode
        # Lier le nouveau nœud à la table des entêtes
        updateHeaderTable(item, newItemNode, headerTable)

    # Retourner le nœud de l'item
    return treeNode.children[item]


# Fonction pour mettre à jour la table des entêtes
def updateHeaderTable(item, targetNode, headerTable):
    if headerTable[item][1] is None:
        # Si aucun nœud n'est encore lié à l'item, lier ce nœud à l'entête
        headerTable[item][1] = targetNode
    else:
        # Si un nœud existe déjà, on parcourt la liste des nœuds et on ajoute ce nouveau nœud à la fin
        currentNode = headerTable[item][1]
        while currentNode.next is not None:
            currentNode = currentNode.next
        currentNode.next = targetNode

# Exploitation minière des arbres


In [None]:
def mineTree(headerTable, minSup, preFix, freqItemList):
    # Sort the items with frequency and create a list
    sortedItemList = [item[0] for item in sorted(list(headerTable.items()), key=lambda p:p[1][0])] 
    # Start with the lowest frequency
    for item in sortedItemList:  
        # Pattern growth is achieved by the concatenation of suffix pattern with frequent patterns generated from conditional FP-tree
        newFreqSet = preFix.copy()
        newFreqSet.add(item)
        freqItemList.append(newFreqSet)
        # Find all prefix path, constrcut conditional pattern base
        conditionalPattBase, frequency = findPrefixPath(item, headerTable) 
        # Construct conditonal FP Tree with conditional pattern base
        conditionalTree, newHeaderTable = constructTree(conditionalPattBase, frequency, minSup) 
        if newHeaderTable != None:
            # Mining recursively on the tree
            mineTree(newHeaderTable, minSup,
                       newFreqSet, freqItemList)

def findPrefixPath(basePat, headerTable):
    # First node in linked list
    treeNode = headerTable[basePat][1] 
    condPats = []
    frequency = []
    while treeNode != None:
        prefixPath = []
        # From leaf node all the way to root
        ascendFPtree(treeNode, prefixPath)  
        if len(prefixPath) > 1:
            # Storing the prefix path and it's corresponding count
            condPats.append(prefixPath[1:])
            frequency.append(treeNode.count)

        # Go to next node
        treeNode = treeNode.next  
    return condPats, frequency

def ascendFPtree(node, prefixPath):
    if node.parent != None:
        prefixPath.append(node.itemName)
        ascendFPtree(node.parent, prefixPath)