In [11]:
import bisect
from graphviz import Digraph 

class _BTreeNode(object):
    def __init__(self, values=None, children=None):
        self.parent = None
        self.values = values or []
        self.children = children
        # actualizamos el nodo padre en los hijos, solo en caso que ahya sido cambiado
        if self.children:
            for i in self.children:
                i.parent = self

    def __str__(self):
        return 'Node(%x, %x, %r, %d)' % (
                id(self),
                id(self.parent),
                self.values,
                len(self.children) if self.children else 0)
        
    def pretty_print(self, tab=''):
        print('%s%s' % (tab, self.values))
        if self.children:
            for i in self.children:
                i.pretty_print(tab + '   ')

    
    def findChilds3(self):
        hijo=self.values
        hijo=str(hijo)
        #g.edge(r, hijo)
        return hijo
    
    def findChilds2(self,r,g):
        hijo=self.values
        hijo=str(hijo)
        
        if self.children:
            for i in self.children:
                hijo_=i.findChilds3()
                print("hijo 3: "+hijo)
                g.edge(hijo, hijo_)
        return hijo
        
        
    def findChilds(self,r,g):
        hijo=self.values
        hijo=str(hijo)
        
        if self.children:
            for i in self.children:
                hijo_=i.findChilds2(hijo,g)
                print("hijo 2: "+hijo)
                g.edge(hijo, hijo_)
        
        return hijo
    
    def pretty_print_(self, tab=''):
        g = Digraph('G', filename='btree.gv')
        print('%s%s' % (tab, self.values))
        raiz=""
        for i in self.values:
            raiz=raiz+str(i)+" "
        print("raiz: "+raiz)
        hijin=" "
        if self.children:
            for i in self.children:
                hijin=i.findChilds(hijin,g)
                g.edge(raiz, hijin ) 
                print("hijo: "+hijin)
         
        g.view()
        

    # Verificamos (recursivamente) la integridad del árbol de acuerdo con las reglas del árbol B.
    
    def check_valid(self, tree):
        innerNode = self.children is not None
        rootNode = self.parent is None

        assert(self.values is not None)

        # un nodo interno excepto que la raíz tiene al menos min_values
        if not rootNode and innerNode:
            assert(tree.min_values <= len(self.values))

        # un nodo no puede tener más de max_values
        assert(len(self.values) <= tree.max_values)

        # La raíz tiene al menos dos hijos si no es un nodo hoja.
        if rootNode and innerNode:
            assert(len(self.children) >= 2)

        # Un nodo no hoja con k hijos contiene k-1 claves.
        if innerNode:
            assert((len(self.values) + 1) == len(self.children))
        
        #comprueba  que los valores estén ordenados
        prev = None
        for i in self.values:
            if prev is not None:
                assert(i > prev)
            prev = i

        if self.children:
            for i in self.children:
                assert(i.parent is self)
                i.check_valid(tree)


    """
   Busqueda.
    
     Si el valor no existe en el árbol, desplácese hacia abajo y
     devolver el nodo hoja y la posición de inserción en ese nodo donde
     se debe colocar el valor. es decir, la tupla: (Falso, nodo, pos)
     Si val existe en el árbol, devuelve la tupla: (Verdadero, nodo, pos),
     donde nodo es el nodo que contiene el valor y pos es el
     posición del valor dentro de ese nodo.
    """
    def search(self, val):
        i = bisect.bisect_left(self.values, val)
        if (i != len(self.values) and not val < self.values[i]):
            # un valor fue encontrado
            assert(self.values[i] == val)
            return (True, self, i)            

        if self.children is not None:
            assert(len(self.children) >= i and self.children[i])
            # recursivamente buscamos hacia abajo, es decir hacia los hijos
            return self.children[i].search(val)
        else:
            return (False, self, i)

    """ Dividimos un nodo del árbol en dos.
    Si se dan val y slot, inserte también val en los nodos resultantes. 
    Si además se proporciona childNodes, 
    se llama de forma recursiva a _split_node desde add y childNodes
    representan los nodos separados por el valor val en el padre de este nodo.
    """    
    def _split_node(self, tree, val=None, slot=None, childNodes=None):
        assert(val is None or (slot is not None))

        midList = [] if val is None else [ val ]
        if slot is None:
            slot = 0

        # obtenemos la mediana de self.values y val
        splitValues = self.values[0:slot] + midList + self.values[slot:]
        medianIdx = len(splitValues) // 2
        
        lv = splitValues[0:medianIdx]
        medianVal = splitValues[medianIdx]
        rv = splitValues[medianIdx + 1:]
        
        innerNode = self.children is not None

        if innerNode:
            if childNodes is not None:
                splitChildren = (self.children[0:slot] + 
                                 list(childNodes) + 
                                 self.children[slot + 1:])
            else:
                splitChildren = self.children
            lc = splitChildren[0:len(lv) + 1]
            rc = splitChildren[len(lv) + 1:]
        else:
            lc = None
            rc = None

        leftNode = _BTreeNode(lv, lc)
        rightNode = _BTreeNode(rv, rc)

        if self.parent:
            self.parent.add(tree,
                            medianVal,
                            None,
                            (leftNode, rightNode))
        else:
            # creamos una nueva raíz e incrementamos la profundidad del árbol
            newRoot = _BTreeNode([ medianVal ], [leftNode, rightNode])
            leftNode.parent = newRoot
            rightNode.parent = newRoot
            tree.root = newRoot
            tree.height += 1
            tree.size += 1
        

    """
    Agregar
    """
    def add(self, tree, val, slot=None, childNodes=None):
        # todas las inserciones deben comenzar en un nodo hoja,
        # a menos que llamemos a add recursivamente en el padre
        #como resultado de la división de nodos
        # cuando agregamos el valor mediano al padre
        assert(self.children is None or childNodes)

        #si este es un nodo interno si no es una hoja o la raíz
        # entonces  self.children  no es  None, entonces también
        # esta función debe haber sido llamada recursivamente
        # con childNodes no None, val no None y
        # len(childNodes) == 2
        innerNode = self.children is not None
        if innerNode:
            assert(childNodes and len(childNodes) == 2)
        else:
            assert(childNodes is None)
        
        # si aún no lo ha encontrado, busque la posición de inserción entre 
        # los valores del nodo actual
        if slot is None:
            slot = bisect.bisect_left(self.values, val)

        # Podemos hacer la inserción en los valores de nodo actuales?
        if len(self.values) < tree.max_values:
            self.values.insert(slot, val)
            tree.size += 1
            if childNodes:
                # actualizamos la referencia principal en los nodos que estamos a punto de agregar
                for i in childNodes:
                    i.parent = self
                self.children[slot:slot + 1] = childNodes
            return True
        
        # si llegamos aquí, significa que nuestro nodo esta full y debemos de hacer un split
        self._split_node(tree, val, slot, childNodes)
        return True


    def min_value(self, slot=0):
        if self.children:
            return self.children[slot].min_value()
        return self.values[0], self, 0

    def max_value(self, slot=None):
        if slot is None:
            slot = len(self.values) - 1
        if self.children:
            return self.children[slot + 1].max_value()
        return self.values[-1], self, len(self.values) - 1


    """
    Eliminar
    """
    def delete(self, tree, val, slot=None):

        innerNode = self.children is not None        
        if slot is None:
            assert(slot is not None)
            slot = bisect.bisect_left(self.values, val)
        
        assert(slot != len(self.values) and self.values[slot] == val)
        
        if not innerNode:
            # realizamos la eliminación de una hoja
            del self.values[slot]
            tree.size -= 1
            if len(self.values) < tree.min_values:
                #subdesbordamiento ocurrió en el nodo de la hoja
                # rebalanzeamos el tree con este mismo nodo
                self._rebalance(tree)
        else:
            #encontramos el valor mínimo en el subárbol derecho
            # y utilizamos  como valor separador para reemplazar val
            newSep, node, idx = self.min_value(slot + 1)
            self.values[slot] = newSep
            del node.values[idx]
            tree.size -= 1
            if len(node.values) < tree.min_values:
                node._rebalance(tree)

    # rebalanzeamos el Btree con el nodo actual
    def _rebalance(self, tree):
        lsibling, rsibling, idx = self.get_siblings()
        
        # Solo la raíz no tiene hermanos
        assert(rsibling or lsibling or self.parent is None)

        if self.parent is None:
            # esta es una operación no disponible para el nodo raíz
            return

        innerNode = self.children is not None
        if innerNode:
            assert(rsibling is None or rsibling.children is not None)
            assert(lsibling is None or lsibling.children is not None)
        else:
            assert(rsibling is None or rsibling.children is None)
            assert(lsibling is None or lsibling.children is None)

        if not innerNode:
            if rsibling and len(rsibling.values) > tree.min_values:
                sepIdx = idx
                sepVal = self.parent.values[sepIdx]
                # pedimos prestado el nodo de rsibling para realizar una rotación a la izquierda
                self.parent.values[sepIdx] = rsibling.values[0]
                del rsibling.values[0]
                self.values.append(sepVal)
                return
            elif lsibling and len(lsibling.values) > tree.min_values:
                sepIdx = idx - 1
                sepVal = self.parent.values[sepIdx]
                # pedir prestado el nodo de rsibling para realizar una rotación a la derecha
                self.parent.values[sepIdx] = lsibling.values[-1]
                del lsibling.values[-1]
                self.values.insert(0, sepVal)
                return

        # tenemos que juntar 2 nodos
        if lsibling is not None:
            sepIdx = idx - 1
            ln = lsibling
            rn = self
        elif rsibling is not None:
            sepIdx = idx
            ln = self
            rn = rsibling
        else:
            assert(False)
        
        sepVal = self.parent.values[sepIdx]

        ln.values.append(sepVal)
        ln.values.extend(rn.values)
        del rn.values[:]
        del self.parent.values[sepIdx]
        assert(self.parent.children[sepIdx + 1] is rn)
        del self.parent.children[sepIdx + 1]
        if rn.children:
            ln.children.extend(rn.children)
            for i in rn.children:
                i.parent = ln

        if len(ln.values) > tree.max_values:
            # tenemos que dividir el nodo recién formado
            # esta situación puede surgir solo cuando se fusionan nodos internos
            assert(innerNode)
            ln._split_node(tree)

        if len(self.parent.values) < tree.min_values:
            # reequilibramos el padre
            self.parent._rebalance(tree)            

        if self.parent.parent is None and not self.parent.values:
            tree.root = ln
            tree.root.parent = None

    """  
    Obtenga los hermanos adyacentes de este nodo.
    Devuelve la tupla: (nodo hermano izquierdo, nodo hermano derecho, índice separador).
    Si un hermano no existe, se devuelve None en su lugar.
    El índice del separador representa el índice de este nodo en la lista de hijos de su padre.
    """
    def get_siblings(self):
        if not self.parent:
            # the root doesn't have siblings
            return (None, None, 0)

        assert(self.parent.children)

        lsibling = None
        rsibling = None
        idx = 0

        for i, j in enumerate(self.parent.children):
            if j is self:
                if i != 0:
                    lsibling = self.parent.children[i - 1]
                if (i + 1) < len(self.parent.children):
                    rsibling = self.parent.children[i + 1]
                idx = i  
                break

        return (lsibling, rsibling, idx)


In [12]:

class BTree(object):
    """ 
        Creamos un árbol B de un orden determinado.
        El orden se interpreta como el número máximo de hijos por nodo,
        que es el número máximo de claves por nodo más uno.
    """
    def __init__(self, order):
        if order <= 2:
            raise ValueError("B-tree debe tener al menos 3")
        self.root = _BTreeNode()
        self.order = order
        self.max_values = order - 1
        self.min_values = self.max_values // 2
        self.height = 1
        self.size = 0
        
    def __str__(self):
        return 'height: %d items: %d m: %d root: %x' % (
                                    self.height, self.size,
                                    self.max_values + 1,
                                    id(self.root))

    def add(self, val):
        # buscamos el nodo hoja donde se debe agregar el valor
        found, node, slot = self.root.search(val)
        if found:
            # el valor ya existe, no se puede agregar dos veces
            return False
        return node.add(self, val, slot, None)

    def delete(self, val):
        # Entramos el valor
        found, node, slot = self.root.search(val)
        if not found:
            # el valor no existe, por lo tanto no puede ser eliminado
            return False
        return node.delete(self, val, slot)

    def search(self, val):
        return self.root.search(val)[0]

    def min(self):
        return self.root.min_value()[0]

    def max(self):
        return self.root.max_value()[0]
    



In [13]:
tree = BTree(4)
for i in range(1, 20):
    tree.add(i)
    assert(tree.search(i))
        
print("B-tree imprimiendo valores: ")
tree.root.pretty_print()  

B-tree imprimiendo valores: 
[9]
   [3, 6]
      [1, 2]
      [4, 5]
      [7, 8]
   [12, 15, 18]
      [10, 11]
      [13, 14]
      [16, 17]
      [19]


In [14]:
tree.root.pretty_print_() 

[9]
raiz: 9 
hijo 2: [3, 6]
hijo 2: [3, 6]
hijo 2: [3, 6]
hijo: [3, 6]
hijo 2: [12, 15, 18]
hijo 2: [12, 15, 18]
hijo 2: [12, 15, 18]
hijo 2: [12, 15, 18]
hijo: [12, 15, 18]


In [15]:
tree.delete(4)

In [16]:
tree.min()

1

In [17]:
tree.max()

19

In [19]:
tree.root.pretty_print_() 

[9]
raiz: 9 
hijo 2: [3, 6]
hijo 2: [3, 6]
hijo 2: [3, 6]
hijo: [3, 6]
hijo 2: [12, 15, 18]
hijo 2: [12, 15, 18]
hijo 2: [12, 15, 18]
hijo 2: [12, 15, 18]
hijo: [12, 15, 18]
