Arboles de Decisión
===

**Juan David Velásquez Henao**  
jdvelasq@unal.edu.co   
Universidad Nacional de Colombia, Sede Medellín  
Facultad de Minas  
Medellín, Colombia

---

Haga click [aquí](https://github.com/jdvelasq/statistics-for-analytics/tree/master/) para acceder al repositorio online.

Haga click [aquí](http://nbviewer.jupyter.org/github/jdvelasq/statistics-for-analytics/tree/master/) para explorar el repositorio usando `nbviewer`. 

---

# Definición del problema en términos del negocio

La compañía A va a participar en una convocatoria por invitación directa para el desarrollo y producción de una nueva pieza de equipo para un mercado emergente. Los costos de producción son inciertos. Adicionalmente, se sabe que la compañía B también ha sido invitada a la licitación privada y tiene una experiencia y reputación equivalente a la compañía A. ¿Cómo debe definirse el valor de la oferta por parte de la compañia A?

# Definición del problema en términos de los datos

El gerente de la compañía A debe decidir si la empresa se presenta o no a la licitación privada, y en caso de presentarse puede elegir entre 300, 500 o 700 como valor de su oferta. El equipo comercial estima que la compañía B podría presentar valores de oferta de 400, 600 o 800 con probabilidades de 35%, 50% y 15% respectivamente. El equipo de ingenería estima que los costos podrían ser de 200, 400 o 600 con probabilidades de 25%, 50% y 25% respectivamente. La utilidad para la compañía A se puede estimar simplemente como OFERTA_A - COSTO_A. 

# Solución

Una forma de estructurar el análisis anterior es mediante el uso de árboles de decisión. Cada nodo del árbol representa una variable del problema y las ramas del nodo representa los valores que puede tomar dicha variable. En el problema descrito existen dos variables probabilisticas: la oferta de B (OFERTA_B) y los costos de A (COSTO_A); estas se representan como nodos de la siguiente forma:

           COSTO_A              OFERTA_B
          
         PROB  VAL             PROB  VAL
       __0.25__200           __0.35__400
    __C__0.50__400        __C__0.55__600
      |__0.25__600          |__0.15__800
      
      
Por otra parte, el nodo que representa el valor de oferta de la compañía A es un nodo de decisión, esto es, el gerente puede decidir la acción a tomar (la rama a seguir). Este nodo se representa como:

           OERTA_A
          
               VAL
       ________300
      |________500
    __D
      |________700
      |______NOBID


Ya que las variables son independientes entre si, es posible estructurar su secuencia bajo la forma de un árbol. Ya que las ramas son eventos independientes, es posible calcular la probabilidad de una trayectoria por el árbol, como la multiplicación de las probabilidades de cada rama.  

---
**Ejercicio.--** Complete las probabilidades de cada rama para el árbol presentado a continuación.


                             OFERTA_B                  COSTO_A
                                             
                            PROB  VAL                PROB  VAL         PROB
                                             
                                                   __0.25__200______ 0.0875
                          __0.35__400_____________C__0.50__400______      ?
                         |                        |__0.25__600______      ?
                         |
                         |                        ___0.25__200_____       ?
                     ____C__0.50__600____________C___0.50__400_____  0.2500
                         |                       |___0.25__600_______     ?
                         |
                         |                        ___0.25__200_______0.0375
                         |__0.15__800____________C___0.50__400_______     ?
                                                 |___0.25__600_______     ?
                        

---

De acuerdo con el enunciado del problema, si la compañía B presenta una oferta más baja, la compañía A pierde el contrato y su utilidad es cero. Si la compañia A gana el contrato, entonces la utilidad será OFERTA_A - COSTO_A. 

El valor esperado de un nodo probabilistico es la sumatoria de los valores esperados de sus ramas multiplicados por la probabilidad de la correspondiente rama.

---
**Ejercicio.--** El siguiete diagrama representa el árbol de decisiones del problema enunciado. Realice lo siguiente:

* Compute el valor de la utilidlad para todas las ramas terminales.


* Compute el valor esperado de los nodos COSTO_A.


* Compute el valor esperado de los nodos OFERTA_B.


* Compute el valor esperado de la decisión.


* Cuál debe ser la oferta de A?


              DECISION    OFERTA_A           OFERTA_B                  COSTO_A      UTILIDAD
             -------------------------------------------------------------------------------------             
                             
              EXP VAL     VAL                PROB  VAL   EXP VAL      PROB  VAL      EXP VAL    PROB 
                                                                    __0.25__200_______+100.0__0.0875 
                                           __0.35__400____-100.0___C__0.50__400_______     ?__     ?
                                          |                        |__0.25__600_______     ?__     ?
                                          |
                                          |                        ___0.25__200_______     ?__     ?
                        __300_____-100.0__C__0.55__600____     ?__C___0.50__400_______-100.0__0.2500
                       |                  |                       |___0.25__600_______     ?__     ?
                       |                  |
                       |                  |                        ___0.25__200_______     ?__     ?
                       |                  |__0.15__800____     ?__C___0.50__400_______     ?__     ? 
                       |                                          |___0.25__600_______-300.0__0.0375
                       |
                       |                                            __0.25__200_______   0.0__0.0875
                       |                   __0.35__400____-100.0___C__0.50__400_______     ?__     ?
                       |                  |                        |__0.25__600_______     ?__     ?
                       |                  |
                       |                  |                        ___0.25__200_______     ?__     ? 
                       |__500______    ?__C__0.55__600____-100.0__C___0.50__400_______+100.0__0.2500
                       |                  |                       |___0.25__600_______     ?__     ?
                       |                  |
                       |                  |                        ___0.25__200_______     ?__     ?
                       |                  |__0.15__800____-100.0__C___0.50__400_______     ?__     ?
                       |                                          |___0.25__600_______-100.0__0.0375
           _______  ?__D
                       |                                            __0.25__200_______   0.0__0.0875
                       |                   __0.35__400____-100.0___C__0.50__400_______     ?__     ? 
                       |                  |                        |__0.25__600_______     ?__     ?
                       |                  |
                       |                  |                        ___0.25__200_______     ?__     ?
                       |__700_______   ?__C__0.55__600____-100.0__C___0.50__400_______   0.0__0.2500
                       |                  |                       |___0.25__600_______     ?__     ?
                       |                  |
                       |                  |                        ___0.25__200_______     ?__     ?
                       |                  |__0.15__800____-100.0__C___0.50__400_______     ?__     ?
                       |                                          |___0.25__600_______+100.0__0.0375
                       |
                       |__NOBID______0.0____________________________________________________

---

**Ejercicio.--** A partir de los valores esperados de los nodos terminales del árbol y su respectiva probabilidad, grafique la curva de probabilidad acumulada para la utilidad de la compañía A.


---

Arboles de Decisión
===

**Juan David Velásquez Henao**  
jdvelasq@unal.edu.co   
Universidad Nacional de Colombia, Sede Medellín  
Facultad de Minas  
Medellín, Colombia

---

Haga click [aquí](https://github.com/jdvelasq/statistics-for-analytics/tree/master/) para acceder al repositorio online.

Haga click [aquí](http://nbviewer.jupyter.org/github/jdvelasq/statistics-for-analytics/tree/master/) para explorar el repositorio usando `nbviewer`. 