In [None]:
import pandas as pd

data = {
    'Proyecto': ['Proyecto A ETAPA 1', 'Proyecto A ETAPA 2', 'Proyecto B ETAPA 1', 'Proyecto B ETAPA 2', 'Proyecto C'],
    'Dependencias': ['None', 'Proyecto A ETAPA 1', 'Proyecto A ETAPA 2', 'Proyecto B ETAPA 1, Proyecto C', 'None']
}

df = pd.DataFrame(data)

def seleccionar_proyectos(df):
    proyectos_disponibles = []
    proyectos_seleccionados = set() 
    for index, row in df.iterrows():
        proyecto = row['Proyecto']
        dependencias = row['Dependencias']
        if dependencias == 'None':
            proyectos_disponibles.append(proyecto)
        else:
            dependencias = [dep.strip() for dep in dependencias.split(',')]
            if all(dep in proyectos_seleccionados for dep in dependencias):
                proyectos_disponibles.append(proyecto)
        proyectos_seleccionados.add(proyecto)

    return proyectos_disponibles

proyectos_disponibles = seleccionar_proyectos(df)
print("Proyectos disponibles para seleccionar:", proyectos_disponibles)

In [None]:
import pandas as pd

data = {
    'Proyecto': ['Proyecto A ETAPA 1', 'Proyecto A ETAPA 2', 'Proyecto B ETAPA 1', 'Proyecto B ETAPA 2', 'Proyecto C'],
    'Dependencias': ['', 'Proyecto A ETAPA 1', 'Proyecto A ETAPA 2', 'Proyecto B ETAPA 1, Proyecto C', ''],
    'Excluyentes': ['Proyecto A ETAPA 2', '', '', '', 'Proyecto A ETAPA 1, Proyecto A ETAPA 2']
}

df = pd.DataFrame(data)
df.head()


In [None]:
def seleccionar_proyectos(df):
    proyectos_disponibles = []
    proyectos_seleccionados = set()
    proyectos_excluyentes = set()
    for index, row in df.iterrows():
        proyecto = row['Proyecto']
        dependencias = row['Dependencias']
        excluyentes = row['Excluyentes']
        if dependencias == '' and not any(dep in proyectos_excluyentes for dep in [proyecto]):
            proyectos_disponibles.append(proyecto)
        else:
            dependencias = [dep.strip() for dep in dependencias.split(',')]
            if all(dep in proyectos_seleccionados for dep in dependencias) and not any(dep in proyectos_excluyentes for dep in [proyecto]):
                proyectos_disponibles.append(proyecto)
        proyectos_seleccionados.add(proyecto)
        excluyentes = [ex.strip() for ex in excluyentes.split(',')]
        proyectos_excluyentes.update(excluyentes)
    return proyectos_disponibles

proyectos_disponibles = seleccionar_proyectos(df)
print("Proyectos disponibles para seleccionar:", proyectos_disponibles)

Este código de Python utiliza la biblioteca Pandas para manejar datos tabulares y realiza una selección de proyectos basada en ciertas condiciones de dependencia y exclusión.

Aquí tienes una explicación paso a paso:

1. Se importa la biblioteca Pandas y se le asigna el alias 'pd'.

2. Se define un diccionario llamado 'data' que contiene tres claves: 'Proyecto', 'Dependencias' y 'Excluyentes'. Cada clave tiene como valor una lista que contiene información relacionada con los proyectos, sus dependencias y sus proyectos excluyentes.

3. Se crea un DataFrame de Pandas llamado 'df' a partir del diccionario 'data'.

4. Se define una función llamada 'seleccionar_proyectos' que toma como argumento un DataFrame de Pandas.

5. Se inicializan dos conjuntos vacíos: 'proyectos_seleccionados' para almacenar los proyectos seleccionados y 'proyectos_excluyentes' para almacenar los proyectos excluyentes.

6. Se itera sobre cada fila del DataFrame utilizando el método 'iterrows()', que devuelve un índice y una serie para cada fila.

7. Se extraen los valores de las columnas 'Proyecto', 'Dependencias' y 'Excluyentes' de la fila actual.

8. Se verifica si no hay dependencias para el proyecto actual y si este proyecto no está excluido por ninguno de los proyectos excluyentes ya seleccionados. Si ambas condiciones son verdaderas, se agrega el proyecto a la lista de 'proyectos_disponibles'.

9. Si hay dependencias para el proyecto actual, se dividen las dependencias por comas y se eliminan los espacios en blanco de cada dependencia. Luego se verifica si todas las dependencias están en el conjunto de 'proyectos_seleccionados' y si el proyecto no está excluido por ninguno de los proyectos excluyentes. Si ambas condiciones son verdaderas, se agrega el proyecto a la lista de 'proyectos_disponibles'.

10. Se agregan el proyecto actual al conjunto 'proyectos_seleccionados'.

11. Se dividen los proyectos excluyentes por comas, se eliminan los espacios en blanco de cada uno y se agregan al conjunto 'proyectos_excluyentes'.

12. Se devuelve la lista de 'proyectos_disponibles' al final de la función.

13. Se llama a la función 'seleccionar_proyectos' pasando el DataFrame 'df' como argumento y se asigna el resultado a la variable 'proyectos_disponibles'.

14. Se imprime la lista de proyectos disponibles para seleccionar.

In [None]:
def select_projects(df):
    """
    Selects projects based on their dependencies and exclusions.

    This function takes a DataFrame containing project information as input and selects projects that can be executed considering their dependencies and exclusions.
    
    :param df: DataFrame containing project information including 'Proyecto' (Project), 'Dependencias' (Dependencies), and 'Excluyentes' (Exclusions).
    :type df: pandas.DataFrame

    :return: List of projects that are available for selection based on their dependencies and exclusions.
    :rtype: list
    """
    available_projects = []
    selected_projects = set()
    exclusive_projects = set()
    for index, row in df.iterrows():
        project = row['Proyecto']
        dependencies = row['Dependencias']
        exclusions = row['Excluyentes']
        if dependencies == '' and not any(dep in exclusive_projects for dep in [project]):
            available_projects.append(project)
        else:
            dependencies = [dep.strip() for dep in dependencies.split(',')]
            if all(dep in selected_projects for dep in dependencies) and not any(dep in exclusive_projects for dep in [project]):
                available_projects.append(project)
        selected_projects.add(project)
        exclusions = [ex.strip() for ex in exclusions.split(',')]
        exclusive_projects.update(exclusions)
    return available_projects


No se quiere que las dependencias y las exclusiones se verifiquen de manera secuencial sino que se verifiquen juntas. Así, se ajusta la lógica para que ambos se verifiquen simultáneamente al determinar la disponibilidad de un proyecto.

In [None]:
import pandas as pd

data = {
    'MATRICULA_DIGITAL': ['Proyecto A ETAPA 1', 'Proyecto A ETAPA 2', 'Proyecto B ETAPA 1', 'Proyecto B ETAPA 2', 'Proyecto C'],
    'DEPENDENCIAS': ['', 'Proyecto A ETAPA 1', 'Proyecto A ETAPA 2', 'Proyecto B ETAPA 1, Proyecto C', ''],
    'EXCLUYENTES': ['', '', '', '', 'Proyecto A ETAPA 1, Proyecto A ETAPA 2']
}

df_1 = pd.DataFrame(data)
df_1.head()

In [None]:
def select_projects_1(df):
    """
    Selects projects based on their dependencies and exclusions.

    This function takes a DataFrame containing project information as input and selects projects that can be executed considering their dependencies and exclusions.
    
    :param df: DataFrame containing project information including 'Proyecto' (Project), 'Dependencias' (Dependencies), and 'Excluyentes' (Exclusions).
    :type df: pandas.DataFrame

    :return: List of projects that are available for selection based on their dependencies and exclusions.
    :rtype: list
    """
    available_projects = []
    selected_projects = set()
    exclusive_projects = set()
    for index, row in df.iterrows():
        project = row['MATRICULA_DIGITAL']
        dependencies = [dep.strip() for dep in row['DEPENDENCIAS'].split(',')]
        if dependencies == ['NA']:
            dependencies = []
        exclusions = [ex.strip() for ex in row['EXCLUYENTES'].split(',')]
        if exclusions == ['NA']:
            exclusions = []
        
        # Check if all dependencies are satisfied and the project is not excluded
        if len(dependencies) + len(exclusions) > 0:
            if all(dep in selected_projects for dep in dependencies) and not any(ex in exclusive_projects for ex in exclusions):
                available_projects.append(project)
        else:
            available_projects.append(project)
        
        # Add the project to selected projects and update exclusions
        selected_projects.add(project)
        exclusive_projects.update(exclusions)
    return available_projects

available_projects = select_projects_1(df_1)
print("Available projects to select:", available_projects)

En esta modificación, se ha combinado la verificación de dependencias y exclusiones en un solo condicional dentro del bucle. Ahora, se verifica si todas las dependencias están satisfechas y si el proyecto no está excluido simultáneamente. Si ambas condiciones se cumplen, el proyecto se agrega a la lista de proyectos disponibles. De lo contrario, se omite. Esto asegura que las dependencias y exclusiones se verifiquen juntas para cada proyecto.

Es por eso que, por lo tanto, en el código las dependencias y exclusiones no están siendo barridas de forma ordenada. La verificación se realiza de manera simultánea para cada proyecto en el bucle.

En el condicional dentro del bucle 'for', se comprueba si todas las dependencias están satisfechas y si el proyecto no está excluido. Si ambas condiciones se cumplen, el proyecto se agrega a la lista de proyectos disponibles. Esto significa que las dependencias y exclusiones se consideran juntas, en lugar de en una secuencia ordenada.

# DataFrame desordenado

In [None]:
# Example DataFrame
import pandas as pd

data = {
    'MATRICULA_DIGITAL': ['Proyecto B ETAPA 2', 'Proyecto A ETAPA 2', 'Proyecto A ETAPA 1', 'Proyecto C', 'Proyecto B ETAPA 1'],
    'DEPENDENCIAS': ['Proyecto B ETAPA 1, Proyecto C', 'Proyecto A ETAPA 1', '', '', 'Proyecto A ETAPA 2'],
    'EXCLUYENTES': ['', '', '', 'Proyecto A ETAPA 1, Proyecto A ETAPA 2', ''],
}

df = pd.DataFrame(data)

In [None]:
df.head()

In [None]:
def select_projects(df):
    available_projects = []
    selected_projects = set()
    exclusive_projects = set()
    
    # Create a dictionary to store dependencies and exclusions for each project
    dependencies_dict = dict(zip(df['MATRICULA_DIGITAL'], df['DEPENDENCIAS'].str.split(', ')))
    exclusions_dict = dict(zip(df['MATRICULA_DIGITAL'], df['EXCLUYENTES'].str.split(', ')))
    
    # Iterate through the projects in any order
    for project in df['MATRICULA_DIGITAL']:
        dependencies = dependencies_dict.get(project, [])
        exclusions = exclusions_dict.get(project, [])
        
        # Check if all dependencies are satisfied and the project is not excluded
        if all(dep in selected_projects for dep in dependencies) and not any(ex in exclusive_projects for ex in exclusions):
            available_projects.append(project)
        
        # Add the project to selected projects and update exclusions
        selected_projects.add(project)
        exclusive_projects.update(exclusions)
    
    return available_projects

In [None]:
available_projects = select_projects(df)
print("Available projects to select:", available_projects)

In [None]:
a = select_projects(df_1)
b = select_projects(df)
print(a)
print(b)

In [None]:
c = select_projects_1(df_1)
d = select_projects_1(df)
print(c)
print(d)

# Aleatorizado

In [17]:
# Example DataFrame
import pandas as pd
import random


data = {
    'MATRICULA_DIGITAL': ['Proyecto B ETAPA 2', 'Proyecto A ETAPA 2', 'Proyecto A ETAPA 1', 'Proyecto C', 'Proyecto B ETAPA 1'],
    'DEPENDENCIAS': ['Proyecto B ETAPA 1, Proyecto C', 'Proyecto A ETAPA 1', '', '', 'Proyecto A ETAPA 2'],
    'EXCLUYENTES': ['', '', '', 'Proyecto A ETAPA 1, Proyecto A ETAPA 2', ''],
}

dataframe = pd.DataFrame(data)

In [18]:
dataframe.head()

Unnamed: 0,MATRICULA_DIGITAL,DEPENDENCIAS,EXCLUYENTES
0,Proyecto B ETAPA 2,"Proyecto B ETAPA 1, Proyecto C",
1,Proyecto A ETAPA 2,Proyecto A ETAPA 1,
2,Proyecto A ETAPA 1,,
3,Proyecto C,,"Proyecto A ETAPA 1, Proyecto A ETAPA 2"
4,Proyecto B ETAPA 1,Proyecto A ETAPA 2,


In [None]:

def select_projects_random(df):
    available_projects = []
    selected_projects = set()
    exclusive_projects = set()
    for index, row in df.iterrows():
        project = row['MATRICULA_DIGITAL']
        dependencies = [dep.strip() for dep in row['DEPENDENCIAS'].split(',')]
        if dependencies == ['NA']:
            dependencies = []
        exclusions = [ex.strip() for ex in row['EXCLUYENTES'].split(',')]
        if exclusions == ['NA']:
            exclusions = []
        
        # Check if all dependencies are satisfied
        if all(dep in selected_projects for dep in dependencies):
            # Check if the project is not excluded by any selected project
            excluded = False
            for ex in exclusions:
                if ex in selected_projects:
                    excluded = True
                    break
            # If not excluded, add the project to available projects
            if not excluded:
                available_projects.append(project)
        
        # Add the project to selected projects and update exclusions
        selected_projects.add(project)
        exclusive_projects.update(exclusions)
        
        # Randomize the order of exclusions for the next iteration
        exclusive_projects_list = list(exclusive_projects)
        random.shuffle(exclusive_projects_list)
        exclusive_projects = set(exclusive_projects_list)
    
    return available_projects

In [19]:
# Versión dos
def select_projects_random(df):
    # Convertimos el DataFrame en una lista de filas y la barajamos
    rows = df.sample(frac=1).iterrows()

    available_projects = []
    selected_projects = set()
    exclusive_projects = set()

    for index, row in rows:
        project = row['MATRICULA_DIGITAL']
        dependencies = [dep.strip() for dep in row['DEPENDENCIAS'].split(',') if dep.strip()]
        exclusions = [ex.strip() for ex in row['EXCLUYENTES'].split(',') if ex.strip()]

        # Comprobamos si todas las dependencias están satisfechas
        if all(dep in selected_projects for dep in dependencies):
            # Comprobamos si el proyecto no está excluido por ningún proyecto seleccionado
            if not any(ex in selected_projects for ex in exclusions):
                available_projects.append(project)

        # Agregamos el proyecto a los proyectos seleccionados y actualizamos las exclusiones
        selected_projects.add(project)
        exclusive_projects.update(exclusions)

    return available_projects


In [20]:
proyectos_disponibles = select_projects_random(dataframe)
print("Available projects to select:", proyectos_disponibles)

Available projects to select: ['Proyecto B ETAPA 1', 'Proyecto B ETAPA 2', 'Proyecto A ETAPA 1']
