In [1]:
from Router import Router

In [2]:
from DocAgent import DocAgent

In [13]:
import PyPDF2

def pdf_to_text_save_PyPDF2(filename):
    with open(filename, 'rb') as file:
        reader = PyPDF2.PdfReader(file)
        text = ""
        for page in reader.pages:
            if page.extract_text() is not None:
                text += page.extract_text()
    
    # Create a new filename for the text file
    new_filename = filename.rsplit('.', 1)[0] + '.txt'
    
    # Save the text to a new file
    with open(new_filename, 'w', encoding='utf-8') as text_file:
        text_file.write(text)
    
    
    print(f"Text has been saved to {new_filename}")
    return text,new_filename


In [14]:
import os

def convert_files_to_txt(source_folder_path, output_base_folder):
    print(f"Converting files from {source_folder_path} to {output_base_folder}")
    
    # Ensure the output base folder exists
    os.makedirs(output_base_folder, exist_ok=True)
    
    # Initialize a dictionary to hold filename and content
    files_content = {}

    # Walking through the source folder and its subfolders
    for root, dirs, files in os.walk(source_folder_path):
        for file in files:
            # Construct the path to the original file
            original_file_path = os.path.join(root, file)
            
            # Construct the relative path of the file from the source folder
            relative_path = os.path.relpath(original_file_path, source_folder_path)
            
            # Define the new file name with .txt extension and construct the new file path
            new_file_name = os.path.splitext(relative_path)[0] + '.txt'
            new_file_path = os.path.join(output_base_folder, new_file_name)
            
            # Ensure the directory for the new file exists
            os.makedirs(os.path.dirname(new_file_path), exist_ok=True)
            
            try:
                # Read the original file
                text,filename = pdf_to_text_save_PyPDF2(original_file_path)
                files_content[filename] = text
                    
            except Exception as e:
                print(f"Error processing file {original_file_path}: {e}")

    # Return the dictionary containing filename and content
    return files_content

# Specify the path of your submodule or source folder
source_folder_path = '/Users/inaki/Documents/Personal/Daat/4Leegal2.0/files'

# Specify the path of the folder where you want to store the .txt files
output_base_folder = './'

docs=convert_files_to_txt(source_folder_path, output_base_folder)


Converting files from /Users/inaki/Documents/Personal/Daat/4Leegal2.0/files to ./
Text has been saved to /Users/inaki/Documents/Personal/Daat/4Leegal2.0/files/LFDA.txt
Text has been saved to /Users/inaki/Documents/Personal/Daat/4Leegal2.0/files/Reg_LIERNIE_170816.txt
Text has been saved to /Users/inaki/Documents/Personal/Daat/4Leegal2.0/files/LCM.txt
Text has been saved to /Users/inaki/Documents/Personal/Daat/4Leegal2.0/files/LFPIORPI_200521.txt
Text has been saved to /Users/inaki/Documents/Personal/Daat/4Leegal2.0/files/LMV.txt
Text has been saved to /Users/inaki/Documents/Personal/Daat/4Leegal2.0/files/Reg_LPI_161216.txt
Text has been saved to /Users/inaki/Documents/Personal/Daat/4Leegal2.0/files/LFPPI.txt
Text has been saved to /Users/inaki/Documents/Personal/Daat/4Leegal2.0/files/CCom.txt
Text has been saved to /Users/inaki/Documents/Personal/Daat/4Leegal2.0/files/Disposiciones aplicables a las instituciones de fondos de pago electrónico a que se refieren los artículos 48, segund

In [15]:
import os

def split_and_save_file(content, new_base_path, base_name, max_tokens=30000):
    """
    Splits the content into chunks with a maximum number of tokens and saves them into separate files.
    
    Parameters:
    - content (str): The content to be split.
    - new_base_path (str): The folder where files should be saved.
    - base_name (str): The base filename for the output files.
    - max_tokens (int): The maximum number of tokens allowed per file.
    """
    words = content.split()
    if len(words) <= max_tokens:
        # If the content doesn't need to be split, save it directly.
        filename = f"{base_name}.txt"
        file_path = os.path.join(new_base_path, filename)
        with open(file_path, 'w', encoding='utf-8') as file:
            file.write(content)
            print(f"Saved {filename} without splitting.")
    else:
        # If the content exceeds the max_tokens, split and save in multiple files.
        for i in range(0, len(words), max_tokens):
            chunk = ' '.join(words[i:i + max_tokens])
            filename = f"{base_name}_{i // max_tokens + 1}.txt"
            file_path = os.path.join(new_base_path, filename)
            with open(file_path, 'w', encoding='utf-8') as file:
                file.write(chunk)
                print(f"Saved {filename}")

def read_and_split_txt_files(folder_path, new_folder_path, max_tokens=30000):
    """
    Reads all .txt files in the specified folder, splits them if they exceed max_tokens,
    and stores their contents in separate files with suffixes _1, _2, etc., in a new directory.

    Parameters:
    - folder_path (str): The path to the folder containing the .txt files.
    - new_folder_path (str): The path to the folder where processed files will be saved.
    - max_tokens (int): The maximum number of tokens a file can contain before being split.
    """
    # Ensure the new directory exists
    os.makedirs(new_folder_path, exist_ok=True)
    
    for filename in os.listdir(folder_path):
        if filename.endswith(".txt"):
            file_path = os.path.join(folder_path, filename)
            try:
                with open(file_path, 'r', encoding='utf-8') as file:
                    content = file.read()
                    base_name = filename.rsplit('.txt', 1)[0]
                    split_and_save_file(content, new_folder_path, base_name, max_tokens)
            except UnicodeDecodeError:
                print(f"Error decoding {filename}. It may not be encoded in UTF-8.")
            except Exception as e:
                print(f"Failed to read {filename}: {e}")

# Usage example
source_folder_path = './files'
destination_folder_path = './files_processed'
read_and_split_txt_files(source_folder_path, destination_folder_path)


Saved Disposiciones aplicables a las instituciones de fondos de pago electrónico a que se refieren los artículos 48, segundo párrafo; 54, primer párrafo y 56, primer.txt without splitting.
Saved Reg_LFPDPPP.txt without splitting.
Saved CCom_1.txt
Saved CCom_2.txt
Saved CCom_3.txt
Saved CCom_4.txt
Saved CCF_1.txt
Saved CCF_2.txt
Saved CCF_3.txt
Saved CCF_4.txt
Saved CCF_5.txt
Saved CCF_6.txt
Saved LGSM.txt without splitting.
Saved LCM_1.txt
Saved LCM_2.txt
Saved LFDA_1.txt
Saved LFDA_2.txt
Saved Reg_LIERNIE_170816.txt without splitting.
Saved LMV_1.txt
Saved LMV_2.txt
Saved LMV_3.txt
Saved LMV_4.txt
Saved LMV_5.txt
Saved Reg_LPI_161216.txt without splitting.
Saved LFPPI_1.txt
Saved LFPPI_2.txt
Saved LFPIORPI_200521.txt without splitting.
Saved 143_190118.txt without splitting.
Saved Reg_LFPIORPI.txt without splitting.
Saved LFPDPPP.txt without splitting.
Saved Ley para Regular las Instituciones de Tecnología Financiera_1.txt
Saved Ley para Regular las Instituciones de Tecnología F

In [16]:
import os

def read_txt_files(folder_path):
    """
    Reads all .txt files in the specified folder and stores their contents in a dictionary.

    Parameters:
    - folder_path (str): The path to the folder containing the .txt files.

    Returns:
    - dict: A dictionary where keys are filenames and values are the contents of the files.
    """
    files_content = {}
    for filename in os.listdir(folder_path):
        if filename.endswith(".txt"):
            file_path = os.path.join(folder_path, filename)
            try:
                with open(file_path, 'r', encoding='utf-8') as file:
                    files_content[filename] = file.read()
            except UnicodeDecodeError:
                print(f"Error decoding {filename}. It may not be encoded in UTF-8.")
            except Exception as e:
                print(f"Failed to read {filename}: {e}")
    return files_content

# Usage example
folder_path = './files_processed'
files_content_dict = read_txt_files(folder_path)
print(files_content_dict)


{'Disposiciones aplicables a las instituciones de fondos de pago electrónico a que se refieren los artículos 48, segundo párrafo; 54, primer párrafo y 56, primer.txt': ' \n \n \nDISPOSICIONES APLICABLES A LAS INSTITUCIONES DE FONDOS DE PAGO \nELECTRÓNICO A QUE SE REFIEREN LOS ARTÍCULOS 48, SEGUNDO \nPÁRRAFO; 54, PRIMER PÁRRAFO, Y 56, PRIMER Y SEGUNDO PÁRRAFOS \nDE LA LEY PARA REGULAR LAS INSTITUCIONES DE TECNOLOGÍA \nFINANCIERA  \n \n \n \nPublic adas en el Diario Oficial de la \nFederación el 28 de enero de 2021.  \n   \n \n \nQue, en atención al artículo 78 de la Ley General de Mejora Regulatoria y con la finalidad de reducir el \ncosto de cumplimiento de las presentes disposiciones, la Comisión Nacional Bancar ia y de Valores, \nmediante resolución publicada en el Diario Oficial de la Federación el 26 de diciembre de 2017, modificó \nlas Disposiciones de carácter general aplicables a las instituciones de crédito, para flexibilizar el plazo al \nque estaban sujetas las  instituci

In [11]:
import os

def split_and_save_file(content, new_base_path, base_name, max_tokens=60000):
    """
    Splits the content into chunks with a maximum number of tokens and saves them into separate files.
    
    Parameters:
    - content (str): The content to be split.
    - new_base_path (str): The folder where files should be saved.
    - base_name (str): The base filename for the output files.
    - max_tokens (int): The maximum number of tokens allowed per file.
    """
    words = content.split()
    if len(words) <= max_tokens:
        # If the content doesn't need to be split, save it directly.
        filename = f"{base_name}.txt"
        file_path = os.path.join(new_base_path, filename)
        with open(file_path, 'w', encoding='utf-8') as file:
            file.write(content)
            print(f"Saved {filename} without splitting.")
    else:
        # If the content exceeds the max_tokens, split and save in multiple files.
        for i in range(0, len(words), max_tokens):
            chunk = ' '.join(words[i:i + max_tokens])
            filename = f"{base_name}_{i // max_tokens + 1}.txt"
            file_path = os.path.join(new_base_path, filename)
            with open(file_path, 'w', encoding='utf-8') as file:
                file.write(chunk)
                print(f"Saved {filename}")

def read_and_split_txt_files(folder_path, new_folder_path, max_tokens=60000):
    """
    Reads all .txt files in the specified folder, splits them if they exceed max_tokens,
    and stores their contents in separate files with suffixes _1, _2, etc., in a new directory.

    Parameters:
    - folder_path (str): The path to the folder containing the .txt files.
    - new_folder_path (str): The path to the folder where processed files will be saved.
    - max_tokens (int): The maximum number of tokens a file can contain before being split.
    """
    # Ensure the new directory exists
    os.makedirs(new_folder_path, exist_ok=True)
    
    for filename in os.listdir(folder_path):
        if filename.endswith(".txt"):
            file_path = os.path.join(folder_path, filename)
            try:
                with open(file_path, 'r', encoding='utf-8') as file:
                    content = file.read()
                    base_name = filename.rsplit('.txt', 1)[0]
                    split_and_save_file(content, new_folder_path, base_name, max_tokens)
            except UnicodeDecodeError:
                print(f"Error decoding {filename}. It may not be encoded in UTF-8.")
            except Exception as e:
                print(f"Failed to read {filename}: {e}")

# Usage example
source_folder_path = './files'
destination_folder_path = './files_processed'
read_and_split_txt_files(source_folder_path, destination_folder_path)


In [17]:
docs=files_content_dict

In [18]:
docs.keys()

dict_keys(['Disposiciones aplicables a las instituciones de fondos de pago electrónico a que se refieren los artículos 48, segundo párrafo; 54, primer párrafo y 56, primer.txt', '3a. Resolución modificatoria Fintech_1.txt', 'Reg_LFPDPPP.txt', '3a. Resolución modificatoria Fintech_2.txt', '3a. Resolución modificatoria Fintech_3.txt', '3a. Resolución modificatoria Fintech_4.txt', 'LGSM.txt', 'CCF_6.txt', 'LCM.txt', 'LCM_2.txt', 'CCF_2_1.txt', 'LMV_5.txt', 'CCF_5.txt', 'CCF_4.txt', 'LFDA.txt', 'LMV_4.txt', 'LCM_1.txt', 'CCF_2_2.txt', 'Reg_LIERNIE_170816.txt', 'Reg_LPI_161216.txt', '145_220618_2.txt', 'CCF_1.txt', '145_220618_3.txt', 'LFPPI.txt', 'Ley para Regular las Instituciones de Tecnología Financiera_2.txt', 'LMV_1.txt', 'LMV_3.txt', '145_220618_1.txt', 'LFPIORPI_200521.txt', 'CCF_3.txt', 'CCF_2.txt', 'Ley para Regular las Instituciones de Tecnología Financiera_1.txt', 'LMV_2.txt', 'LFI_2.txt', '143_190118.txt', 'LFI_3.txt', 'Reg_LFPIORPI.txt', 'LFI_1.txt', 'LFPDPPP.txt', '

In [19]:
docagents={}
for  title in docs.keys():
    docagents[title]=DocAgent(docs[title])

    

## elimina mayusuculas
## eliminar guiones y caracteres especiales
## paginas

In [None]:
import pickle


In [None]:
filename = 'docagents_1.pkl'

# Open the file in binary write mode and pickle the dictionary
with open(filename, 'wb') as file:
    pickle.dump(docagents, file)

In [4]:
docagents= pickle.load(open('docagents_1.pkl', 'rb'))

In [15]:
router=Router(docagents)

In [16]:
print(router.ask("Cómo se constituye una SAPI?"))

Para constituir una Sociedad Anónima Promotora de Inversión (SAPI) en México, es necesario seguir un proceso legal que se encuentra delineado en la Ley General de Sociedades Mercantiles (LGSM), complementado por interpretaciones jurídicas y reformas subsecuentes, debido a que las SAPI son una figura corporativa relativamente reciente y no se encuentran detalladas específicamente en la LGSM original. A continuación, se describe un resumen de los pasos fundamentales a seguir:

1. **Elaboración del acta constitutiva:** Este documento es esencial, ya que define los aspectos fundamentales de la sociedad como su nombre, objeto social, duración, domicilio, capital social, división de acciones, administración, y órganos de vigilancia. La elaboración de este documento generalmente requiere la asistencia de un abogado o notario público para asegurar que cumpla con todos los requisitos legales y prácticos.

2. **Inscripción en el Registro Público de Comercio (RPC):** Después de tener el acta cons

In [17]:
print(router.ask("Cual es el minimo capital para constituir una S.C."))

Para determinar el capital mínimo necesario para constituir una Sociedad Civil (S.C.), es importante reconocer que las regulaciones pueden variar significativamente según la jurisdicción en la que se desee establecer dicha sociedad. En el contexto de México, el Código Civil Federal y los códigos civiles de cada estado son las fuentes legislativas que rigen la constitución de Sociedades Civiles, puesto que el país opera bajo un sistema federal en el cual cada estado tiene la capacidad de establecer sus propias normativas en ciertas materias, incluyendo las referentes a las sociedades civiles. Tradicionalmente, bajo la ley mexicana, no se especifica un capital mínimo para la constitución de una Sociedad Civil, ya que estas se conciben como un contrato por el cual dos o más personas convienen en aportar algo en común (bienes, dinero o esfuerzo) con el fin de repartir los beneficios obtenidos.

Por otro lado, en España, las Sociedades Civiles privadas reguladas por el Código Civil tampoco 

In [18]:
print(router.ask("Como se cancela la inscripción de valores en el Registro Nacional de valores?"))

Para cancelar la inscripción de valores en el Registro Nacional de Valores, los procedimientos y requisitos específicos varían según la jurisdicción; sin embargo, se pueden identificar pasos generales basados en prácticas comunes en diversas legislaciones, incluyendo México como ejemplo concreto donde este proceso está regulado por la Ley del Mercado de Valores.

1. **Solicitud de Cancelación:** El emisor de los valores o su representante legal debe presentar una solicitud formal de cancelación ante la autoridad reguladora competente del mercado de valores en su jurisdicción, que podría ser la Comisión Nacional Bancaria y de Valores (CNBV) en México. Dicha solicitud debe justificar la razón de la cancelación, e incluir toda la documentación y requisitos exigidos por la legislación correspondiente.

2. **Cumplimiento de Condiciones y Requisitos:** Es necesario asegurar el cumplimiento de determinadas condiciones previas para la aprobación de la cancelación, como la notificación adecuada

In [20]:
print(router.ask("que dice el articulo 6 de la ley de inversión extranjera en méxico?"))

De acuerdo a las respuestas proporcionadas y con base en mis conocimientos hasta la última actualización en 2023, el Artículo 6 de la Ley de Inversión Extranjera en México establece directrices específicas relacionadas con la participación de inversores extranjeros en sociedades mexicanas, principalmente a través de tres puntos clave:

1. Las sociedades mexicanas con cláusula de exclusión de extranjeros no admitirán inversionistas extranjeros como socios o accionistas, ni permitirán que estos formen parte de los órganos de administración, dirección o vigilancia.

2. Estas sociedades no inscribirán en el libro de registro de acciones la transmisión de acciones o partes sociales a favor de inversionistas extranjeros, ni la constitución de derechos sobre dichas acciones o partes a favor de estos.

3. Incluirán en sus estatutos sociales una cláusula que establezca que en caso de que el Gobierno Federal pretenda expropiar o intervenir la empresa, esta deberá ser vendida previamente a mexica