In [16]:
#Splits text in chunks
def split_text(text, chunk_size, max_line_length=100):
    """
    Splits a given text into paragraphs or, if lines are too long,
    into chunks of at most the specified size.

    Args:
        text (str): The input text.
        chunk_size (int): The desired size of each chunk (in characters).
        max_line_length (int): Maximum length of a single line (default: 100).

    Returns:
        list: A list of text chunks (paragraphs or line chunks).
    """
    if chunk_size <= 0:
        raise ValueError("Chunk size must be a positive integer.")

    # Initialize an empty list to store the text chunks
    text_chunks = []

    # Split the text into paragraphs (based on empty lines)
    paragraphs = text.split("\n\n")

    for paragraph in paragraphs:
        # Split each paragraph into lines
        lines = paragraph.split("\n")

        # Initialize a buffer for the current chunk
        current_chunk = ""

        for line in lines:
            # If the line is too long, split it into chunks
            if len(line) > max_line_length:
                for i in range(0, len(line), max_line_length):
                    chunk = line[i:i + max_line_length]
                    current_chunk += chunk + "\n"
                    if len(current_chunk) >= chunk_size:
                        text_chunks.append(current_chunk.strip())
                        current_chunk = ""
            else:
                # Add the line to the current chunk
                current_chunk += line + "\n"

            # Check if the current chunk size exceeds the desired chunk size
            if len(current_chunk) >= chunk_size:
                text_chunks.append(current_chunk.strip())
                current_chunk = ""

        # Add any remaining content in the current chunk
        if current_chunk:
            text_chunks.append(current_chunk.strip())

    return text_chunks

Chunk 1:
Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Chunk 2:
Sed ut perspiciatis unde omnis iste natus error sit voluptatem accusantium doloremque laudantium

Chunk 3:
,
    totam rem aperiam, eaque ipsa quae ab illo inventore veritatis et quasi architecto beatae vitae

Chunk 4:
dicta sunt explicabo.



In [14]:
## This method should call GPT, prompt it and return the rewritten text

import PromptTemplates.prompts as Prompts
from OpenInterface.api_calls import generate_response

def rewrite(text):
    prompt = Prompts.generateRewrittenText(text)

    return generate_response(prompt)

def combine_texts(text1):
    # Call the rewrite method on text2
    rewritten_text = rewrite(text1)

    # Join text1 and rewritten_text2
    combined_text = f"{text1}\n{rewritten_text}\n-------------\n"

    return combined_text

In [15]:
## Loads txt files from scriveno_input

import os

def process_text_from_folder(folder_path):
    # List all files in the folder
    for filename in os.listdir(folder_path):
        # Check if the file is a text file (ends with .txt)
        if filename.lower().endswith(".txt"):
            file_path = os.path.join(folder_path, filename)
            try:
                # Read the content of the text file
                with open(file_path, "r") as file:
                    # Initialize an empty list to store the text content
                    text_content = []
                    text = file.read()
                    chunks = split_text(text, 2000)
                    for chunk in chunks:
                        rewritten = combine_texts(chunk)
                        text_content.append(rewritten)
                        print(f"Text content: {text_content}")
                    
                    # Write the content back to the same file
                    with open(file_path, "w") as file:
                        file.write("\n".join(text_content))

                    # Print a success message
                    print(f"Text content saved back to {file_path}")
                    
            except Exception as e:
                print(f"Error reading file {filename}: {str(e)}")

# Specify the folder path
folder_path = "scriveno_input/Draft"

# Call the function to process text from all txt files in the folder
process_text_from_folder(folder_path)


Text content: ['As festas de carnaval\nO carnaval é uma festa brasileira muito conhecida em todo o mundo. Nela, as pessoas se fantasiam de diversas formas.\n\nQuem vai a esse tipo de comemoração é chamado de folião e costuma se divertir muito ao longo de todo o evento.\n\nAlém de fantasias, a festa possui sempre algum tipo de música que é tocada em volume muito alto, para que muitas pessoas possam ouvi-la. Na região nordeste do Brasil, as músicas mais tocadas durante o carnaval são aquelas consideradas do estilo “Axé”. Na região sudeste, o “funk” é o principal ritmo presente na comemoração.\n\nHá também os desfiles de escolas de samba, que reúnem uma grande quantidade de pessoas para que sejam realizados todos os anos. Artistas famosos e outras celebridades costumam desfilar em carros dessas escolas de samba.\n\nO carnaval é um evento que atrai muitos turistas estrangeiros para o país. Diversos trabalhadores também conseguem lucrar com a venda de produtos nessa época do ano.\n\nEm cida