# FAST Version of the RAG-pipeline
* Please run this code to start the pipeline
* After that copy and paste the path of the document you would like to correct

## Try this version without saving any files

In [18]:
from docx import Document
from llama_index.core import StorageContext, load_index_from_storage, Settings
from llama_index.llms.openai import OpenAI
import openai
from dotenv import load_dotenv
import os

def correct_document(file_path):
    # Setup
    load_dotenv()
    openai.api_key = os.getenv('OPENAI_API_KEY')
    Settings.llm = OpenAI(model="gpt-4", temperature=0.3)
    
    # Read document
    doc = Document(file_path)
    text = "\n".join(paragraph.text for paragraph in doc.paragraphs)
    
    # Load index and create query engine
    index = load_index_from_storage(StorageContext.from_defaults(persist_dir="./RAG_index"))
    
    # Process correction
    correction_prompt = f"""
    Correct the mistakes of the provided text. The text was written by a student. The student should have a language level A2-B1 according
    to Common European Framework of Reference for Languages: Learning, Teaching, Assessment CEFRL. Correct the mistakes and provide the adequate solutions.
    Don't change the original input text. Add only the version with the corrections to your answer. Only use this structure to correct the text:

    Example 1: "Yo te llama José."
    Corrected example 1: "Yo te llama José. (Yo me llamo José.)"
    Example 2: "Las coches es caros."
    Corrected example 2: "Las coches es caros. (Los coches son caros.)"
    Example 3: "Hola María, yo te llama José."
    Corrected example 3: "Hola María, yo te llama José. (Hola María, me llamo José.) Me gusta los caballo. (Me gustan los caballos.)"

    Please correct this text and provide one sentence objective and simple with feedback and which grammar topics the student should improve.
    The feedback and explanations have to be in german.
    Feedback structure:
    "Feedback: [insert feedback sentence here]
    An diesem Grammatikthema/diesen Grammatikthemen solltest du noch arbeiten: [insert grammar topics here]
    Beurteilungsraster A2:
    - Erfüllung der Aufgabenstellung (EA): [insert chosen descriptions]
    - Aufbau und Layout (AL): [insert chosen descriptions]
    - Spektrum Sprachlicher Mittel (SSM): [insert chosen descriptions]
    - Sprachrichtigkeit (SR): [insert chosen descriptions]"

    Text to correct: {text}
    """
    
    return index.as_query_engine().query(correction_prompt)

# Usage
print(correct_document('./data/correo electronico.docx'))

Correo electronico 

De: adrian123@gmail.com
Para: padres123@gmail.com
Fecha: 12 de novembre de 2024 (Fecha: 12 de noviembre de 2024)
Asunto: me ciudad favorita (Asunto: mi ciudad favorita)

Queridos padres,

Estoy en mi ciuadad favorita, Barcelona. (Estoy en mi ciudad favorita, Barcelona.) La ciudad es muy bonita y hay mucha gente viviendo aquí. Además, hace mucho calor aquí en Barcelona.

Hoy he visto la ciudad. Para el almuerzo probe tapas en un pequeno restaurante local. (Para el almuerzo probé tapas en un pequeño restaurante local.) ! Fue delicioso! (¡Fue delicioso!) Me gusta de la playa y comer. (Me gusta la playa y comer.) Luego pasee por el parque y pasee por la playa de la noche. (Luego paseé por el parque y paseé por la playa por la noche.) Mas tarde me relaje en la playa de la Barcelona. (Más tarde me relajé en la playa de Barcelona.)

Manana tengo planes emocionantes. (Mañana tengo planes emocionantes.) Quiero visitar muchos mercados y restaurantes para probar mas comida ti

## Correction without saving

In [3]:
response = correct_document('./data/correo electronico.docx')
print(response)

Correo electronico 

De: adrian123@gmail.com
Para: padres123@gmail.com
Fecha: 12 de novembre de 2024. (Fecha: 12 de noviembre de 2024.)
Asunto: me ciudad favorita. (Asunto: mi ciudad favorita.)

Queridos padres,

Estoy en mi ciuadad favorita, Barcelona. (Estoy en mi ciudad favorita, Barcelona.) La ciudad es muy bonita y hay mucha gente viviendo aquí. Además, hace mucho calor aquí en Barcelona.

Hoy he visto la ciudad. Para el almuerzo probe tapas en un pequeno restaurante local. (Para el almuerzo probé tapas en un pequeño restaurante local.) ! Fue delicioso! (¡Fue delicioso!) Me gusta de la playa y comer. (Me gusta la playa y comer.) Luego pasee por el parque y pasee por la playa de la noche. (Luego paseé por el parque y paseé por la playa en la noche.) Mas tarde me relaje en la playa de la Barcelona. (Más tarde me relajé en la playa de Barcelona.)

Manana tengo planes emocionantes. (Mañana tengo planes emocionantes.) Quiero visitar muchos mercados y restaurantes para probar mas comida

## Correction of text + word-document 
* Please run this code to start the pipeline
* After that copy and paste the path of the document you would like to correct
* It will be saved to `.corrected_texts` -folder
### Install the package if not already available

In [46]:
!pip install python-docx



In [28]:
from docx import Document
from llama_index.core import StorageContext, load_index_from_storage, Settings
from llama_index.llms.openai import OpenAI
import openai
from dotenv import load_dotenv
import os
from datetime import datetime
from docx.shared import Pt
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
import pathlib

def correct_document(file_path):
    # Setup
    load_dotenv()
    openai.api_key = os.getenv('OPENAI_API_KEY')
    Settings.llm = OpenAI(model="gpt-4", temperature=0.3)
    
    # Create output directory if it doesn't exist
    output_dir = pathlib.Path('./corrected_texts')
    output_dir.mkdir(exist_ok=True)
    
    # Read document
    doc = Document(file_path)
    text = "\n".join(paragraph.text for paragraph in doc.paragraphs)
    
    # Load index and create query engine
    index = load_index_from_storage(StorageContext.from_defaults(persist_dir="./RAG_index"))
    
    # Process correction
    correction_prompt = f"""
    Correct the mistakes of the provided text. The text was written by a student. The student should have a language level A2-B1 according
    to Common European Framework of Reference for Languages: Learning, Teaching, Assessment CEFRL. Correct the mistakes and provide the adequate solutions.
    Don't change the original input text. Only use this structure to correct the text:

    Example 1: "Yo te llama José."
    Corrected example 1: "Yo te llama José. (Yo me llamo José.)"
    Example 2: "Las coches es caros."
    Corrected example 2: "Las coches es caros. (Los coches son caros.)"
    Example 3: "Hola María, yo te llama José."
    Corrected example 3: "Hola María, yo te llama José. (Hola María, me llamo José.) Me gusta los caballo. (Me gustan los caballos.)"

    Please correct this text and provide one sentence objective and simple with feedback and which grammar topics the student should improve.
    The feedback and explanations have to be in german.
    
    Feedback structure:
    "Feedback*: [insert feedback sentence here]
    
    An diesem Grammatikthema/diesen Grammatikthemen solltest du noch arbeiten: [insert grammar topics here]
    \n
    Diesem Niveau würde der Text entstprechen [use your knowledge to chose a level according to Common European Framework of Reference for Languages: Learning, Teaching, Assessment CEFRL]
    \n
    Kriterien des Beurteilungsrasters:
    - Erfüllung der Aufgabenstellung (EA): [insert chosen descriptions]
    - Aufbau und Layout (AL): [insert chosen descriptions]
    - Spektrum Sprachlicher Mittel (SSM): [insert chosen descriptions]
    - Sprachrichtigkeit (SR): [insert chosen descriptions]"

    Text to correct: {text}
    """
    
    response = index.as_query_engine().query(correction_prompt)
    
    # Generate timestamp for unique filenames
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
    original_filename = pathlib.Path(file_path).stem
    
    # Create Word document
    doc_output = Document()
    
    # Add title
    title = doc_output.add_heading('Texto corregido', 0)
    title.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER
    
    # Add correction and feedback
    doc_output.add_heading('Corrección y feedback:', level=1)
    doc_output.add_paragraph(str(response))
    
    # Save as Word document
    docx_path = output_dir / f'{original_filename}_corrected_{timestamp}.docx'
    doc_output.save(docx_path)
    
    print(f"Correction saved to:\n- {docx_path}\n")
    return response

# Usage
if __name__ == "__main__":
    response = correct_document('./data/correo electronico.docx')
    print("\nCorrection Result:")
    print(response)


Correction saved to:
- corrected_texts\correo electronico_corrected_20250126_141832.docx


Correction Result:
"Correo electronico 

De: adrian123@gmail.com
Para: padres123@gmail.com
Fecha: 12 de novembre de 2024. (Fecha: 12 de noviembre de 2024.)
Asunto: me ciudad favorita. (Asunto: mi ciudad favorita.)

Queridos padres,

Estoy en mi ciuadad favorita, Barcelona. (Estoy en mi ciudad favorita, Barcelona.) La ciudad es muy bonita y hay mucha gente viviendo aquí. Además, hace mucho calor aquí en Barcelona.

Hoy he visto la ciudad. Para el almuerzo probe tapas en un pequeno restaurante local. (Para el almuerzo probé tapas en un pequeño restaurante local.) ! Fue delicioso! (¡Fue delicioso!) Me gusta de la playa y comer. (Me gusta la playa y comer.) Luego pasee por el parque y pasee por la playa de la noche. (Luego paseé por el parque y paseé por la playa de noche.) Mas tarde me relaje en la playa de la Barcelona. (Más tarde me relajé en la playa de Barcelona.)

Manana tengo planes emocionant

## SUPER FAST VERSION
* First you have to run the RAG-pipeline cell once.
* Change the path to correct a different text.
* It will be saved to `.corrected_texts` -folder

In [30]:
response = correct_document('./data/correo electronico.docx')

Correction saved to:
- corrected_texts\correo electronico_corrected_20250126_141934.docx



In [35]:
response = correct_document('./data/SP blog comment.docx')

Correction saved to:
- corrected_texts\SP blog comment_corrected_20250126_142548.docx



## Creating exercises

In [None]:
#Add exercises to docx-file --> mistakes of the student
