In [1]:
import os
import google.generativeai as genai
import os
import json
from dotenv import load_dotenv

In [40]:
def load_gemini_api_key():
    load_dotenv()
    GEMINI_API_KEY = os.getenv("GEMINI_API_KEY")
    if GEMINI_API_KEY is None:
        raise ValueError("GEMINI_API_KEY is not set")
    genai.configure(api_key=GEMINI_API_KEY)

def create_model():
    generation_config = {
        "temperature": 1,
        "top_p": 0.95,
        "top_k": 64,
        "max_output_tokens": 8192,
        "response_mime_type": "text/plain",
    }

    model = genai.GenerativeModel(
        model_name="gemini-1.5-pro",
        # generation_config=generation_config,
        # safety_settings = Adjust safety settings # See https://ai.google.dev/gemini-api/docs/safety-settings
        system_instruction="""
        Eres un experto corrector de texto markdown. Tu misión es corregir ortograficamente texto markdown.

        Enfoque en la corrección: Por favor, revisa el siguiente texto y corrige únicamente los errores ortográficos, sin modificar la estructura, el estilo ni el contenido.
        No hagas cambios del tipo 'Con estos modelos podemos hacer...' a 'Con estos modelos se puede hacer...', tampoco quiero cambios del tipo 'Podemos obtener la longitud de nuestro string mediante la función `len()`' a 'Podemos obtener la longitud de nuestro string mediante la función `len()`.' es decir, no añadas puntos al final de la oración, solo corrige si hay errores de ortografía.

        Te van a pasar textos markdown y tienes que corregirlos ortograficamente en español. Responde solo con la corrección, responde con el texto que hay y la corrección que sugieres.

        El formato de salida tiene que ser un json con llaves llamadas `original`, otra `correccion` y la última será `explicación` con la explicación de qué cambia y por qué. Si no hay errores ortográficos responde ese json con las llaves vacías. Es decir será un json así:
        ```
        {
            "original": "",
            "correccion": "",
            "explicación": ""
        }
        ```

        Recuerda, rellena el json solo con los textos markdown que tienen errores, no pongas en el json los que no tienen errores y no quiero que añadir un punto al final de la oración sea una corrección""",
    )

    return model

def chat_with_gemini(model, input_text):
    try:
        response = model.generate_content(input_text)
    except Exception as e:
        print(f'Error: {e}')
        if str(QUOTA_EXCEEDED_ERROR) in str(e):
            print('Quota exceeded')
            response = QUOTA_EXCEEDED_ERROR
        elif str(INTERNAL_ERROR) in str(e):
            print('Internal error')
            response = INTERNAL_ERROR
        else:
            print('Unknown error')
            response = None
    return response

def get_notebook_content(notebook_path):
    with open(notebook_path, 'r') as f:
        return json.load(f)


In [3]:
load_gemini_api_key()

In [4]:
model = create_model()

In [11]:
# print the current working directory
print(os.getcwd())

# print the contents of the current working directory
print(os.listdir())

parent_directory = os.path.dirname(os.getcwd())
print(parent_directory)

# print the contents of the parent directory
print(os.listdir(parent_directory))

posts_directory = os.path.join(parent_directory, 'posts')
print(posts_directory)

# print the contents of the posts directory
print(os.listdir(posts_directory))

# notebook_path = os.path.join(posts_directory, '2024-08-01-DoLa.ipynb')
notebook_path = os.path.join(posts_directory, '2021-02-11-Introduccion-a-Python.ipynb')
print(notebook_path)

/home/wallabot/Documentos/web/portafolio/preparar_notebook
['get_notebook_metadata.py', 'format_code_blocks.py', '__pycache__', 'corrections_jupyter_notebook.py', '.env', '.environment', 'error_codes.py', '.env.demo', 'utils.py', 'preparar_notebook.py', 'add_htmls_to_astro.sh', 'preprocess_jupyter_notebook.ipynb', 'check_for_new_classes.py', 'corrections', 'preparar_notebook.sh']
/home/wallabot/Documentos/web/portafolio
['posts', 'domotica', 'README.md', 'preparar_notebook', 'paginas', 'tips', 'theme', '.git', '.vscode', 'portfolio', 'images', '.gitignore']
/home/wallabot/Documentos/web/portafolio/posts
['2024-07-20-LoRA.ipynb', '2024-07-29-QLoRA.ipynb', '2024-07-27-GPTQ.ipynb', '2023-12-18-Medida-de-similitud-entre-embeddings.ipynb', '2024-06-04-BPE-tokenizer.ipynb', '2024-XX-XX-Langchain.ipynb', '2021-06-15-Manejo-de-datos-con-Pandas.ipynb', '2024-07-18-Florence-2-fine-tuning.ipynb', '2023-12-06-openai_API.ipynb', 'command-line-cheat-sheet.pdf', '__pycache__', '2024-08-01-DoLa.ipynb'

In [12]:
notebook_content = get_notebook_content(notebook_path)
notebook_content

{'cells': [{'cell_type': 'markdown',
   'metadata': {'id': 'dsaKCKL0IxZl'},
   'source': ['# Introducción a Python']},
  {'cell_type': 'markdown',
   'metadata': {'id': 'Ho_8zgIiI0We'},
   'source': ['## 1. Resumen']},
  {'cell_type': 'markdown',
   'metadata': {'id': 'tT4POPIFNU9M'},
   'source': ['Vamos a hacer una breve introducción a Python, explicando los tipos de datos que tenemos, los operadores, el uso de funciones y de clases. Además veremos cómo usar los objetos iterables, cómo usar módulos, etc.\n',
    '\n',
    '![python](https://raw.githubusercontent.com/maximofn/portafolio/main/portfolio/public/images/icon-python.webp)']},
  {'cell_type': 'markdown',
   'metadata': {'id': 'bVHYziwKQRnG'},
   'source': ['## 2. Tipos de datos de Python']},
  {'cell_type': 'markdown',
   'metadata': {'id': 'y-u-BTORQUwq'},
   'source': ['Existen 7 tipos de datos en Python\n',
    '\n',
    '\n',
    '\n',
    '1. De tipo texto:`str`\n',
    '2. Numéricos:`int`, `float`, `complex`\n',
    '3

In [24]:
cell = notebook_content["cells"][5]["source"][0]
cell

'Podemos obtener el tipo de dato mediante la función `type()`'

In [41]:
gemini_response = chat_with_gemini(model, cell)
print(gemini_response)

response:
GenerateContentResponse(
    done=True,
    iterator=None,
    result=protos.GenerateContentResponse({
      "candidates": [
        {
          "content": {
            "parts": [
              {
                "text": "```json\n{\n    \"original\": \"Podemos obtener el tipo de dato mediante la funci\u00f3n `type()`\",\n    \"correccion\": \"Podemos obtener el tipo de dato mediante la funci\u00f3n `type()`\",\n    \"explicaci\u00f3n\": \"\"\n}\n```"
              }
            ],
            "role": "model"
          },
          "finish_reason": "STOP",
          "index": 0,
          "safety_ratings": [
            {
              "category": "HARM_CATEGORY_SEXUALLY_EXPLICIT",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_HATE_SPEECH",
              "probability": "NEGLIGIBLE"
            },
            {
              "category": "HARM_CATEGORY_HARASSMENT",
              "probability": "NEGLIGIBLE"
       

In [44]:
gemini_response_text = gemini_response.text
print(gemini_response_text)

```json
{
    "original": "Podemos obtener el tipo de dato mediante la función `type()`",
    "correccion": "Podemos obtener el tipo de dato mediante la función `type()`",
    "explicación": ""
}
```


In [24]:
filter_text = gemini_response_text.replace('```json', '').replace('```', '').replace(',"', ',\\"').replace(',\\"\\n"', ',\\"\\n\\"').replace('\\n",', '\\n\\",')
print(filter_text)


{
  "correccion0": {
    "original": "Podemos obtener el tipo de dato mediante la función `type()`",
    "correccion": "Podemos obtener el tipo de dato mediante la función `type()`",
    "explicacion": "Se corrige \"chequear\" por \"comprobar\", ya que \"chequear\" es un anglicismo"
  },
  "correccion1": {
    "original": "Checkear si hay algun string determinado dentro del nuestro",
    "correccion": "Comprobar si hay algún string determinado dentro del nuestro",
    "explicacion": "Se corrige \"chequear\" por \"comprobar\", ya que \"chequear\" es un anglicismo. Se corrige \"algun\" por \"algún\", ya que \"algún\" es la forma correcta cuando se refiere a un elemento indeterminado singular masculino"
  },
  "correccion2": {
    "original": "Los strings tienen ciertos atributos útiles, como poner todo en mayusculas",
    "correccion": "Los strings tienen ciertos atributos útiles, como poner todo en mayúsculas",
    "explicacion": "Se corrige \"mayusculas\" por \"mayúsculas\", ya que \"

In [25]:
gemini_response_json = json.loads(filter_text)
gemini_response_dict = dict(gemini_response_json)
gemini_response_dict.keys()

dict_keys(['correccion0', 'correccion1', 'correccion2', 'correccion3', 'correccion4', 'correccion5', 'correccion6', 'correccion7', 'correccion8', 'correccion9', 'correccion10', 'correccion11', 'correccion12', 'correccion13', 'correccion14', 'correccion15', 'correccion16', 'correccion17', 'correccion18', 'correccion19', 'correccion20', 'correccion21', 'correccion22', 'correccion23', 'correccion24', 'correccion25', 'correccion26', 'correccion27', 'correccion28', 'correccion29', 'correccion30', 'correccion31', 'correccion32', 'correccion33', 'correccion34', 'correccion35', 'correccion36', 'correccion37', 'correccion38', 'correccion39', 'correccion40', 'correccion41', 'correccion42', 'correccion43', 'correccion44'])