In [68]:
import base64
import io
import requests
from requests import Response
from PIL import Image, ImageDraw, ImageFont, ImageFilter
from openai import OpenAI
from pprint import pprint
import google.generativeai as genai
import google.ai.generativelanguage as glm
from dotenv import load_dotenv
import os
import pathlib

load_dotenv()
genai.configure(api_key=os.getenv("GOOGLE", "AIzaSyBAEYpN6quH8b4UbBdxQsz0wRUOEGSFFDk"))



In [25]:
tamaño_trozo = 100

In [26]:
def dividir_imagen(imagen: Image):

    ancho, alto = imagen.size

    if not (ancho % tamaño_trozo == 0 and alto % tamaño_trozo == 0):
        raise ValueError()
    pos_y = 0
    pos_x = 0
    for y in range(0, alto, tamaño_trozo):
        for x in range(0, ancho, tamaño_trozo):
            trozo = imagen.crop((x, y, x + tamaño_trozo, y + tamaño_trozo))
            trozo.save(f"./chunks/{pos_x}-{pos_y}.jpg")
            pos_x = pos_x + 1
        pos_y = pos_y + 1
        pos_x = 0

In [33]:
model = genai.GenerativeModel('gemini-pro-vision')
def clasificar_gemini(image: Image, model=model):

    imagen_bytes = io.BytesIO()
    image.save(imagen_bytes, format='JPEG')
    bytes_de_imagen = imagen_bytes.getvalue()

    response = model.generate_content(
        glm.Content(
            parts = [
                glm.Part(text=r"You are an expert in classifying land uses into categories. Your task is to classify an image into one of four categories: BUILT ZONE, CROP ZONE, WATER, DRY LAND. Your output should be in JSON format as follows: {'category': 'the category of the image'}. Don't forget to take a break before continuing your work"),
                glm.Part(
                    inline_data=glm.Blob(
                        mime_type='image/jpeg',
                        data=bytes_de_imagen
                    )
                ),
            ],
        ),
        stream=True)
    
    response.resolve()
    return response

In [28]:
todo = Image.open("./jilin_rgb_2500x800.jpg")

In [34]:
dividir_imagen(todo)

In [35]:
archivos = os.listdir("./chunks")
archivos = sorted(archivos, key=lambda x: (int(x.replace(".jpg", "").split("-")[0]), int(x.replace(".jpg", "").split("-")[1])))

print(len(archivos))

200


In [37]:
#BUILT, CROP, WATER, GRASS.
for i, path in enumerate(archivos):
    image = Image.open(f"./chunks/{path}")
    res = clasificar_gemini(image)
    text = res.text
    
    if "BUILT" in text.upper():
        image.save(f"./output/built/{path}")
        # imagen = Image.new("RGB", (tamaño_trozo, tamaño_trozo), (0,0,255))
        # imagen.save(f"./output/urban/{path}")
    elif "CROP" in text.upper():
        # imagen = Image.new("RGB", (tamaño_trozo, tamaño_trozo), (255,255,0))
        # imagen.save(f"./output/cultivation/{path}")
        image.save(f"./output/crop/{path}")

    elif "WATER" in text.upper():
        # imagen = Image.new("RGB", (tamaño_trozo, tamaño_trozo), (255,0,0))
        # imagen.save(f"./output/dry/{path}")
        image.save(f"./output/water/{path}")

    elif "DRY" in text.upper() or "GRASS" in text.upper():
        # imagen = Image.new("RGB", (tamaño_trozo, tamaño_trozo), (0,255,0))
        # imagen.save(f"./output/water/{path}")
        image.save(f"./output/grass/{path}")
    else:
        raise ValueError(text)



1. 1m 23s para 25 imagenes de 128x128
2. 5m 32s para 100 imagenes de 64x64
3. 3m para 49 imagenes de 96x96

In [None]:
archivos = os.listdir("./chunks_process")
archivos = sorted(archivos, key=lambda x: (int(x.replace(".jpg", "").split("-")[0]), int(x.replace(".jpg", "").split("-")[1])))
ancho, alto = 640, 640
new_image = Image.new('RGB', (ancho, alto))

for i, path in enumerate(archivos):
    image = Image.open(f"./chunks_process/{path}")
    pos_x, pos_y = (int(path.replace(".jpg", "").split("-")[0]), int(path.replace(".jpg", "").split("-")[1]))
    print(pos_x * tamaño_trozo , pos_y* tamaño_trozo)
    new_image.paste(image, (tamaño_trozo * pos_x, tamaño_trozo  * pos_y))
new_image.save("result.jpg")


In [77]:
imagen = Image.open("./jilin_rgb_2500x800.jpg")

dibujo = ImageDraw.Draw(imagen)
color_texto = "black"

ancho, alto = imagen.size

tamaño_cuadricula = 100
for x in range(0, ancho, tamaño_cuadricula):
    dibujo.line([(x, 0), (x, alto)], fill="red", width=1)

for y in range(0, alto, tamaño_cuadricula):
    dibujo.line([(0, y), (ancho, y)], fill="red", width=1)
for x in range(0, ancho, tamaño_cuadricula):
    for y in range(0, alto, tamaño_cuadricula):
        dibujo.point((x, y), fill=color_texto)
        dibujo.text((x + 5, y + 5), f"({x//100}, {y//100})", fill=color_texto)

built = os.listdir("./output/built")
crop = os.listdir("./output/crop")
grass = os.listdir("./output/grass")
water = os.listdir("./output/water")

crop = list(map(lambda x: x.replace(".jpg", ""),crop))
built = list(map(lambda x: x.replace(".jpg", ""),built))
grass = list(map(lambda x: x.replace(".jpg", ""),grass))
water = list(map(lambda x: x.replace(".jpg", ""),water))

for x in range(0, ancho, tamaño_cuadricula):
    for y in range(0, alto, tamaño_cuadricula):
        if f"{x // 100}-{y // 100}" in built:
            region_interes = imagen.crop((x, y, x + 100 ,y + 100))

            imagen_amarilla_transparente = Image.new("RGBA", region_interes.size, (255, 255, 0, 128))

            imagen.paste(imagen_amarilla_transparente, (x, y, x + 100 ,y + 100), imagen_amarilla_transparente)
        if f"{x // 100}-{y // 100}" in crop:
            region_interes = imagen.crop((x, y, x + 100 ,y + 100))

            imagen_amarilla_transparente = Image.new("RGBA", region_interes.size, (255, 0, 0, 128))

            imagen.paste(imagen_amarilla_transparente, (x, y, x + 100 ,y + 100), imagen_amarilla_transparente)
        if f"{x // 100}-{y // 100}" in grass:
            region_interes = imagen.crop((x, y, x + 100 ,y + 100))

            imagen_amarilla_transparente = Image.new("RGBA", region_interes.size, (0, 255, 0, 128))

            imagen.paste(imagen_amarilla_transparente, (x, y, x + 100 ,y + 100), imagen_amarilla_transparente)
        if f"{x // 100}-{y // 100}" in water:
            region_interes = imagen.crop((x, y, x + 100 ,y + 100))

            imagen_amarilla_transparente = Image.new("RGBA", region_interes.size, (0, 0, 255, 128))

            imagen.paste(imagen_amarilla_transparente, (x, y, x + 100 ,y + 100), imagen_amarilla_transparente)
imagen_con_grilla = "imagen_con_grilla.jpg"
imagen.save(imagen_con_grilla)

imagen.close()
