In [None]:
# %% [code]
# Видаляємо поточну версію OpenAI та встановлюємо версію 0.27.0,
# а також встановлюємо необхідні бібліотеки, включаючи python-docx, rouge_score та scikit-learn
!pip uninstall openai -y
!pip install openai==0.27.0 --quiet
!pip install transformers sentence-transformers faiss-cpu gradio python-docx rouge_score scikit-learn --quiet

# %% [code]
# Перевірка версії OpenAI за допомогою pkg_resources
import pkg_resources
print("OpenAI version:", pkg_resources.get_distribution("openai").version)

# %% [code]
# Імпорт необхідних бібліотек
import torch
from transformers import GPT2LMHeadModel, GPT2Tokenizer
from sentence_transformers import SentenceTransformer
import faiss
import numpy as np
import gradio as gr
import openai
import os
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

# %% [code]
# Вкажіть ваш API-ключ OpenAI (рекомендується використовувати змінні середовища для безпеки)
openai.api_key = "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"  # Replace with your actual API key

# %% [code]
# Резервний набір sustainability-текстів (used if no file is uploaded)
default_sustainability_texts = [
    "Rekommendation 1: Installera energieffektiva maskiner för att minska energiförbrukningen.",
    "Rekommendation 2: Använd förnybara energikällor för att stödja affärsprocesserna.",
    "Rekommendation 3: Optimera logistik och transport för att minska CO2-utsläppen.",
    "Rekommendation 4: Utveckla en policy för avfallshantering och återvinning.",
    "Rekommendation 5: Implementera företagsansvariga program med fokus på hållbarhet.",
    "Rekommendation 6: Använd miljövänliga material i produktionen.",
    "Rekommendation 7: Genomför regelbundna energirevisioner och optimera kostnader.",
    "Rekommendation 8: Investera i teknik för att minska skadliga utsläpp och föroreningar."
]

# %% [code]
# Завантаження моделі для створення vektor representationer (SentenceTransformer)
embedder_model_name = "all-MiniLM-L6-v2"
embedder = SentenceTransformer(embedder_model_name)

# Обчислюємо векторні уявлення для стандартного набору
default_texts_embeddings = embedder.encode(default_sustainability_texts)
embedding_dim = default_texts_embeddings.shape[1]

# Створення FAISS-індексу для стандартного набору
default_index = faiss.IndexFlatL2(embedding_dim)
default_index.add(np.array(default_texts_embeddings))

# %% [code]
# Функція для отримання релевантного контексту з набору текстів
def retrieve_context_custom(query, texts, index_obj, top_k=3):
    query_embedding = embedder.encode([query])
    distances, indices = index_obj.search(np.array(query_embedding), top_k)
    retrieved_texts = [texts[idx] for idx in indices[0]]
    return "\n".join(retrieved_texts)

# %% [code]
# Функція для обчислення косинусної схожості між двома текстами за допомогою TF-IDF
def compute_cosine_similarity(text1, text2):
    vectorizer = TfidfVectorizer()
    tfidf = vectorizer.fit_transform([text1, text2])
    cosine_sim = cosine_similarity(tfidf[0:1], tfidf[1:2])[0][0]
    return round(cosine_sim, 2)

# %% [code]
# Функція, що генерує чекліст та повертає автоматичну релевантність (без оцінки користувача)
def generate_checklist_only(business_info, uploaded_file, reference_text):
    # Обробка завантаженого файлу (якщо є)
    if uploaded_file is not None:
        try:
            filename = uploaded_file.name.lower() if hasattr(uploaded_file, "name") else ""
            if filename.endswith('.docx'):
                from docx import Document
                doc = Document(uploaded_file)
                file_text = "\n".join([para.text for para in doc.paragraphs])
            else:
                file_bytes = uploaded_file.read() if hasattr(uploaded_file, "read") else uploaded_file
                file_text = file_bytes.decode("utf-8") if isinstance(file_bytes, bytes) else str(file_bytes)
            sustainability_texts = [line.strip() for line in file_text.splitlines() if line.strip()]
            if len(sustainability_texts) == 0:
                sustainability_texts = default_sustainability_texts
        except Exception as e:
            sustainability_texts = default_sustainability_texts
    else:
        sustainability_texts = default_sustainability_texts

    # Обчислення векторних уявлень та створення FAISS-індексу для sustainability-текстів
    texts_embeddings = embedder.encode(sustainability_texts)
    index_custom = faiss.IndexFlatL2(embedding_dim)
    index_custom.add(np.array(texts_embeddings))

    # Отримання релевантного контексту на основі інформації про компанію
    retrieved_context = retrieve_context_custom(business_info, sustainability_texts, index_custom, top_k=3)

    # Формування промпту для генерації чеклісту (результат буде шведською мовою)
    prompt = (
        f"Baserat på följande information om miljörekommendationer:\n\n"
        f"{retrieved_context}\n\n"
        f"och information om företaget:\n\n"
        f"{business_info}\n\n"
        "Skapa en detaljerad checklista med rekommendationer för att implementera hållbarhetspraxis."
    )

    # Виклик ChatCompletion API
    messages = [
        {"role": "system", "content": "Du är en konsult specialiserad på att implementera hållbarhetspraxis för företag."},
        {"role": "user", "content": prompt}
    ]

    response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=messages,
        temperature=0.8,
        top_p=0.95
    )

    generated_checklist = response.choices[0].message["content"].strip()
    auto_relevance = compute_cosine_similarity(generated_checklist, reference_text)
    return generated_checklist, auto_relevance

# %% [code]
# Функція для обробки оцінки користувача.
# Отримуємо збережені дані (автоматичну релевантність) та об'єднуємо з оцінкою користувача.
def submit_rating(state, user_rating):
    evaluation = {
        "automatic_relevance": state["auto_relevance"],
        "user_rating": user_rating
    }
    return evaluation

# %% [code]
# Створення Gradio Blocks інтерфейсу для двоступеневого процесу
with gr.Blocks() as demo:
    gr.Markdown("## Sustainability Checklist Generator and Evaluation")

    with gr.Row():
        company_info = gr.Textbox(lines=5, placeholder="Enter company information...", label="Company Information")
        uploaded_file = gr.File(label="Upload a file with sustainability texts (TXT or DOCX)", file_types=[".txt", ".docx"])

    reference_example_input = gr.Textbox(lines=10, placeholder="Enter reference example...", label="Reference Example",
                                         value="""Här är en detaljerad checklista med rekommendationer för att implementera hållbarhetspraxis för ert företag inom hemstädningstjänster i Stockholm:

1. Genomför en analys av era nuvarande produkter och tjänster för att identifiera möjliga områden där ni kan förbättra hållbarheten.
2. Utvärdera möjligheter att använda mer energieffektiva rengöringsprodukter och utrustning för att minska er miljöpåverkan.
3. Undersök möjligheten att införa återvunnet material i era rengöringsprodukter och förpackningar för att minska er koldioxidavtryck.
4. Se över er städprocess för att optimera resursanvändningen och minska avfallet genom att till exempel använda återanvändbara rengöringsdukar och redskap.
5. Implementera en policy för att främja återanvändning och återvinning av material som används i er städverksamhet, inklusive korrekt avfallshantering.
6. Se till att ert företag följer de kommande kraven enligt Ekodesignförordningen för mobiltelefoner och surfplattor, särskilt när det gäller energieffektivitet och hållbarhet hos batterier.
7. Säkerställ att ni har tillgång till reservdelar och erbjuder uppgraderingar av operativsystem för era elektroniska enheter för att förlänga deras livslängd och minska behovet av nya inköp.
8. Implementera en process för att dokumentera och redovisa användningen av återvunnet material i batterier som används i era städtjänster.
9. Utbilda era anställda och informera era kunder om ert engagemang för hållbarhetspraxis och miljövänliga städmetoder.
10. Fortsätt att övervaka och utvärdera era hållbarhetsinsatser regelbundet för att säkerställa att ni uppfyller era mål och kan göra ytterligare förbättringar.

Genom att följa denna checklista och implementera dessa rekommendationer kan ni stärka er hållbarhetsprofil och bidra till en mer miljövänlig städbransch i Stockholm."""
                                        )
    generate_button = gr.Button("Generate Checklist")
    generated_checklist_output = gr.Textbox(label="Generated Checklist")
    auto_relevance_output = gr.Textbox(label="Automatic Relevance")
    # Збереження даних (у вигляді state)
    state = gr.State({})

    with gr.Row():
        rating_slider = gr.Slider(minimum=1, maximum=5, step=1, label="Your Rating (1-5)", value=3)
        submit_button = gr.Button("Submit Rating")
    evaluation_output = gr.JSON(label="Evaluation")

    # Функція генерації чеклісту (без рейтингу)
    def generate_func(business_info, uploaded_file, reference_example):
        checklist, auto_rel = generate_checklist_only(business_info, uploaded_file, reference_example)
        # Зберігаємо автоматичну релевантність у state
        state_val = {"auto_relevance": auto_rel}
        return checklist, str(auto_rel), state_val

    generate_button.click(generate_func,
                          inputs=[company_info, uploaded_file, reference_example_input],
                          outputs=[generated_checklist_output, auto_relevance_output, state])

    # Функція обробки рейтингу
    submit_button.click(submit_rating,
                        inputs=[state, rating_slider],
                        outputs=evaluation_output)

demo.launch()


Found existing installation: openai 0.27.0
Uninstalling openai-0.27.0:
  Successfully uninstalled openai-0.27.0
OpenAI version: 0.27.0
Running Gradio in a Colab notebook requires sharing enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://252c2845205bb76e76.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


