In [1]:
import json
import datetime
from src.proposal_builder.llm import create_llm
from src.proposal_builder.helpers import read_prompt
from src.config import settings, prompts

LLM = create_llm(settings)

data = {
    "client_name": "SIBS",
    "language": "Portuguese",
    "project_name": "Relatório de Sustentabilidade: AI search and ESG Information Extraction",
    "project_type": "Gen-OS",
    "main_goals": """Human-in-the-loop processes via Gen-OS’ Case Management
Internet AI Search the Relatório de Sustentabilidade for a list of 100+ companies with the capability of adding the remaining ones by hand
AI Workflow process
Personalized rules for the extraction
Infrastructure and first MVP
Optimization phase to improve data extraction to viable business standards""",
    "technology_focus": "Azure",
    "general_description": "The project aims to perform an intelligent web search for sustainability reports of different Portuguese companies online, saving them into SIBS data systems to then process these pdfs by leveraging GenAI techniques, extracting ESG information as scope 1, 2 & 3 emissions and ingesting it into SIBS data systems. Gen-OS will wrap this process, guaranteeing human-in-the-loop processes. We will develop the integrations of the whole workflow with Gen-OS, including personalised tests & rules for the extracted data. By comparing with information from previous years, we will perform a test of expected performance before launching to production. After processing the 2024 reports, we will try to optimize this process for future years.",
    "planning": """Timeline:
Initial Setup (Accesses, Infrastructure, Previous Years Documents & Extracted Information): 1 week, 1 Principal and 1 AI Scientist
Fast PoC for measurement & progressive fine-tunning: 1 week, 1 Principal and 1 AI Scientist
Gen-OS setup: 1 week, 1 Principal, 1 AI Scientist and Gen-OS team
Productivization: 2 weeks (in parallel with Gen-OS setup), 1 Principal, 1 AI Scientist""",
    "client_stakeholders": """Cliente:
João F Moreira <joao.f.moreira@sibs.com> - Business Champion for the project
Paulo Rodrigues <Paulo.Rodrigues@sibs.com> - Innovation & Transformation at SIBS Processos for reporting on project results
Inês Lagoa <ines.lagoa@sibs.com> - Head of Product and Innovation of BTO Products for reporting on project results""",
    "daredata_team": """DareData Principal -  client communication, project management & requirements, DareData team manager
AI Scientist: main code developer of the project, works together with DareData‘s Principal to develop features according to client priorities
Gen-OS team: helps with the deployment of Gen-OS’ case management in SIBS infrastructure & helps integration of the solution into Gen-OS.
Tech Specialist: AI Specialist that helps solve any bottlenecks encountered during the project. This role exists for consultation. """,
    "client_expectations": "",
    "special_conditions": "",
    "creation_date": datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
}


In [None]:
async def agenerate_executive_summary(data: dict, description: str) -> str:
    messages = [
        {"role": "system", "content": prompts.SYSTEM_PROMPT},
        {"role": "user", "content": prompts.EXECUTIVE_SUMMARY + description}
    ]
    response = LLM.chat.completions.create(
        model=settings.AZURE_OPENAI_DEPLOYMENT,
        messages=messages,
    )
    return response.choices[0].message.content

await agenerate_executive_summary({}, "The project is about creating an application in AWS")

In [4]:
async def agenerate_project_description(data: dict) -> str:
    fields = [
        "client_name",
        "language",
        "main_goals",
        "technology_focus",
        "general_description",
        "planning",
    ]
    data = {k: v for k, v in data.items() if k in fields}
    messages = [
        {"role": "system", "content": prompts.SYSTEM_PROMPT},
        {"role": "user", "content": prompts.PROJECT_DESCRIPTION + json.dumps(data)}
    ]
    response = LLM.chat.completions.create(
        model=settings.AZURE_OPENAI_DEPLOYMENT,
        messages=messages,
    )
    return response.choices[0].message.content

print(await agenerate_project_description(data))

### Descrição do Projeto

O objetivo deste projeto é realizar uma busca inteligente na web para identificar e coletar relatórios de sustentabilidade de diversas empresas portuguesas, salvando-os no sistema de dados da SIBS. Posteriormente, esses relatórios serão processados utilizando técnicas de GenAI para extrair informações de ESG, como emissões de escopo 1, 2 e 3, e integrá-las nos sistemas de dados da SIBS. O framework Gen-OS da DareData será empregado para envolver este processo, garantindo a inclusão do fator humano durante os processos de gestão de casos.

#### Componentes do Projeto

1. **Busca Inteligente na Web**:
   - Desenvolvimento de um módulo de busca na web para localizar relatórios de sustentabilidade publicados por empresas portuguesas.
   - Armazenamento automático dos relatórios encontrados nos sistemas de dados da SIBS.

2. **Processamento de PDF utilizando técnicas de GenAI**:
   - Implementação de técnicas avançadas de GenAI para a extração de informações releva

In [2]:
async def agenerate_timeline_planing(data: dict) -> str:
    type_of_project_dict = {
        "Gen-OS": prompts.TIMELINE_AND_PLANING_GENOS,
        "Closed Project": prompts.TIMELINE_AND_PLANING_CLOSED_PROJECT,
        "Co-Creation": prompts.TIMELINE_AND_PLANING_COCREATION
    }
    messages = [
        {"role": "system", "content": prompts.SYSTEM_PROMPT},
        {"role": "user", "content": type_of_project_dict[data["project_type"]] + data["planning"]}
    ]
    response = LLM.chat.completions.create(
        model=settings.AZURE_OPENAI_DEPLOYMENT,
        messages=messages,
    )
    return response.choices[0].message.content

print(await agenerate_timeline_planing(data))

# Sumário Executivo

Este cronograma visa detalhar as fases e marcos do projeto de desenvolvimento e integração do GenAI com o Gen-OS, o framework da DareData para desenvolvimento e execução de IA generativa. Através deste plano, garantimos uma abordagem estruturada e eficiente para atingir os objetivos do projeto, com a participação de profissionais-chave e a realização de atividades críticas.

# Cronograma do Projeto

```mermaid
gantt

title Cronograma do Projeto (em semanas)
dateFormat Q
axisFormat %W
tickInterval 1week
todayMarker off

section SETUP: Build
Desenvolvimento GenAI e Integração Gen-OS :active, a1, 2025-01-05, 8w
Entrada em Produção :milestone, a2, after a1, 0w

section SETUP: Tuning
Ajustes e Otimização :active, b1, after a1, 4w
Validação Final e Arranque Operação Contínua :milestone, c1, after b1, 0w

section RUN
Operação :done, d1, after c1, 2w
```

# Descrição do Projeto

### Fase Inicial Setup

Objetivo: Estabelecer o acesso e a infraestrutura necessária, além de c

In [6]:
async def agenerate_work_agreement(data: dict) -> str:
    work_agreement_dict_en = {
        "Closed Project": "Payment of 30% on acceptance of the proposal, payment of 70% at the end",
        "Gen-OS": """Setup: Payment of 30% on acceptance of the proposal, payment of 70% at the end
Run: Monthly Payment / Annual Payment (5% discount)""",
        "Co-creation": "Payment based on work timesheets",
    }
    work_agreement_dict_pt = {
        "Closed Project": "Pagamento do 30% aquando da aceitação da proposta, 70% no final",
        "Gen-OS": """Setup: 30% aquando da aceitação da proposta, 70% no final
Run: Pagamentos Mensais/ Anuais (5% desconto)""",
        "Co-creation": "Pagamento com base em timesheets",
    }

    text_pt = f"""
Acordo de trabalho
Todo o trabalho será efetuado remotamente (preferencialmente).

Condições de pagamento 
{work_agreement_dict_pt[data["project_type"]]}

Pagamento devido no prazo de 30 dias a contar da data de apresentação da fatura
O IVA, se aplicável, deve ser aplicado a todos os valores da presente proposta

Validade
A presente proposta é válida por 30 dias úteis


Todas as faturas deverão ser pagas à:
Empresa: DareData, SA 
NIF: PT 515362166
Endereço: AV FONTES PEREIRA MELO , 31 5 C LISBOA 1050-117 LISBOA
"""
    text_en = f"""
Work agreement
All the work will be done remotely.

Payment terms
{work_agreement_dict_en[data['project_type']]}
Payment due within 30 days of invoice issue date
VAT, where applicable, should be applied to all figures in this proposal

Start date
Not defined, up to 10 working days after acceptance of the proposal


All bills should be paid to:
Company: DareData, SA 
VAT Number: PT 515362166
Address: AV FONTES PEREIRA MELO , 31 5 C LISBOA 1050-117 LISBOA
"""
    if data["language"] == "English":
        return text_en
    if data["language"] == "Portuguese":
        return text_pt

await agenerate_work_agreement(data)

'\nAcordo de trabalho\nTodo o trabalho será efetuado remotamente (preferencialmente).\n\nCondições de pagamento \nSetup: 30% aquando da aceitação da proposta, 70% no final\nRun: Pagamentos Mensais/ Anuais (5% desconto)\n\nPagamento devido no prazo de 30 dias a contar da data de apresentação da fatura\nO IVA, se aplicável, deve ser aplicado a todos os valores da presente proposta\n\nValidade\nA presente proposta é válida por 30 dias úteis\n\n\nTodas as faturas deverão ser pagas à:\nEmpresa: DareData, SA \nNIF: PT 515362166\nEndereço: AV FONTES PEREIRA MELO , 31 5 C LISBOA 1050-117 LISBOA\n'

In [8]:
async def agenerate_proposal(data: dict) -> str:
    project_desc = await agenerate_project_description(data)
    timeline_planing = await agenerate_timeline_planing(data)
    stakeholders_and_team = await agenerate_stakeholders_and_team(data)
    requirements = await agenerate_requirements(data)
    work_agreement = await agenerate_work_agreement(data)
    exc_summ = await agenerate_executive_summary(data, project_desc)

    proposal = "\n".join([
        exc_summ,
        project_desc,
        timeline_planing,
        stakeholders_and_team,
        requirements,
        work_agreement
    ])
    return proposal

async def agenerate_executive_summary(data: dict, description: str) -> str:
    messages = [
        {"role": "system", "content": prompts.SYSTEM_PROMPT},
        {"role": "user", "content": prompts.EXECUTIVE_SUMMARY + description}
    ]
    response = LLM.chat.completions.create(
        model=settings.AZURE_OPENAI_DEPLOYMENT,
        messages=messages,
    )
    return response.choices[0].message.content

async def agenerate_project_description(data):
    fields = [
        "client_name",
        "language",
        "main_goals",
        "technology_focus",
        "general_description",
        "planning",
    ]
    data = {k: v for k, v in data.items() if k in fields}
    messages = [
        {"role": "system", "content": prompts.SYSTEM_PROMPT},
        {"role": "user", "content": prompts.PROJECT_DESCRIPTION + json.dumps(data)}
    ]
    response = LLM.chat.completions.create(
        model=settings.AZURE_OPENAI_DEPLOYMENT,
        messages=messages,
    )
    return response.choices[0].message.content

async def agenerate_timeline_planing(data: dict) -> str:
    type_of_project_dict = {
        "Gen-OS": prompts.TIMELINE_AND_PLANING_GENOS,
        "Closed Project": prompts.TIMELINE_AND_PLANING_CLOSED_PROJECT,
        "Co-Creation": prompts.TIMELINE_AND_PLANING_COCREATION
    }
    messages = [
        {"role": "system", "content": prompts.SYSTEM_PROMPT},
        {"role": "user", "content": type_of_project_dict[data["project_type"]] + data["planning"]}
    ]
    response = LLM.chat.completions.create(
        model=settings.AZURE_OPENAI_DEPLOYMENT,
        messages=messages,
    )
    return response.choices[0].message.content

async def agenerate_stakeholders_and_team(data: dict) -> str:
    fields = [
        "client_name",
        "language",
        "client_stakeholders",
    ]
    data = {k: v for k, v in data.items() if k in fields}
    messages = [
        {"role": "system", "content": prompts.SYSTEM_PROMPT},
        {"role": "user", "content": prompts.STAKEHOLDERS_AND_TEAM + json.dumps(data)}
    ]
    response = LLM.chat.completions.create(
        model=settings.AZURE_OPENAI_DEPLOYMENT,
        messages=messages,
    )
    return response.choices[0].message.content

async def agenerate_requirements(data: dict) -> str:
    fields = [
        "client_name",
        "language",
        "client_expectations",
    ]
    data = {k: v for k, v in data.items() if k in fields}
    messages = [
        {"role": "system", "content": prompts.SYSTEM_PROMPT},
        {"role": "user", "content": prompts.REQUIREMENTS_AND_PRICING + json.dumps(data)}
    ]
    response = LLM.chat.completions.create(
        model=settings.AZURE_OPENAI_DEPLOYMENT,
        messages=messages,
    )
    return response.choices[0].message.content

async def agenerate_work_agreement(data: dict) -> str:
    work_agreement_dict_en = {
        "Closed Project": "Payment of 30% on acceptance of the proposal, payment of 70% at the end",
        "Gen-OS": """Setup: Payment of 30% on acceptance of the proposal, payment of 70% at the end
Run: Monthly Payment / Annual Payment (5% discount)""",
        "Co-creation": "Payment based on work timesheets",
    }
    work_agreement_dict_pt = {
        "Closed Project": "Pagamento do 30% aquando da aceitação da proposta, 70% no final",
        "Gen-OS": """Setup: 30% aquando da aceitação da proposta, 70% no final
Run: Pagamentos Mensais/ Anuais (5% desconto)""",
        "Co-creation": "Pagamento com base em timesheets",
    }

    text_pt = f"""
Acordo de trabalho
Todo o trabalho será efetuado remotamente (preferencialmente).

Condições de pagamento 
{work_agreement_dict_pt[data["project_type"]]}

Pagamento devido no prazo de 30 dias a contar da data de apresentação da fatura
O IVA, se aplicável, deve ser aplicado a todos os valores da presente proposta

Validade
A presente proposta é válida por 30 dias úteis


Todas as faturas deverão ser pagas à:
Empresa: DareData, SA 
NIF: PT 515362166
Endereço: AV FONTES PEREIRA MELO , 31 5 C LISBOA 1050-117 LISBOA
"""
    text_en = f"""
Work agreement
All the work will be done remotely.

Payment terms
{work_agreement_dict_en[data['project_type']]}
Payment due within 30 days of invoice issue date
VAT, where applicable, should be applied to all figures in this proposal

Start date
Not defined, up to 10 working days after acceptance of the proposal


All bills should be paid to:
Company: DareData, SA 
VAT Number: PT 515362166
Address: AV FONTES PEREIRA MELO , 31 5 C LISBOA 1050-117 LISBOA
"""
    if data["language"] == "English":
        return text_en
    if data["language"] == "Portuguese":
        return text_pt

await agenerate_proposal(data)

'### Sumário Executivo\n\nA SIBS propôs um projeto destinado a implementar uma pesquisa inteligente na web para relatórios de sustentabilidade de diversas empresas portuguesas, arquivando-os em seus sistemas de dados para processamento posterior. O objetivo principal é utilizar técnicas de GenAI para extrair informações relacionadas a ESG, como emissões de âmbitos 1, 2 e 3. A estrutura Gen-OS, um framework da DareData para desenvolvimento e runtime de GenAI, será essencial para garantir processos humanos-in-the-loop em todo o ciclo de extração e análise dos dados.\n\n### Âmbito do Trabalho\n\nO projeto envolverá várias etapas importantes. Inicialmente, será configurada a infraestrutura necessária e compilados os documentos de anos anteriores para criar uma base de dados robusta. Em uma semana, espera-se que um Principal e um Cientista de IA completem esta fase inicial. Em seguida, uma Prova de Conceito (PoC) será desenvolvida para medir o desempenho do sistema e realizar ajustes. Esta 