In [1]:
prompts = [
    # Prompt 1: Leitura e validação do CSV
    """Você é um engenheiro de software experiente. Escreva um código Python para um aplicativo Streamlit que realiza o seguinte:
    1. Permite ao usuário fazer upload de um arquivo CSV.
    2. Valida se o arquivo contém as colunas "Fala" e "Categoria".
    3. Exibe uma mensagem de erro amigável se essas colunas não forem encontradas.
    4. Mostra o dataframe na página se o arquivo for válido.
    O código deve estar bem comentado.""",
    
    # Prompt 2: Processamento dos Dados
    """Escreva uma função Python que receba um dataframe Pandas contendo as colunas "Fala" e "Categoria". Essa função deve:
    1. Contar o número de ocorrências de cada categoria.
    2. Calcular a proporção de cada categoria em relação ao total.
    3. Retornar um novo dataframe com as categorias, suas contagens e proporções.
    O código deve ser otimizado e conter comentários explicativos.""",
    
    # Prompt 3: Criação do Gráfico de Pizza
    """Escreva uma função Python para um aplicativo Streamlit que:
    1. Receba um dataframe contendo categorias, contagens e proporções.
    2. Use a biblioteca Plotly para gerar um gráfico de pizza que mostre a proporção de cada categoria.
    3. Renderize o gráfico na interface do Streamlit.
    O código deve ser bem documentado e otimizado.""",
]

In [None]:
import google.generativeai as genai
from google.generativeai.types import HarmCategory, HarmBlockThreshold
import os 
from dotenv import load_dotenv

safety_settings={
            HarmCategory.HARM_CATEGORY_HATE_SPEECH: HarmBlockThreshold.BLOCK_NONE,
            HarmCategory.HARM_CATEGORY_HARASSMENT: HarmBlockThreshold.BLOCK_NONE,
            HarmCategory.HARM_CATEGORY_SEXUALLY_EXPLICIT: HarmBlockThreshold.BLOCK_NONE,
            HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT: HarmBlockThreshold.BLOCK_NONE,
        }


# Definir a chave de API do Gemini (use a chave fornecida pela sua conta)
genai.configure(api_key=os.getenv("GEMINI_API_KEY"))
model = genai.GenerativeModel("gemini-1.5-flash", safety_settings=safety_settings)

for prompt in prompts:
    response = model.generate_content(prompt)
    print(response.text)
    

  from .autonotebook import tqdm as notebook_tqdm


```python
import streamlit as st
import pandas as pd

def process_csv(uploaded_file):
    """
    Processa um arquivo CSV carregado pelo usuário.

    Args:
        uploaded_file: Arquivo CSV carregado.

    Returns:
        Um DataFrame Pandas se o arquivo for válido, senão retorna None.
    """
    try:
        # Lê o arquivo CSV usando pandas
        df = pd.read_csv(uploaded_file)

        # Verifica se as colunas 'Fala' e 'Categoria' existem
        required_cols = ["Fala", "Categoria"]
        if not all(col in df.columns for col in required_cols):
            raise ValueError(f"O arquivo CSV deve conter as colunas: {', '.join(required_cols)}")

        return df

    except pd.errors.EmptyDataError:
        return "O arquivo CSV está vazio."
    except pd.errors.ParserError:
        return "Erro ao analisar o arquivo CSV. Por favor, verifique se o formato está correto."
    except ValueError as e:
        return str(e)
    except Exception as e:
        return f"Ocorreu um erro 

In [None]:
import app as st
import pandas as pd

def process_csv(uploaded_file):
    """
    Processa um arquivo CSV carregado pelo usuário.

    Args:
        uploaded_file: Arquivo CSV carregado.

    Returns:
        Um DataFrame Pandas se o arquivo for válido, senão retorna None.
    """
    try:
        # Lê o arquivo CSV usando pandas
        df = pd.read_csv(uploaded_file)

        # Verifica se as colunas 'Fala' e 'Categoria' existem
        required_cols = ["Fala", "Categoria"]
        if not all(col in df.columns for col in required_cols):
            raise ValueError(f"O arquivo CSV deve conter as colunas: {', '.join(required_cols)}")

        return df

    except pd.errors.EmptyDataError:
        return "O arquivo CSV está vazio."
    except pd.errors.ParserError:
        return "Erro ao analisar o arquivo CSV. Por favor, verifique se o formato está correto."
    except ValueError as e:
        return str(e)
    except Exception as e:
        return f"Ocorreu um erro inesperado: {e}"


def main():
    """
    Função principal para o aplicativo Streamlit.
    """
    st.title("Processador de Arquivos CSV")
    st.markdown("Carregue um arquivo CSV contendo as colunas 'Fala' e 'Categoria'.")

    uploaded_file = st.file_uploader("Escolha um arquivo CSV", type="csv")

    if uploaded_file is not None:
        result = process_csv(uploaded_file)

        if isinstance(result, pd.DataFrame):
            st.success("Arquivo CSV carregado com sucesso!")
            st.dataframe(result)
        else:
            st.error(result)

if __name__ == "__main__":
    main()



In [6]:
import pandas as pd

def analisar_categorias(df):
    """
    Analisa um DataFrame Pandas para contar e calcular a proporção de ocorrências de cada categoria.

    Args:
        df: Um DataFrame Pandas com colunas 'Fala' e 'Categoria'.

    Returns:
        Um DataFrame Pandas com as categorias, suas contagens e proporções. 
        Retorna None se o DataFrame de entrada for inválido.
    """

    # Verificação de entrada:
    if not isinstance(df, pd.DataFrame):
        print("Erro: Entrada inválida. Deve ser um DataFrame Pandas.")
        return None
    if not all(col in df.columns for col in ['Fala', 'Categoria']):
        print("Erro: O DataFrame deve conter as colunas 'Fala' e 'Categoria'.")
        return None


    # Conta as ocorrências de cada categoria
    contagens = df['Categoria'].value_counts()

    # Calcula o total de categorias
    total = len(df)

    # Calcula as proporções
    proporcoes = contagens / total

    # Cria um novo DataFrame com as categorias, contagens e proporções
    resultado = pd.DataFrame({'Categoria': contagens.index, 'Contagem': contagens.values, 'Proporção': proporcoes.values})

    return resultado


# Exemplo de uso:
data = {'Fala': ['Fala 1', 'Fala 2', 'Fala 3', 'Fala 4', 'Fala 5'],
        'Categoria': ['A', 'B', 'A', 'A', 'B']}
df = pd.DataFrame(data)

resultado = analisar_categorias(df)

if resultado is not None:
    print(resultado)

#Exemplo de DataFrame inválido:
df_invalido = pd.DataFrame({'Coluna1': [1,2,3]})
resultado = analisar_categorias(df_invalido)



  Categoria  Contagem  Proporção
0         A         3        0.6
1         B         2        0.4
Erro: O DataFrame deve conter as colunas 'Fala' e 'Categoria'.


In [None]:
import app as st
import plotly.graph_objects as go
import pandas as pd

def plot_proportions_pie_chart(df: pd.DataFrame) -> None:
    """
    Gera e exibe um gráfico de pizza Plotly a partir de um DataFrame.

    Args:
        df: Um DataFrame Pandas com colunas 'category', 'count', e 'proportion'.
           'category' representa a categoria, 'count' a contagem e 'proportion' a proporção.

    Raises:
        ValueError: Se o DataFrame estiver faltando colunas essenciais ou conter dados inválidos.
    """

    # Verificação de entrada
    if not isinstance(df, pd.DataFrame):
        raise ValueError("A entrada deve ser um DataFrame Pandas.")
    required_cols = ['category', 'count', 'proportion']
    if not all(col in df.columns for col in required_cols):
        raise ValueError(f"O DataFrame deve conter as colunas: {required_cols}")
    if not all(df['proportion'] >= 0 and df['proportion'] <= 1 for _ in df['proportion']):
      raise ValueError("A coluna 'proportion' deve conter valores entre 0 e 1")
    if not df['count'].dtype in [int, float] :
      raise ValueError("A coluna 'count' deve conter valores numéricos")


    fig = go.Figure(data=[go.Pie(labels=df['category'], values=df['proportion'], textinfo='percent',
                                 insidetextorientation='radial')])

    fig.update_traces(hoverinfo='label+percent', textfont_size=20,
                      marker=dict(line=dict(color='#000000', width=2)))
    fig.update_layout(title_text="Proporções das Categorias")

    st.plotly_chart(fig)


#Exemplo de uso em Streamlit:

st.title("Gráfico de Pizza de Proporções")

# Dados de exemplo (substitua pelos seus próprios dados)
data = {'category': ['A', 'B', 'C', 'D'],
        'count': [10, 15, 12, 8],
        'proportion': [0.25, 0.375, 0.3, 0.075]}
df = pd.DataFrame(data)

try:
  plot_proportions_pie_chart(df)
except ValueError as e:
  st.error(f"Erro: {e}")