In [None]:
{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "86b7a0a0",
   "metadata": {},
   "outputs": [],
   "source": [
    "import csv  # Importa o módulo para ler arquivos CSV\n",
    "\n",
    "# Abre o arquivo CSV do Titanic e carrega os dados como uma lista de dicionários\n",
    "with open(\"../data_titanic/train.csv\", encoding=\"utf-8\") as f:\n",
    "    dados = list(csv.DictReader(f))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "id": "d86fba4d",
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "Média de tarifa e sobrevivência por classe:\n",
      "  Classe 1ª: média tarifa = $84.15, sobrevivência = 63.0%\n",
      "  Classe 2ª: média tarifa = $20.66, sobrevivência = 47.3%\n",
      "  Classe 3ª: média tarifa = $13.68, sobrevivência = 24.2%\n",
      "\n",
      "Top 5 passageiros com tarifas mais altas:\n",
      "  Ward, Miss. Anna – $512.33 (1ª classe)\n",
      "  Cardeza, Mr. Thomas Drake Martinez – $512.33 (1ª classe)\n",
      "  Lesurer, Mr. Gustave J – $512.33 (1ª classe)\n",
      "  Fortune, Mr. Charles Alexander – $263.00 (1ª classe)\n",
      "  Fortune, Miss. Mabel Helen – $263.00 (1ª classe)\n",
      "\n",
      "Distribuição de tarifas (quantitativo por faixa):\n",
      "  ≤50: 731 passageiros\n",
      "  ≤100: 107 passageiros\n",
      "  ≤200: 33 passageiros\n",
      "  ≤300: 17 passageiros\n",
      "  >300: 3 passageiros\n"
     ]
    }
   ],
   "source": [
    "# Imprime o título da primeira análise\n",
    "print(\"Média de tarifa e sobrevivência por classe:\")\n",
    "\n",
    "# Laço que percorre cada classe social: 1ª, 2ª e 3ª\n",
    "for classe in [\"1\", \"2\", \"3\"]:\n",
    "    # Filtra apenas os passageiros da classe atual\n",
    "    passageiros = [p for p in dados if p[\"Pclass\"] == classe]\n",
    "\n",
    "    # Extrai as tarifas (Fare) válidas (não vazias) e converte para float\n",
    "    tarifas = [float(p[\"Fare\"]) for p in passageiros if p[\"Fare\"]]\n",
    "\n",
    "    # Filtra os passageiros que sobreviveram (campo \"Survived\" igual a \"1\")\n",
    "    sobreviventes = [p for p in passageiros if p[\"Survived\"] == \"1\"]\n",
    "\n",
    "    # Calcula a média das tarifas (se houver valores válidos)\n",
    "    media_tarifa = round(sum(tarifas) / len(tarifas), 2) if tarifas else 0\n",
    "\n",
    "    # Calcula a porcentagem de sobreviventes (se houver passageiros)\n",
    "    perc_sobrevivencia = round(len(sobreviventes) / len(passageiros) * 100, 1) if passageiros else 0\n",
    "\n",
    "    # Mostra os resultados para a classe atual\n",
    "    print(f\"  Classe {classe}ª: média tarifa = ${media_tarifa}, sobrevivência = {perc_sobrevivencia}%\")\n",
    "\n",
    "# Imprime o título da próxima análise\n",
    "print(\"\\nTop 5 passageiros com tarifas mais altas:\")\n",
    "\n",
    "# Filtra apenas passageiros com tarifa válida, ordena em ordem decrescente pela tarifa\n",
    "# A função `lambda x: float(x[\"Fare\"])` diz ao sorted para ordenar usando o campo \"Fare\" convertido em número\n",
    "top5 = sorted(\n",
    "    [p for p in dados if p[\"Fare\"]],\n",
    "    key=lambda x: float(x[\"Fare\"]),\n",
    "    reverse=True\n",
    ")[:5]  # Pega apenas os 5 primeiros após a ordenação\n",
    "\n",
    "# Mostra o nome, valor da tarifa e a classe dos 5 passageiros que pagaram mais\n",
    "for p in top5:\n",
    "    print(f\"  {p['Name']} – ${float(p['Fare']):.2f} ({p['Pclass']}ª classe)\")\n",
    "\n",
    "# Define os limites das faixas de tarifa\n",
    "faixas = [50, 100, 200, 300]\n",
    "\n",
    "# Inicializa uma lista com 5 posições para contar quantos passageiros estão em cada faixa\n",
    "# Índices: [≤50, ≤100, ≤200, ≤300, >300]\n",
    "contagem = [0, 0, 0, 0, 0]\n",
    "\n",
    "# Percorre todos os passageiros para contar quantos caem em cada faixa\n",
    "for p in dados:\n",
    "    if p[\"Fare\"]:  # Garante que o campo Fare não está vazio\n",
    "        valor = float(p[\"Fare\"])  # Converte para número\n",
    "        if valor <= 50:\n",
    "            contagem[0] += 1\n",
    "        elif valor <= 100:\n",
    "            contagem[1] += 1\n",
    "        elif valor <= 200:\n",
    "            contagem[2] += 1\n",
    "        elif valor <= 300:\n",
    "            contagem[3] += 1\n",
    "        else:\n",
    "            contagem[4] += 1\n",
    "\n",
    "# Define os rótulos para cada faixa de tarifa\n",
    "faixa_rotulos = [\"≤50\", \"≤100\", \"≤200\", \"≤300\", \">300\"]\n",
    "\n",
    "# Mostra os resultados de forma textual, como um \"gráfico de barras simplificado\"\n",
    "# A função enumerate permite acessar ao mesmo tempo o índice (i) e o texto do rótulo (rotulo)\n",
    "print(\"\\nDistribuição de tarifas (quantitativo por faixa):\")\n",
    "for i, rotulo in enumerate(faixa_rotulos):\n",
    "    # Usa o índice `i` para acessar o valor correspondente na lista `contagem`\n",
    "    print(f\"  {rotulo}: {contagem[i]} passageiros\")\n"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.13.2"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}