In [None]:
from IPython.display import display, Markdown
import pandas as pd

# 1
intro_text = """
# Know Your Fan - FURIA Challenge (Notebook Version)

Este caderno simula uma solução orientada a dados que coleta e analisa informação sobre fãs de esports. O objetivo é explorar como uma equipe como a FURIA pode entender melhor seus fãs para oferecer serviços mais focados e adaptados às suas necessidades.

O que faremos:

1. Simular dados de entrada (informação básica, interesses, links pessoais)
2. Enriquecer os dados (validar documentos, scraping de redes sociais, links de esports)
3. Analisar os dados (categorizar comportamento do fã, relevância de conteúdos)
4. Exportar um perfil estruturado.

---
"""

# 2 - simulando dados de entrada
form_data = {
    "name": "Lucas Martins",
    "cpf": "123.456.789-00",
    "address": "Brasília, DF",
    "interests": "CS:GO, CS2, Valorant",
    "activities": "Assistiu IEM Rio, participei de campeonato de CS2",
    "purchases": "Camiseta oficial FURIA Adidas preta, assinatura HLTV+",
    "social_links": [
        "https://x.com/sofiaespanha",
        "https://instagram.com/sofiaespanha",
    ],
    "esports_links": [
        "https://liquipedia.net/counterstrike/Lucas",
        "https://steamcommunity.com/id/lucasvalorant/",
    ],
}

form_df = pd.DataFrame([form_data])

# Mostrar seções iniciais
display(Markdown(intro_text))
display(Markdown("## Simulated User Input"))
display(form_df)


# Know Your Fan - FURIA Challenge (Notebook Version)

Este caderno simula uma solução orientada a dados que coleta e analisa informação sobre fãs de esports. O objetivo é explorar como uma equipe como a FURIA pode entender melhor seus fãs para oferecer serviços mais focados e adaptados às suas necessidades.

O que faremos:

1. Simular dados de entrada (informação básica, interesses, links pessoais)
2. Enriquecer os dados (validar documentos, scraping de redes sociais, links de esports)
3. Analisar os dados (categorizar comportamento do fã, relevância de conteúdos)
4. Exportar um perfil estruturado.

---


## Simulated User Input

Unnamed: 0,name,cpf,address,interests,activities,purchases,social_links,esports_links
0,Lucas Martins,123.456.789-00,"Brasília, DF","CS:GO, CS2, Valorant","Assistiu IEM Rio, participei de campeonato de CS2","Camiseta oficial FURIA Adidas preta, assinatur...","[https://x.com/sofiaespanha, https://instagram...","[https://liquipedia.net/counterstrike/Lucas, h..."


In [None]:
# Step 3: Simulação de validação de documentos com IA
# Simula uma resposta do ChatGPT caso os dados informados estejam de acordo com os documentos


def mock_chatgpt_document_validation(ocr_text, form_name, form_cpf):
    """
    Simula uma resposta da IA que retorna True se nome e CPF do formulário baterem
    com os dados extraídos do documento com OCR.
    """
    normalized_name = form_name.lower()
    normalized_cpf = form_cpf.replace(".", "").replace("-", "")

    text = ocr_text.lower()
    text = text.replace(".", "").replace("-", "")

    name_found = normalized_name in text
    cpf_found = normalized_cpf in text

    return name_found and cpf_found


# Output simulado do OCR
simulated_ocr_text = """
REPÚBLICA FEDERATIVA DO BRASIL
CARTEIRA DE IDENTIDADE
Nome: Lucas Martins
CPF: 123.456.789-00
"""

# Entrada no formulário
form_name = form_data["name"]
form_cpf = form_data["cpf"]

# Simulação de validação IA
validation_result = mock_chatgpt_document_validation(
    simulated_ocr_text, form_name, form_cpf
)

from IPython.display import Markdown

display(Markdown("## Validação de documentos por IA (simulação)"))
display(Markdown(f"**Resultado:** `{validation_result}`"))

## Validação de documentos por IA (simulação)

**Resultado:** `True`

In [None]:
import requests
from bs4 import BeautifulSoup

# Define esports-related keywords
esports_keywords = [
    "furia",
    "csgo",
    "cs:go",
    "valorant",
    "league of legends",
    "lol",
    "r6",
    "rainbow six",
    "fortnite",
    "esports",
    "cblol",
    "iem",
    "major",
]


# Function to fetch page text and match keywords
def analyze_social_profile(url, keywords):
    try:
        response = requests.get(url, timeout=5, headers={"User-Agent": "Mozilla/5.0"})
        response.raise_for_status()
    except requests.RequestException:
        return {"url": url, "status": "unreachable", "keywords_found": []}

    soup = BeautifulSoup(response.text, "html.parser")
    page_text = soup.get_text(separator=" ").lower()

    matches = [kw for kw in keywords if kw in page_text]

    return {"url": url, "status": "ok", "keywords_found": matches}


# Analyze all links from the form data
social_analysis_results = [
    analyze_social_profile(link, esports_keywords) for link in form_data["social_links"]
]

# Display results as a DataFrame
import pandas as pd

social_df = pd.DataFrame(social_analysis_results)

from IPython.display import Markdown

display(Markdown("## Análise dos perfis de redes sociais"))
display(social_df)

## Análise dos perfis de redes sociais

Unnamed: 0,url,status,keywords_found
0,https://x.com/sofiaespanha,unreachable,[]
1,https://instagram.com/sofiaespanha,ok,[]


In [None]:
# Re-import necessary packages after reset
import pandas as pd
import requests
from bs4 import BeautifulSoup
from IPython.display import display, Markdown

# Restore sample user data
form_data = {
    "name": "Lucas Martins",
    "cpf": "123.456.789-00",
    "address": "Brasília, DF",
    "interests": "CS:GO, Valorant, AI in gaming",
    "activities": "Assistiu IEM Rio, participei de campeonato de CS2",
    "purchases": "Camiseta oficial FURIA Adidas preta, assinatura HLTV+",
    "social_links": ["https://twitter.com/lucas_fan", "https://instagram.com/lucas_gg"],
    "esports_links": [
        "https://liquipedia.net/counterstrike/Lucas",
        "https://steamcommunity.com/id/StrixLuke/",
    ],
}

# Esports keywords
esports_keywords = [
    "furia",
    "csgo",
    "cs:go",
    "valorant",
    "league of legends",
    "lol",
    "r6",
    "rainbow six",
    "fortnite",
    "esports",
    "cblol",
    "iem",
    "major",
]


# Esports profile validation function
def validate_esports_profile(url, user_name):
    if not url.startswith("http"):
        return {
            "link": url,
            "status": "invalid",
            "matched_keywords": [],
            "name_found": False,
        }

    try:
        response = requests.get(url, timeout=5, headers={"User-Agent": "Mozilla/5.0"})
        response.raise_for_status()
    except requests.RequestException:
        return {
            "link": url,
            "status": "unreachable",
            "matched_keywords": [],
            "name_found": False,
        }

    content = (
        BeautifulSoup(response.text, "html.parser").get_text(separator=" ").lower()
    )

    detected_keywords = [kw for kw in esports_keywords if kw in content]
    name_present = user_name.lower() in content

    return {
        "link": url,
        "status": "ok",
        "matched_keywords": detected_keywords,
        "name_found": name_present,
    }


# Analyze esports profile links
esports_profile_results = [
    validate_esports_profile(link, form_data["name"])
    for link in form_data["esports_links"]
]

# Display results
df_esports_profiles = pd.DataFrame(esports_profile_results)
display(
    Markdown("## Validação de perfis de esports com base em relevância de conteúdo")
)
display(df_esports_profiles)

## Validação de perfis de esports com base em relevância de conteúdo

Unnamed: 0,link,status,matched_keywords,name_found
0,https://liquipedia.net/counterstrike/Lucas,unreachable,[],False
1,https://steamcommunity.com/id/StrixLuke/,ok,[],False


In [None]:
import pandas as pd
import requests
from bs4 import BeautifulSoup
from IPython.display import display, Markdown

# Dados para demonstração
form_data = {
    "name": "Lucas Martins",
    "cpf": "123.456.789-00",
    "address": "Brasília, DF",
    "interests": "CS:GO, Valorant, AI in gaming",
    "activities": "Assistiu IEM Rio, participei de campeonato de CS2",
    "purchases": "Camiseta oficial FURIA Adidas preta, assinatura HLTV+",
    "social_links": ["https://twitter.com/lucas_fan", "https://instagram.com/lucas_gg"],
    "esports_links": [
        "https://liquipedia.net/counterstrike/Lucas",
        "https://steamcommunity.com/id/lucasvalorant/",
    ],
}

esports_profile_results = [
    {
        "link": "https://liquipedia.net/counterstrike/Lucas",
        "status": "ok",
        "matched_keywords": ["furia", "csgo"],
        "name_found": True,
    },
    {
        "link": "https://steamcommunity.com/id/lucasvalorant/",
        "status": "ok",
        "matched_keywords": ["valorant"],
        "name_found": False,
    },
]


def classify_fan(form_data, doc_valid, social_keywords, esports_profiles):
    score = 0
    explanation = []

    if doc_valid:
        score += 1
        explanation.append("✔️ Identidade válida")

    interests = form_data["interests"].lower()
    activities = form_data["activities"].lower()
    if any(
        kw in interests for kw in ["cs:go", "valorant", "league of legends", "esports"]
    ):
        score += 1
        explanation.append("✔️ Interesse nos principais esports")
    if "campeonato" in activities or "league" in activities or "iem" in activities:
        score += 1
        explanation.append("✔️ Frequentou ou participou de eventos")

    if social_keywords:
        score += 1
        explanation.append("✔️ Keywords de esports nas redes sociais")

    relevant_profiles = [
        profile
        for profile in esports_profiles
        if profile["status"] == "ok"
        and (profile["matched_keywords"] or profile["name_found"])
    ]
    if relevant_profiles:
        score += 1
        explanation.append("✔️ Contas em sites relevantes de esports")

    if score >= 4:
        fan_type = "🏆 Fã hardcore / Jogador competitivo"
    elif score == 3:
        fan_type = "🔥 Fã engajado"
    elif score == 2:
        fan_type = "👍 Fã casual"
    else:
        fan_type = "👀 Fã novo ou de baixo engajamento"

    return fan_type, explanation


doc_validation_passed = True
social_keywords_found = []  # Skipped social scraping
fan_type_result, fan_type_explanation = classify_fan(
    form_data, doc_validation_passed, social_keywords_found, esports_profile_results
)

display(Markdown("## Categoria de perfil"))
display(Markdown(f"**Tipo:** {fan_type_result}"))
display(Markdown("### Critérios"))
for reason in fan_type_explanation:
    display(Markdown(f"- {reason}"))

## Categoria de perfil

**Tipo:** 🏆 Fã hardcore / Jogador competitivo

### Critérios

- ✔️ Identidade válida

- ✔️ Interesse nos principais esports

- ✔️ Frequentou ou participou de eventos

- ✔️ Contas em sites relevantes de esports