In [1]:
from IPython.display import display, Markdown
import pandas as pd

# 1
intro_text = """
# Know Your Fan - FURIA Challenge (Notebook Version)

Este caderno simula uma solu√ß√£o orientada a dados que coleta e analisa informa√ß√£o sobre f√£s de esports. O objetivo √© explorar como uma equipe como a FURIA pode entender melhor seus f√£s para oferecer servi√ßos mais focados e adaptados √†s suas necessidades.

O que faremos:

1. Simular dados de entrada (informa√ß√£o b√°sica, interesses, links pessoais)
2. Enriquecer os dados (validar documentos, scraping de redes sociais, links de esports)
3. Analisar os dados (categorizar comportamento do f√£, relev√¢ncia de conte√∫dos)
4. Exportar um perfil estruturado.

---
"""

# 2 - simulando dados de entrada
form_data = {
    "name": "Sofia Espanha",
    "cpf": "123.456.789-00",
    "address": "S√£o Paulo, SP",
    "interests": "CS2, Valorant, League of Legends",
    "activities": "Assisti IEM Rio, participei de campeonato de CS2",
    "purchases": "Camiseta oficial FURIA Adidas preta, assinatura HLTV+",
    "social_links": [
        "https://x.com/sofiaespanha",
        "https://instagram.com/sofiaespanha",
    ],
    "esports_links": [
        "https://liquipedia.net/counterstrike/sofiaespanha",
        "https://steamcommunity.com/id/sofiaespanha/",
    ],
}

form_df = pd.DataFrame([form_data])

# Mostrar se√ß√µes iniciais
display(Markdown(intro_text))
display(Markdown("## Simulated User Input"))
display(form_df)


# Know Your Fan - FURIA Challenge (Notebook Version)

Este caderno simula uma solu√ß√£o orientada a dados que coleta e analisa informa√ß√£o sobre f√£s de esports. O objetivo √© explorar como uma equipe como a FURIA pode entender melhor seus f√£s para oferecer servi√ßos mais focados e adaptados √†s suas necessidades.

O que faremos:

1. Simular dados de entrada (informa√ß√£o b√°sica, interesses, links pessoais)
2. Enriquecer os dados (validar documentos, scraping de redes sociais, links de esports)
3. Analisar os dados (categorizar comportamento do f√£, relev√¢ncia de conte√∫dos)
4. Exportar um perfil estruturado.

---


## Simulated User Input

Unnamed: 0,name,cpf,address,interests,activities,purchases,social_links,esports_links
0,Sofia Espanha,123.456.789-00,"S√£o Paulo, SP","CS2, Valorant, League of Legends","Assisti IEM Rio, participei de campeonato de CS2","Camiseta oficial FURIA Adidas preta, assinatur...","[https://x.com/sofiaespanha, https://instagram...",[https://liquipedia.net/counterstrike/sofiaesp...


In [2]:
# Step 3: Simula√ß√£o de valida√ß√£o de documentos com IA
# Simula uma resposta do ChatGPT caso os dados informados estejam de acordo com os documentos


def mock_chatgpt_document_validation(ocr_text, form_name, form_cpf):
    """
    Simula uma resposta da IA que retorna True se nome e CPF do formul√°rio baterem
    com os dados extra√≠dos do documento com OCR.
    """
    normalized_name = form_name.lower()
    normalized_cpf = form_cpf.replace(".", "").replace("-", "")

    text = ocr_text.lower()
    text = text.replace(".", "").replace("-", "")

    name_found = normalized_name in text
    cpf_found = normalized_cpf in text

    return name_found and cpf_found


# Output simulado do OCR
simulated_ocr_text = """
REP√öBLICA FEDERATIVA DO BRASIL
CARTEIRA DE IDENTIDADE
Nome: Sofia Espanha
CPF: 123.456.789-00
"""

# Entrada no formul√°rio
form_name = form_data["name"]
form_cpf = form_data["cpf"]

# Simula√ß√£o de valida√ß√£o IA
validation_result = mock_chatgpt_document_validation(
    simulated_ocr_text, form_name, form_cpf
)

from IPython.display import Markdown

display(Markdown("## Valida√ß√£o de documentos por IA (simula√ß√£o)"))
display(Markdown(f"**Resultado:** `{validation_result}`"))

## Valida√ß√£o de documentos por IA (simula√ß√£o)

**Resultado:** `True`

In [4]:
import requests
from bs4 import BeautifulSoup

# Defini√ß√£o de keyords sobre esports
esports_keywords = [
    "furia",
    "csgo",
    "cs:go",
    "valorant",
    "league of legends",
    "lol",
    "r6",
    "rainbow six",
    "fortnite",
    "esports",
    "cblol",
    "iem",
    "major",
]


# Extrair texto da p√°gina e encontrar keywords
def analyze_social_profile(url, keywords):
    try:
        response = requests.get(url, timeout=5, headers={"User-Agent": "Mozilla/5.0"})
        response.raise_for_status()
    except requests.RequestException:
        return {"url": url, "status": "unreachable", "keywords_found": []}

    soup = BeautifulSoup(response.text, "html.parser")
    page_text = soup.get_text(separator=" ").lower()

    matches = [kw for kw in keywords if kw in page_text]

    return {"url": url, "status": "ok", "keywords_found": matches}


# An√°lise dos links
social_analysis_results = [
    analyze_social_profile(link, esports_keywords) for link in form_data["social_links"]
]

# Mostrar resultados
import pandas as pd

social_df = pd.DataFrame(social_analysis_results)

from IPython.display import Markdown

display(Markdown("## An√°lise dos perfis de redes sociais"))
display(social_df)

## An√°lise dos perfis de redes sociais

Unnamed: 0,url,status,keywords_found
0,https://x.com/sofiaespanha,unreachable,[]
1,https://instagram.com/sofiaespanha,unreachable,[]


In [5]:
import pandas as pd
import requests
from bs4 import BeautifulSoup
from IPython.display import display, Markdown

# Dados para demonstra√ß√£o
form_data = {
    "name": "Sofia Espanha",
    "cpf": "123.456.789-00",
    "address": "S√£o Paulo, SP",
    "interests": "CS2, Valorant, League of Legends",
    "activities": "Assisti IEM Rio, participei de campeonato de CS2",
    "purchases": "Camiseta oficial FURIA Adidas preta, assinatura HLTV+",
    "social_links": [
        "https://x.com/sofiaespanha",
        "https://instagram.com/sofiaespanha",
    ],
    "esports_links": [
        "https://liquipedia.net/counterstrike/sofiaespanha",
        "https://steamcommunity.com/id/sofiaespanha/",
    ],
}

# Esports keywords
esports_keywords = [
    "furia",
    "csgo",
    "cs:go",
    "valorant",
    "league of legends",
    "lol",
    "r6",
    "rainbow six",
    "fortnite",
    "esports",
    "cblol",
    "iem",
    "major",
]


# Valida√ß√£o de perfis em sites de esports
def validate_esports_profile(url, user_name):
    if not url.startswith("http"):
        return {
            "link": url,
            "status": "invalid",
            "matched_keywords": [],
            "name_found": False,
        }

    try:
        response = requests.get(url, timeout=5, headers={"User-Agent": "Mozilla/5.0"})
        response.raise_for_status()
    except requests.RequestException:
        return {
            "link": url,
            "status": "unreachable",
            "matched_keywords": [],
            "name_found": False,
        }

    content = (
        BeautifulSoup(response.text, "html.parser").get_text(separator=" ").lower()
    )

    detected_keywords = [kw for kw in esports_keywords if kw in content]
    name_present = user_name.lower() in content

    return {
        "link": url,
        "status": "ok",
        "matched_keywords": detected_keywords,
        "name_found": name_present,
    }


# An√°lise dos perfis em sites de esports
esports_profile_results = [
    validate_esports_profile(link, form_data["name"])
    for link in form_data["esports_links"]
]

# Resultados
df_esports_profiles = pd.DataFrame(esports_profile_results)
display(
    Markdown("## Valida√ß√£o de perfis de esports com base em relev√¢ncia de conte√∫do")
)
display(df_esports_profiles)

## Valida√ß√£o de perfis de esports com base em relev√¢ncia de conte√∫do

Unnamed: 0,link,status,matched_keywords,name_found
0,https://liquipedia.net/counterstrike/sofiaespanha,unreachable,[],False
1,https://steamcommunity.com/id/sofiaespanha/,ok,[furia],True


In [6]:
import pandas as pd
import requests
from bs4 import BeautifulSoup
from IPython.display import display, Markdown

# Dados para demonstra√ß√£o
form_data = {
    "name": "Sofia Espanha",
    "cpf": "123.456.789-00",
    "address": "S√£o Paulo, SP",
    "interests": "CS2, Valorant, League of Legends",
    "activities": "Assisti IEM Rio, participei de campeonato de CS2",
    "purchases": "Camiseta oficial FURIA Adidas preta, assinatura HLTV+",
    "social_links": [
        "https://x.com/sofiaespanha",
        "https://instagram.com/sofiaespanha",
    ],
    "esports_links": [
        "https://liquipedia.net/counterstrike/sofiaespanha",
        "https://steamcommunity.com/id/sofiaespanha/",
    ],
}

esports_profile_results = [
    {
        "link": "https://liquipedia.net/counterstrike/Lucas",
        "status": "ok",
        "matched_keywords": ["furia", "csgo"],
        "name_found": True,
    },
    {
        "link": "https://steamcommunity.com/id/lucasvalorant/",
        "status": "ok",
        "matched_keywords": ["valorant"],
        "name_found": False,
    },
]


def classify_fan(form_data, doc_valid, social_keywords, esports_profiles):
    score = 0
    explanation = []

    if doc_valid:
        score += 1
        explanation.append("‚úîÔ∏è Identidade v√°lida")

    interests = form_data["interests"].lower()
    activities = form_data["activities"].lower()
    if any(
        kw in interests for kw in ["cs:go", "valorant", "league of legends", "esports"]
    ):
        score += 1
        explanation.append("‚úîÔ∏è Interesse nos principais esports")
    if "campeonato" in activities or "league" in activities or "iem" in activities:
        score += 1
        explanation.append("‚úîÔ∏è Frequentou ou participou de eventos")

    if social_keywords:
        score += 1
        explanation.append("‚úîÔ∏è Keywords de esports nas redes sociais")

    relevant_profiles = [
        profile
        for profile in esports_profiles
        if profile["status"] == "ok"
        and (profile["matched_keywords"] or profile["name_found"])
    ]
    if relevant_profiles:
        score += 1
        explanation.append("‚úîÔ∏è Contas em sites relevantes de esports")

    if score >= 4:
        fan_type = "üèÜ F√£ hardcore / Jogador competitivo"
    elif score == 3:
        fan_type = "üî• F√£ engajado"
    elif score == 2:
        fan_type = "üëç F√£ casual"
    else:
        fan_type = "üëÄ F√£ novo ou de baixo engajamento"

    return fan_type, explanation


doc_validation_passed = True
social_keywords_found = []  # Sem an√°lise de redes sociais - c√≥digo de demonstra√ß√£o
fan_type_result, fan_type_explanation = classify_fan(
    form_data, doc_validation_passed, social_keywords_found, esports_profile_results
)

display(Markdown("## Categoria de perfil"))
display(Markdown(f"**Tipo:** {fan_type_result}"))
display(Markdown("### Crit√©rios"))
for reason in fan_type_explanation:
    display(Markdown(f"- {reason}"))

## Categoria de perfil

**Tipo:** üèÜ F√£ hardcore / Jogador competitivo

### Crit√©rios

- ‚úîÔ∏è Identidade v√°lida

- ‚úîÔ∏è Interesse nos principais esports

- ‚úîÔ∏è Frequentou ou participou de eventos

- ‚úîÔ∏è Contas em sites relevantes de esports