In [6]:
# Importando bibliotecas
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt

In [None]:
# Inicializando dataset e visualizando itens
df = pd.read_csv('credit_card_fraud_detection.csv')
df.head()

In [8]:
# Criando função auxiliar para desenhar grafos
def criar_grafo(df, pais):
    grafo = nx.Graph()
    grafo.add_node(pais)

    # Inserindo vértices e arestas
    for i in range(len(df)):
        if df.iloc[i]['Country'] == pais:
            user_id = df.iloc[i]['User ID']
            transaction_amount = df.iloc[i]['Transaction Amount']
            grafo.add_node(user_id)
            grafo.add_edge(user_id, pais, weight=transaction_amount)

    # Retornando grafo
    return grafo

In [9]:
# Filtrando por dados fraudulentos e selecionando países
df_fraudulento = df[df['Fraudulent'] == 'Yes']
paises = df_fraudulento['Country'].unique()

In [None]:
# Visualizando grafos
for pais in paises:
    grafo = criar_grafo(df_fraudulento, pais)
    
    # Dimensionando figura e ajustando cores
    plt.figure(figsize = (8, 4))
    cor = ['orange' if node == pais else 'teal' for node in grafo.nodes()]

    # Dando nome e visualizando grafo
    nx.draw(grafo, with_labels = True, node_color = cor, edge_color = "gray", font_size = 10, node_size = 500)
    plt.title(f"Fraudulent graphs in {pais}")
    plt.show()

In [None]:
# Armazenando grafos
grafos = []
for pais in paises:
    grafos += [criar_grafo(df_fraudulento, pais)]
    print(criar_grafo(df_fraudulento, pais))

In [None]:
# Quantidade de fraudes em cada país com base no grau
for grafo in grafos:
    print(f"Grau do grafo {list(grafo.nodes)[0]}: {grafo.degree(list(grafo.nodes())[0])}")

In [None]:
# Valor total de fraudes em cada país somando o peso das arestas
for grafo in grafos:
    peso_total = sum(nx.get_edge_attributes(grafo, 'weight')[edge] for edge in grafo.edges(list(grafo.nodes)[0]))
    print(f"Peso total no(a) {list(grafo.nodes)[0]}: {peso_total:.2f}")

In [14]:
# Criando função auxiliar para desenhar grafo de perfil
def criar_grafo_perfil(df, pais):
    grafo = nx.Graph()
    grafo.add_node(pais)

    # Inserindo vértices e arestas
    for i in range(len(df)):
        if df.iloc[i]['Country'] == pais:

            # Local
            if df.iloc[i]['Transaction Location'] == 'Urban':
                if grafo.has_node('Urban'):
                    grafo['Urban'][pais]['weight'] += 1
                else:
                    grafo.add_node('Urban')
                    grafo.add_edge('Urban', pais, weight = 1)

            elif df.iloc[i]['Transaction Location'] == 'Urban':
                if grafo.has_node('Urban'):
                    grafo['Urban'][pais]['weight'] += 1
                else:
                    grafo.add_node('Urban')
                    grafo.add_edge('Urban', pais, weight = 1)

            else:
                if grafo.has_node('Urban'):
                    grafo['Urban'][pais]['weight'] += 1
                else:
                    grafo.add_node('Urban')
                    grafo.add_edge('Urban', pais, weight = 1)           

            # Gênero
            if df.iloc[i]['User Gender'] == 'Male':
                if grafo.has_node('Male'):
                    grafo['Male'][pais]['weight'] += 1
                else:
                    grafo.add_node('Male')
                    grafo.add_edge('Male', pais, weight = 1)

            elif df.iloc[i]['User Gender'] == 'Female':
                if grafo.has_node('Female'):
                    grafo['Female'][pais]['weight'] += 1
                else:
                    grafo.add_node('Female')
                    grafo.add_edge('Female', pais, weight = 1)

            # Idade
            if 18 <= df.iloc[i]['User Age'] < 30:
                if grafo.has_node('18/29'):
                    grafo['18/29'][pais]['weight'] += 1
                else:
                    grafo.add_node('18/29')
                    grafo.add_edge('18/29', pais, weight = 1)

            elif 30 <= df.iloc[i]['User Age'] < 40:
                if grafo.has_node('30/39'):
                    grafo['30/39'][pais]['weight'] += 1
                else:
                    grafo.add_node('30/39')
                    grafo.add_edge('30/39', pais, weight = 1)

            elif 40 <= df.iloc[i]['User Age'] < 50:
                if grafo.has_node('40/49'):
                    grafo['40/49'][pais]['weight'] += 1
                else:
                    grafo.add_node('40/49')
                    grafo.add_edge('40/49', pais, weight = 1)
                    
            elif 50 <= df.iloc[i]['User Age'] < 60:
                if grafo.has_node('50/59'):
                    grafo['50/59'][pais]['weight'] += 1
                else:
                    grafo.add_node('50/59')
                    grafo.add_edge('50/59', pais, weight = 1)

            elif 60 <= df.iloc[i]['User Age'] < 70:
                if grafo.has_node('60/69'):
                    grafo['60/69'][pais]['weight'] += 1
                else:
                    grafo.add_node('60/69')
                    grafo.add_edge('60/69', pais, weight = 1)

            else:
                if grafo.has_node('70/80'):
                    grafo['70/80'][pais]['weight'] += 1
                else:
                    grafo.add_node('70/80')
                    grafo.add_edge('70/80', pais, weight = 1)

        

    # Retornando grafo
    return grafo

In [47]:
# Paises com mais fraudes (em relação a quantidade e valor)
paises_mais_fraudados = ['USA', 'Brazil', 'Japan']

# Criando grafos de perfil
grafos_perfil = []
for pais in paises_mais_fraudados:
    grafos_perfil += [criar_grafo_perfil(df_fraudulento, pais)]
    print(criar_grafo_perfil(df_fraudulento, pais))

Graph with 10 nodes and 9 edges
Graph with 10 nodes and 9 edges
Graph with 10 nodes and 9 edges


In [None]:
# Visualizando grafos de perfil
for pais in paises_mais_fraudados:
    grafo_perfil = criar_grafo_perfil(df_fraudulento, pais)
    
    # Dimensionando figura e ajustando cores
    plt.figure(figsize=(8, 4))
    cor = []
    for node in grafo_perfil.nodes():
        if node == pais:
            cor.append('orange')
        elif node[2] == '/':
            cor.append('teal')
        elif node == 'Male' or node == 'Female':
            cor.append('green')
        else:
            cor.append('red')

    # Criando um dicionário com os pesos das arestas
    labels = nx.get_edge_attributes(grafo_perfil, 'weight')

    # Dando nome e visualizando grafo
    pos = nx.spring_layout(grafo_perfil)  # Calcula a posição dos nós
    nx.draw(grafo_perfil, with_labels = True, node_color = cor, edge_color = "gray", font_size = 10, node_size = 500, pos = pos)
    
    # Desenhando os rótulos das arestas no meio
    nx.draw_networkx_edge_labels(grafo_perfil, pos=pos, edge_labels=labels, font_size=8)
    
    plt.title(f"Profile graph in {pais}")
    plt.show()