In [1]:
import pandas as pd

In [2]:
# Criar um DataFrame com dados de diagnóstico médico
data = {'sintoma1': [1, 0, 1, 1],
        'sintoma2': [0, 1, 1, 0],
        'condicao': ['A', 'B', 'A', 'B']}
df_med = pd.DataFrame(data)
df_med

Unnamed: 0,sintoma1,sintoma2,condicao
0,1,0,A
1,0,1,B
2,1,1,A
3,1,0,B


In [3]:
# Criar um DataFrame com dados de e-mails
data = {'palavra1': [1, 0, 1, 1],
        'palavra2': [0, 1, 0, 1],
        'palavra3': [0, 1, 1, 0],
        'spam': [1, 1, 0, 0]}
df_mail = pd.DataFrame(data)
df_mail

Unnamed: 0,palavra1,palavra2,palavra3,spam
0,1,0,0,1
1,0,1,1,1
2,1,0,1,0
3,1,1,0,0


# Classificação com "LogisticRegression"

In [4]:
from sklearn.linear_model import LogisticRegression

### Diagnóstico (Classificação) da doença com base em sintomas

In [5]:
# Separar os recursos (X) e a variável de destino (y)
X = df_med[['sintoma1', 'sintoma2']]
y = df_med['condicao']

# Treinar o modelo de árvore de decisão
model = LogisticRegression()
model.fit(X, y)

# Diagnosticar uma nova pessoa com base em sintomas
new_patient = pd.DataFrame({'sintoma1': [1], 'sintoma2': [0]})
predicted_condition = model.predict(new_patient)

print(f'A previsão da condição baseado nos sintomas é: "{predicted_condition[0]}"')

A previsão da condição baseado nos sintomas é: "A"


### Classificação de e-mails como "spam" ou "não spam" com base em palavras-chave e características do e-mail

In [6]:
# Separar os recursos (X) e a variável de destino (y)
X = df_mail[['palavra1', 'palavra2', 'palavra3']]
y = df_mail['spam']

# Treinar o modelo de regressão logística
model = LogisticRegression()
model.fit(X, y)

# Classificar um novo e-mail como spam ou não spam
new_email = pd.DataFrame({'palavra1': [1], 'palavra2': [0], 'palavra3': [1]})
predicted_class = model.predict(new_email)
print('é Spam' if predicted_class[0] > 0 else 'NÃO é Spam')

NÃO é Spam


# Classificação com Árvore de decisão 

In [7]:
from sklearn.tree import DecisionTreeClassifier

### Diagnóstico (Classificação) da doença com base em sintomas

In [8]:
# Separar os recursos (X) e a variável de destino (y)
X = df_mail[['palavra1', 'palavra2', 'palavra3']]
y = df_mail['spam']

# Treinar o modelo de regressão logística
model = DecisionTreeClassifier()
model.fit(X, y)

# Classificar um novo e-mail como spam ou não spam
new_email = pd.DataFrame({'palavra1': [1], 'palavra2': [0], 'palavra3': [1]})
predicted_class = model.predict(new_email)
'é Spam' if predicted_class[0] > 0 else 'NÃO é Spam'

'NÃO é Spam'

### Classificação de e-mails como "spam" ou "não spam" com base em palavras-chave e características do e-mail

In [9]:
# Separar os recursos (X) e a variável de destino (y)
X = df_med[['sintoma1', 'sintoma2']]
y = df_med['condicao']

# Treinar o modelo de árvore de decisão
model = DecisionTreeClassifier()
model.fit(X, y)

# Diagnosticar uma nova pessoa com base em sintomas
new_patient = pd.DataFrame({'sintoma1': [1], 'sintoma2': [0]})
predicted_condition = model.predict(new_patient)

print(f'A previsão da condição baseado nos sintomas é: "{predicted_condition[0]}"')

A previsão da condição baseado nos sintomas é: "A"
