Skip to content

Criando uma Rede Neural para resolve um problema de classificação binária para os Mecanismos de Ação.

Notifications You must be signed in to change notification settings

CommanderErika/imersao-dados-desafio-final

 
 

Repository files navigation

Projeto Final da Imersão de Dados 3

Prevendo os Mecânismos de Ação com uma Rede Neural

A farmacológia é uma área de extrema importância, na qual elea irá fazer o estudo das substâncias quimicas e como elas interagem com sistemas orgânicos. Através desse estudo, é possivel entender quais os Mecânismos de Ação são ativados ao usar um certo tipo de droga/composto, e consequêntemente criar novos farmacos que ajudem as pessoas. Entretanto, devido ao número imensuravel de genes e celular que compõem este estudo se torna inviavel o uma rapida criação de farmacos, e por isso, com o uso de tecnicas de Aprendizado de Máquinas é possivel agilizar a procurar por novos farmacos.

Para fazer uma análise sobre esses mecânismos de ação, como também os genes e as celulas do experimento foi-se utilziada uma base de dados que pode ser encontrada na referência [1]

Link onde pode ser encontrado as analises e modelos: https://colab.research.google.com/drive/1GlSjWrjwyL9i00NmP1VrTEgl6yztGJON?usp=sharing

1. Bibliotecas utilizadas

As bibliotecas de visualização e manipulação de dados são

  • Seaborn
  • Matplolib
  • Plotly

As Bibliotecas de criação de modelos de Aprendizado de Máquina são

  • Tensorflow
  • Scikit-Learn

2. Breve informações sobre os dados

Antes de fazermos o modelo é ideal que façamos um analise e uma breve impeção. Vejamos que para essa base de dados em relação a feature 'tratamento' não há um equilibrio, etretanto em relação a feature 'dose' há um balanço entre os valores.

Figura 1

Figura 2

3. Analise dos compostos/drogas utilizados

Agora que sabemos quais são as caracteristicas/features e targets do nosso modelo, vamos nós aprofundar mais em algumas features do nosso modelo. Primeiramene vamos analisar os compostos utilizados, note que nossa base de dados há uma feature onde os exemplos podem ser 'Com droga' ou 'com controle', então temos que fazer um filtro onde apenas há informações com o uso de compostos. E em seguida iremos pegar apenas os compostos mais frequêntes.

Figura 3

4. Analisando os Genes

Agora que entendemos um pouco sobre os principais compostos utilizados nos experimentos, vamos entender melhor sobre alguns genes presentes na nossa base de dados. Iremos entender melhor como os genes se comportam em relação a outros genes e até mesmo em relação a features como 'Dose' e 'Tempo'.

4.1 Gene 0

Figura 4

Figura 5

Figura 6

Figura 4

Figura 5

Figura 6

Para maiores detalhes olhar o notebook presente neste repositório.

5. Analisando as Células

Em comparação com os Genes, a curva dos histogramas das Células tendiam mais para a direita, diferente dos Genes que se mantiam relativamente no meio. Isso nos diz que a média, na curva das células, está deslocada a direita.

Ambas as Células 0 e 2 obtiveram resultados parecidos, no qual a relação deles com os genes 0, 2 e 8 são parecidas, de forma que o gene 0 tem uma relação linear negativa, o gene 2 possui um relação linear neutra e o 8 possui uma relação linear positiva.

Para maiores detalhes olhar o notebook presente neste repositório.

6. Criando o Modelo de Rede Neural

Antes de criar um modelo, iremos juntas as duas base de dados, a base de dados de experimentos (features) e a base de dados de resultados (target), lembrando que a base de daos de resultados é a que possuia a informação dos mecânismos de ação. Iremos juntar as bases de dados pelo 'ID' das bases.

O objetivo desse modelo é prever quais Mecanismos de Ação foram ativados

Para este ddesafio foram criados dois modelos, o primeiro é um modelo que irá tentar prever todos os target da base de dados de resultados, enquanto o segundo modelo irá prever apenas o primeiro target dessa mesm base de dados. Foram usamos o mesmo tipo de modelo para resolver ambos os problemas, o modelo pode ser visto na Figura logo abaixo, e em ambos, os resultados foram otimos. Lembrando que o modelo de rede neural contruido aqui foi para resolver um problema de classificação binária, no qual o modelo irá prever se aquele target foi sim ou não ativado.

Figura 5

Figura 6

Figura 6

Figura 6

7. Conclusão

Por fim, podemos conluir que um simples modelo de Rede neural consegue muito bem resolver o problema em questão, tanto usando multiplos target como também apenas um target. Ambos os modelos obteram acurácias de .99, tanto a acuária do no set de treinamento como o de validação/treino.

REFERENCIAS

About

Criando uma Rede Neural para resolve um problema de classificação binária para os Mecanismos de Ação.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages

  • Jupyter Notebook 100.0%