Projeto Final da Imersão de Dados 3

Prevendo os Mecânismos de Ação com uma Rede Neural

A farmacológia é uma área de extrema importância, na qual elea irá fazer o estudo das substâncias quimicas e como elas interagem com sistemas orgânicos. Através desse estudo, é possivel entender quais os Mecânismos de Ação são ativados ao usar um certo tipo de droga/composto, e consequêntemente criar novos farmacos que ajudem as pessoas. Entretanto, devido ao número imensuravel de genes e celular que compõem este estudo se torna inviavel o uma rapida criação de farmacos, e por isso, com o uso de tecnicas de Aprendizado de Máquinas é possivel agilizar a procurar por novos farmacos.

Para fazer uma análise sobre esses mecânismos de ação, como também os genes e as celulas do experimento foi-se utilziada uma base de dados que pode ser encontrada na referência [1]

Link onde pode ser encontrado as analises e modelos: https://colab.research.google.com/drive/1GlSjWrjwyL9i00NmP1VrTEgl6yztGJON?usp=sharing

1. Bibliotecas utilizadas

As bibliotecas de visualização e manipulação de dados são

Seaborn
Matplolib
Plotly

As Bibliotecas de criação de modelos de Aprendizado de Máquina são

Tensorflow
Scikit-Learn

2. Breve informações sobre os dados

Antes de fazermos o modelo é ideal que façamos um analise e uma breve impeção. Vejamos que para essa base de dados em relação a feature 'tratamento' não há um equilibrio, etretanto em relação a feature 'dose' há um balanço entre os valores.

3. Analise dos compostos/drogas utilizados

Agora que sabemos quais são as caracteristicas/features e targets do nosso modelo, vamos nós aprofundar mais em algumas features do nosso modelo. Primeiramene vamos analisar os compostos utilizados, note que nossa base de dados há uma feature onde os exemplos podem ser 'Com droga' ou 'com controle', então temos que fazer um filtro onde apenas há informações com o uso de compostos. E em seguida iremos pegar apenas os compostos mais frequêntes.

4. Analisando os Genes

Agora que entendemos um pouco sobre os principais compostos utilizados nos experimentos, vamos entender melhor sobre alguns genes presentes na nossa base de dados. Iremos entender melhor como os genes se comportam em relação a outros genes e até mesmo em relação a features como 'Dose' e 'Tempo'.

4.1 Gene 0

Para maiores detalhes olhar o notebook presente neste repositório.

5. Analisando as Células

Em comparação com os Genes, a curva dos histogramas das Células tendiam mais para a direita, diferente dos Genes que se mantiam relativamente no meio. Isso nos diz que a média, na curva das células, está deslocada a direita.

Ambas as Células 0 e 2 obtiveram resultados parecidos, no qual a relação deles com os genes 0, 2 e 8 são parecidas, de forma que o gene 0 tem uma relação linear negativa, o gene 2 possui um relação linear neutra e o 8 possui uma relação linear positiva.

Para maiores detalhes olhar o notebook presente neste repositório.

6. Criando o Modelo de Rede Neural

Antes de criar um modelo, iremos juntas as duas base de dados, a base de dados de experimentos (features) e a base de dados de resultados (target), lembrando que a base de daos de resultados é a que possuia a informação dos mecânismos de ação. Iremos juntar as bases de dados pelo 'ID' das bases.

O objetivo desse modelo é prever quais Mecanismos de Ação foram ativados

Para este ddesafio foram criados dois modelos, o primeiro é um modelo que irá tentar prever todos os target da base de dados de resultados, enquanto o segundo modelo irá prever apenas o primeiro target dessa mesm base de dados. Foram usamos o mesmo tipo de modelo para resolver ambos os problemas, o modelo pode ser visto na Figura logo abaixo, e em ambos, os resultados foram otimos. Lembrando que o modelo de rede neural contruido aqui foi para resolver um problema de classificação binária, no qual o modelo irá prever se aquele target foi sim ou não ativado.

7. Conclusão

Por fim, podemos conluir que um simples modelo de Rede neural consegue muito bem resolver o problema em questão, tanto usando multiplos target como também apenas um target. Ambos os modelos obteram acurácias de .99, tanto a acuária do no set de treinamento como o de validação/treino.

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
Dados		Dados
1.PNG		1.PNG
10.PNG		10.PNG
11.PNG		11.PNG
2.PNG		2.PNG
3.PNG		3.PNG
4.PNG		4.PNG
5.PNG		5.PNG
6.PNG		6.PNG
7.PNG		7.PNG
8.PNG		8.PNG
9.PNG		9.PNG
90.PNG		90.PNG
91.PNG		91.PNG
92.PNG		92.PNG
93.PNG		93.PNG
ProjetoFinal_Imersão_dado3.ipynb		ProjetoFinal_Imersão_dado3.ipynb
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projeto Final da Imersão de Dados 3

Prevendo os Mecânismos de Ação com uma Rede Neural

1. Bibliotecas utilizadas

2. Breve informações sobre os dados

3. Analise dos compostos/drogas utilizados

4. Analisando os Genes

4.1 Gene 0

5. Analisando as Células

6. Criando o Modelo de Rede Neural

7. Conclusão

REFERENCIAS

About

Releases

Packages

Languages

CommanderErika/imersao-dados-desafio-final

Folders and files

Latest commit

History

Repository files navigation

Projeto Final da Imersão de Dados 3

Prevendo os Mecânismos de Ação com uma Rede Neural

1. Bibliotecas utilizadas

2. Breve informações sobre os dados

3. Analise dos compostos/drogas utilizados

4. Analisando os Genes

4.1 Gene 0

5. Analisando as Células

6. Criando o Modelo de Rede Neural

7. Conclusão

REFERENCIAS

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages