Inspiradas em uma análise independente com dados do GitHub, Mila e Vivi resolveram desenvolver um programa que a partir dos seus atributos faciais, diz as top 5 linguagens que você se parece/programa/codifica. Claro que não tem nenhum valor preditivo real. Temos que concordar que não existe "cara de programador(a) C#". Mas o experimento serve para entender a tecnologia por trás, saber um pouco de viés de dados, e o melhor de tudo: se divertir!
O site do app é: https://face-linguagem.anvil.app. Corre lá e descobre o que o seu rosto diz sobre as linguagens que você programa! Como usamos muitos serviços gratuitos, os servidores são um pouco lentos.
Vamos às tecnologias! Todo o pipeline foi desenvolvido com:
- Python
- Essa biblioteca do Python para acessar a API de Face da Microsoft.
- Scikit-Learn para treinar um modelo bayesiano simples
- Pandas e Seaborn para realizar as análises!
- O script foi hospedado na versão gratuita Heroku (seguimos esse tutorial).
- A interface foi desenvolvida em Python na plataforma gratuita Anvil
A base de dados foi feita com base nos trendings do GitHub paras as seguintes linguagens: C, C++, C#, Python, Ruby, R, Go, Swift, HTML (hehe), PHP, JavaScript e Java.
Os atributos da face são extraídos com a API Microsoft Face e o modelo de predição é bayesiano.
Com que linguagem a Ada Lovelace se parece?
E o Alan Turing?
E o nosso querido Drauzio Varella?
Se não estiver acessível, por favor nos infome para que a gente arrume! Ah! A API usada só retorna os gêneros Masculino e Feminino, por isso apenas eles são indicados.
- bayes_model.pkl : Inferência bayesiana
- github_stereotype.py : Conexão com o Anvil (Interface)
- github_stereotype.ipynb : Análise dos dados
- linguagens.txt : Linguagens inclusas na análise
- requirements.txt : Bibliotecas necessárias