## Analizador de projetos Sonar
O analisador for criado para que pudessemos rodar análises do Sonar usando diferentes abordagens como descrito em https://docs.sonarqube.org/latest/analysis/overview/. Os _scanners_ disponíveis são:
* SonarScanner for Gradle
* SonarScanner for MSBuild
* SonarScanner for Maven
* SonarScanner for Jenkins
* SonarScanner for Ant
* SonarScanner

O código foi feito de forma que pudesse ser usado tanto na linha de comando quando como um módulo no _Python_. Para cada um dos item acima, são passados parâmetros diferentes para que análise ocorra com sucesso, além de parâmetros de configuração. Um exemplo de execução seria:
```
python -m auto_sonar -p ../sonar-scanning-examples/sonarqube-scanner-maven/ -s maven -u http://mysonarinstance.com:9000 -t my_secret_token_for_sonar -k my_project_key
```
O comando
```bash
python -m auto_sonar -h
```
pode listar todos as opções disponíveis:
```
usage: auto_sonar [-h] [-p PATH] [-s {msbuild,maven,gradle,ant,sonar_scanner}]
                  [-u URL] [-t TOKEN] [-k PROJECT_KEY]

Auto Analyser for sonar

optional arguments:
  -h, --help            show this help message and exit
  -p PATH, --path PATH
  -s {msbuild,maven,gradle,ant,sonar_scanner}, --scanner {msbuild,maven,gradle,ant,sonar_scanner}
  -u URL, --url URL
  -t TOKEN, --token TOKEN
  -k PROJECT_KEY, --project_key PROJECT_KEY
```

O módulo também pode ser importado no _Python_ da seguinte maneira para ser usado em outro projeto:
```python
# The scanner list is at auto_sonar.SCANNER_LIST
from auto_sonar import AutoSonar

auto_s = AutoSonar(
    project_path='../sonar-scanning-examples/sonarqube-scanner-gradle/',
    scanner='gradle',
    url='...'
    token='...'
    key='...')

auto_s.run()
```

Os requisitos para a análise acontecer são:
* _Python 3.7_ instalado
* Projeto a ser análisado
* Instância do Sonar rodando e pronta para receber análises

## Exploração de dados gerados pela análise de um projeto com o Sonar

Podemos configurar o Sonar para gerar dados em um banco de dados Postgres (por padrão são salvos no H2 Database) para que as análises sejam exploradas usando queries SQL. Uma das formas é executar _containers_ tanto do Postgres quanto do Sonar usando o seguinte `docker-compose.yml`:
```yml
version: '3'

services:
  pg:
    image: postgres
    ports:
    - "5432:5432"
    environment:
      POSTGRES_PASSWORD: sonar
      POSTGRES_USER: sonar
  sonar:
    image: sonarqube
    ports:
    - "9000:9000"
    environment:
      sonar.jdbc.username: sonar
      sonar.jdbc.password: sonar
      sonar.jdbc.url: jdbc:postgresql://pg:5432/sonar
    depends_on:
    - pg
```

Assim, a conexão com o banco estará disponível na porta 5432 e com a instância do Sonar na 9000.


Algumas das tabelas geradas são especialmente importantes quando pensamos em identificar e priorizar dívidas técnicas. A lista abaixo as relaciona com uma explicação concisa de seu conteúdo:
* `rules`
    * Possui todas as regras de qualidade de código que podem se quebradas por alguma dívida técnica, por exemplo: "Strings should not contain new lines".
    * A coluna `name` indica o nome da regra que deve ser respeitada.
* `issues`
    * Relaciona dívidas técnicas de um projeto ou arquivo com uma regra (tabela `rules`) através da coluna `rule_id`.
    * Coluna `severity` indica a gravidade e `message` a descrição e `component_uuid` é uma chave estrangeira para a tabela `projects`.
* `metrics`
    * Contém todas as métricas que podem ser extraídas de um determinado arquivo ou projeto.
    * A coluna `name` contém o nome da métrica e `val_type` o tipo do valor (inteiro, float, etc...).
* `live_metrics`
    * Contém as métricas de arquivos ou projetos.
    * A coluna `metric_id` referencia um registro da tabela `metrics`, `component_uuid` referencia um arquivo e `value` indica o valor numérico da métrica.
* `projects`
    * Todos os arquivos do projeto identificados unicamente pela coluna `uuid`.
    * A coluna `name` contém o nome do arquivo e `scope` indica o tipo do arquivo.

## Isolando métricas de arquivos por dívidas técnicas de determinados tipos
Usando os dados preenchidos pelo Sonar nas tabelas, podemos pensar em relacionar métricas de arquivos com dívidas técnicas presentes neles.
Foram análisadas as métricas `nloc` e `complexity`; com as dívidas do tipo `BLOCKER` e `CRITICAL`. Os projetos escolhidos foram o Maven e o Ant (por enquanto).

Os principais dados dos dois projetos estão sintetizados abaixo:

In [25]:
# Dívidas Técnicas mais presentes e suas métricas para o projeto Ant

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,count,mean,std,min,25%,50%,75%,max
rule_id,name,metric,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
5510,Cognitive Complexity of methods should not be too high,ncloc,292.0,541.84589,404.334276,53.0,248.25,434.0,710.5,1667.0
5510,Cognitive Complexity of methods should not be too high,complexity,292.0,130.458904,98.710039,9.0,57.75,107.0,177.0,401.0
5370,Handling files is security-sensitive,ncloc,197.0,493.467005,358.039097,15.0,231.0,391.0,721.0,1667.0
5370,Handling files is security-sensitive,complexity,197.0,116.771574,91.529596,4.0,49.0,80.0,179.0,401.0
5413,Methods should not be empty,ncloc,128.0,260.648438,269.51831,5.0,85.0,151.0,289.0,1193.0
5413,Methods should not be empty,complexity,128.0,57.476562,61.94981,1.0,21.0,31.5,62.0,293.0
5098,String literals should not be duplicated,ncloc,119.0,545.529412,395.591722,22.0,249.0,434.0,758.0,1667.0
5098,String literals should not be duplicated,complexity,119.0,129.033613,97.491758,3.0,61.0,99.0,173.5,401.0
5297,Dynamically executing code is security-sensitive,ncloc,80.0,297.3125,283.405135,32.0,90.0,191.0,388.0,1245.0
5297,Dynamically executing code is security-sensitive,complexity,80.0,63.4375,67.151603,2.0,16.5,40.0,80.75,295.0


In [37]:
# Dívidas Técnicas mais presentes e suas métricas para o projeto Maven

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,count,mean,std,min,25%,50%,75%,max
rule_id,name,metric,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
5510,Cognitive Complexity of methods should not be too high,ncloc,110.0,520.745455,379.616041,50.0,205.25,438.5,724.0,1404.0
5510,Cognitive Complexity of methods should not be too high,complexity,110.0,90.309091,72.819463,8.0,34.0,63.0,125.0,314.0
5413,Methods should not be empty,ncloc,93.0,211.731183,205.52193,44.0,106.0,211.0,211.0,1404.0
5413,Methods should not be empty,complexity,93.0,52.956989,41.182762,10.0,29.0,62.0,62.0,314.0
5370,Handling files is security-sensitive,ncloc,79.0,509.822785,455.047187,24.0,166.0,347.0,762.0,1404.0
5370,Handling files is security-sensitive,complexity,79.0,84.974684,81.440237,0.0,26.0,58.0,123.5,314.0
5098,String literals should not be duplicated,ncloc,72.0,723.291667,781.323659,53.0,186.5,482.0,946.0,2693.0
5098,String literals should not be duplicated,complexity,72.0,148.277778,195.60518,3.0,29.75,61.5,190.0,664.0
5290,Constants should not be defined in interfaces,ncloc,46.0,36.108696,83.96672,6.0,10.0,14.0,27.0,568.0
5290,Constants should not be defined in interfaces,complexity,46.0,3.282609,20.658776,0.0,0.0,0.0,0.0,140.0


Também podemos obter as metricas de todos os arquivos do projeto para termos uma comparação:

* Ant
    * `complexity`
        * count    923.000000
        * mean      27.565547
        * std       43.122798
        * min        0.000000
        * 25%        4.000000
        * 50%       13.000000
        * 75%       31.000000
        * max      401.000000
    * `nloc`
        * count     925.000000
        * mean      121.480000
        * std       176.656522
        * min         1.000000
        * 25%        24.000000
        * 50%        61.000000
        * 75%       134.000000
        * max      1667.000000 
* Maven
    * `complexity`
        * count    700.000000
        * mean      14.334286
        * std       35.735593
        * min        0.000000
        * 25%        0.000000
        * 50%        5.000000
        * 75%       15.000000
        * max      664.000000
    * `nloc`
        * count     715.000000
        * mean       88.925874
        * std       172.153021
        * min         1.000000
        * 25%        14.500000
        * 50%        40.000000
        * 75%        95.000000
        * max      2693.000000