Permalink
Browse files

add and update READMEs

  • Loading branch information...
arnaldog12 committed Dec 10, 2017
1 parent e986869 commit 38e81bae3713c56655a0a7489126ea6a93371f92
Showing with 563 additions and 99 deletions.
  1. +34 −20 README.en.md
  2. +26 −63 README.md
  3. +92 −0 data/2014/README.md
  4. +76 −0 data/2015/README.md
  5. +72 −0 data/2016/README.md
  6. +88 −0 data/2017/README.md
  7. +130 −0 data/README.md
  8. +0 −16 lib/python/README.md
  9. +11 −0 src/R/README.md
  10. +1 −0 src/README.md
  11. +33 −0 src/python/README.md
@@ -1,30 +1,44 @@
# Introduction

This repository aims to provide to R users an easy method to gather data from Cartola FC 2016.

# What has been done?
[![Gitter](https://img.shields.io/gitter/room/nwjs/nw.js.svg)](https://gitter.im/caRtola-R/Lobby?utm_source=share-link&utm_medium=link&utm_campaign=share-link) | [README in Portuguese](https://github.com/henriquepgomide/caRtola/blob/master/README.md)

1. Now you can easily import data from players using lib/caRtola_fetch.R
2. Data from current and previous Cartola edition is organized in *db* folder. Data from previous season come from here(https://github.com/thevtm/CartolaFCDados).
> We'll be back in 2018 with great news! :sunglasses:
# TODO
# :tophat: caRtola :tophat:

1. Analyze data from previous years '14 and '15
2. Create useful visualizations using shiny
3. Create models to predict player performance
> This repository aims to provide all available data from Cartola FC since its creation in 2014. We also tried to predict the score of each player in the 2017 Brazilian National Championship.
# Contact
## Data :memo:
You can access all Cartola FC's data in the folder [data](data/). The data is organized by year and there is a single file with all data merged. All files are in .csv format. Even the Excel may open it. :wink:

henriquepgomide@gmail.com
## Predictions :dart:

You can check the predictions results of our model in 2017 in [this spreadsheet](https://docs.google.com/spreadsheets/d/1knS8pE-JtIaeilUcjI_grIKBeox94QWAuMGKlfCfQSk/edit?usp=sharing). Each spreadsheet has the predicted players by our model and their actual score for that round. Do you think our model performed well? or not? [Enjoy our discussion, mate!](https://github.com/henriquepgomide/caRtola/issues/33) :speech_balloon:

# Additional information
## List of API urls
Oh, our predictive model is available for public domain! Do you wanna know how it got trained and how you can use it? [Check this out](src/python/Análise dos Dados.ipynb).

1. "https://api.cartolafc.globo.com/partidas"
2. "https://api.cartolafc.globo.com/clubes"
3. "https://api.cartolafc.globo.com/mercado/destaques"
4. "https://api.cartolafc.globo.com/mercado/status"
5. "https://api.cartolafc.globo.com/atletas/mercado"
6. "https://api.cartolafc.globo.com/rodadas"
7. "https://api.cartolafc.globo.com/auth/time"
## Contributions :octocat:

The __caRtola__ repo is completely opened for new contributions. Do you wanna help us, but don't know how? We give you some ideas:

- Have you done some cool statistical analysis of _Cartola FC_ you would like to share here?
- Do you also have a model to predict best players?
- Or you have just seen a mistake in our data/analysis?

Feel free to submit a Pull Request or open an issue! We'll love to have it here in __caRtola__! :v:

### Authors :busts_in_silhouette:

:bust_in_silhouette: __Henrique Gomide__:

* henriquepgomide@gmail.com
* [Github](https://github.com/henriquepgomide)
* [Twitter](https://twitter.com/hpgomide)
* [Linkedin](https://www.linkedin.com/in/hpgomide/)
* [Lattes](http://lattes.cnpq.br/6230665865154742)

:bust_in_silhouette: __Arnaldo Gualberto__:

* arnaldo.g12@gmail.com
* [Github](https://github.com/arnaldog12)
* [Site Pessoal](http://arnaldogualberto.com)
@@ -1,79 +1,42 @@
[![Gitter](https://img.shields.io/gitter/room/nwjs/nw.js.svg)](https://gitter.im/caRtola-R/Lobby?utm_source=share-link&utm_medium=link&utm_campaign=share-link) | README in [English](https://github.com/henriquepgomide/caRtola/blob/master/README.en.md)
[![Gitter](https://img.shields.io/gitter/room/nwjs/nw.js.svg)](https://gitter.im/caRtola-R/Lobby?utm_source=share-link&utm_medium=link&utm_campaign=share-link) | [README in English](https://github.com/henriquepgomide/caRtola/blob/master/README.en.md)

Voltaremos em 2018 com uma grande novidade. :)
> Voltaremos em 2018 com uma grande novidade. :sunglasses:
# Introdução
# :tophat: caRtola :tophat:

Este repositório tem como objetivo disponibilizar os dados e modelos preditivos do Cartola FC. Os scripts estão escritos em R e Python.
> Este repositório tem como objetivo disponibilizar todos os dados do *Cartola FC* desde sua criação em 2014. Nós também tentamos prever a pontuação de cada jogador no Brasileirão.
* Para acessar os dados, use qualquer programa. Está tudo disponível em arquivos separados por vírgulas. Até o Excel abre :)
* Para executar os scripts contidos:
* R - você precisará instalar o [R](https://www.r-project.org/) e eu fortemente recomendo a instalação da [IDE RStudio](https://www.rstudio.com/products/rstudio/download/)
* Python - siga as instruções no diretório lib/python.
## Dados :memo:
Para ter acesso a todo o histórico de dados do _Cartola FC_ é só acessar a pasta [data](data/). Lá você encontra os dados organizados por ano e ainda um arquivo com os dados agregados de todos os anos. Está tudo disponível em arquivos separados por vírgulas. Até o Excel abre. :wink:

## Previsões :dart:

## Estrutura do repositório
Você pode conferir o resultado das previsões do nosso modelo preditivo em 2017 [nessa planilha](https://docs.google.com/spreadsheets/d/1knS8pE-JtIaeilUcjI_grIKBeox94QWAuMGKlfCfQSk/edit?usp=sharing). Nela, você vai encontrar os jogadores que o nosso modelo previu que iam fazer boas predições e a pontuação real do jogador naquela rodada. __Você acha que o modelo mandou bem? Foi ruim?__ [Vem resenhar com a gente, parça!](https://github.com/henriquepgomide/caRtola/issues/33) :speech_balloon:

<!-- language: lang-none -->
```
├── dashboard
│   └── cartola-stats
├── db
│   ├── 2014
│   ├── 2015
│   ├── 2016
│   ├── 2017
│   └── worldTeamData
├── lib
│   ├── python
│   └── R
└── tutorials
   └── R
```
Ah, o nosso modelo preditivo é de domínio público também! Quer saber como ele foi treinado e como você pode utilizá-lo? [Confira aqui](src/python/Análise dos Dados.ipynb).

## Contribuições :octocat:

**Dashboard**
O repositório __caRtola__ é totalmente aberto a novas contribuições. Quer ajudar a gente, mas não sabe como? A gente te dá algumas ideias:

* Aplicativo Shiny para escolher seu jogador. Disponível no link (caRtola - STATS)[https://henriquepgomide.shinyapps.io/cartola-stats/]. Você pode executá-lo pelo computador.
- Você já fez alguma análise estatística do _Cartola FC_ que acha legal e gostaria de compartilhar aqui?
- Você também tem um modelo preditivo para tentar prever os melhores jogadores?
- Ou simplesmente você viu um erro nos nossos dados/análises?

Sinta-se à vontade para submeter um Pull Request ou abrir uma issue! Nós vamos adorar ter isso no __caRtola__! :v:

**db**
### Autores :busts_in_silhouette:

* Os dados das estatísticas dos jogadores do Cartola estão separados por ano.
* Crédito das edições 2014 e 2015: (https://github.com/thevtm/CartolaFCDados)
* Crédito da edição de 2016: Arnaldo Gualberto
:bust_in_silhouette: __Henrique Gomide__:

* Os dados dos times são extraídos do site da CBF.
* henriquepgomide@gmail.com
* [Github](https://github.com/henriquepgomide)
* [Twitter](https://twitter.com/hpgomide)
* [Linkedin](https://www.linkedin.com/in/hpgomide/)
* [Lattes](http://lattes.cnpq.br/6230665865154742)

:bust_in_silhouette: __Arnaldo Gualberto__:

**lib**

Você encontra scripts em R e python para coletar e analisar os dados do cartola

Na pasta R:

* caRtola_fetch.R - coleta os dados da API do Cartola
* team_data_scraper.R* - coleta dados do site da CBF
* data_wrangling - agrega os dados dos scouts do cartola, cria variáveis para uso em modelos preditivos agregando outras fontes.
* rdata_2_sql.R - transforma os dados do objeto cartola em arquivo sql.

**tutorials**

Você encontra tutoriais para iniciantes sobre o cartola.

* Vale a pena usar a média para escolher jogadores?
* Modelos preditivos são melhores que a média?



# Autores

Henrique Gomide
* henriquepgomide@gmail.com
* [@hpgomide](https://twitter.com/hpgomide)
* [Linkedin](https://www.linkedin.com/in/hpgomide/)
* [Lattes](http://lattes.cnpq.br/6230665865154742)

Arnaldo Gualberto
* [Site](http://arnaldogualberto.com)
* [Linkedin](https://www.linkedin.com/in/arnaldo-gualberto-95717939/?ppe=1)
* arnaldo.g12@gmail.com
* [Github](https://github.com/arnaldog12)
* [Site Pessoal](http://arnaldogualberto.com)
@@ -0,0 +1,92 @@
## 2014_jogadores.csv

| coluna | descrição | observações |
|-----------|-------------------------|-----------------------------------------------------------------|
| ID | id do jogador | |
| Apelido | nome/apelido do jogador | |
| ClubeID | id do clube do jogador | ver arquivo 2014_times.csv |
| PosiçãoID | posição do jogador | 1:Goleiro, 2:Lateral, 3:Zagueiro, 4:Meia, 5:Atacante, 6:Técnico |

## 2014_lances.csv

| coluna | descrição | observações |
|-----------|--------------------------------------|----------------------------------------------------------------------------------------------|
| ID | id do lance | |
| PartidaID | id da partida | ver arquivo 2014_partidas_ids.csv |
| ClubeID | id do clube | ver arquivo 2014_times.csv |
| AtletaID | id do jogador | ver arquivo 2014_jogadores.csv |
| Periodo | indica o período do lance | 1tr: 1º tempo, 2tr: 2º tempo, itr: intervalo, fnj: final do jogo (após o término da partida) |
| Momento | tempo em minutos que o lance ocorreu | nulo quando período = 'itr' ou 'fnj' |
| Tipo | tipo de scout | |

## 2014_partidas_ids.csv

| coluna | descrição | observações |
|-----------------|--------------------------------------------------------------|---------------------------------|
| ID | id da partida | |
| Rodada | número da rodada do Brasileirão | número da rodada do Brasileirão |
| Casa | id do time mandante | ver arquivo 2014_times.csv |
| Visitante | id do time visitante | ver arquivo 2014_times.csv |
| PlacarCasa | placar do time mandante | |
| PlacarVisitante | placar do time visitante | |
| Resultado | indica o time vencedor (casa ou mandante) ou se houve empate | |

## 2014_partidas.csv

| coluna | descrição | observações |
|-----------|-------------------------------|----------------------|
| game | ordem da partida | |
| round | rodada do brasileirão | |
| date | data e hora da partida | |
| home_team | time mandante e seu estado | |
| score | placar da partida | mandante x visitante |
| away_team | time visitante e seu estado | |
| arena | nome e localização do estádio | |

## 2014_scouts_raw.csv

| coluna | descrição | observações |
|---------------|-----------------------------------------------------------|-----------------------------------------------------------------|
| Atleta | id do jogador | ver arquivo 2014_jogadores.csv |
| Rodada | número da rodada do Brasileirão | |
| Clube | clube do jogador | ver arquivo 2014_times.csv |
| Participou | indica se o jogador participou ou não | 1:Sim, 0:Não |
| Posição | posição do jogador | 1:Goleiro, 2:Lateral, 3:Zagueiro, 4:Meia, 5:Atacante, 6:Técnico |
| Jogos | quantidade de jogos que o jogador participou até aquela rodada | |
| Pontos | pontuação do jogador | |
| PontosMedia | média da pontuação do jogador | |
| Preco | preço do jogador | |
| PrecoVariacao | variação de preço | |
| Partida | id da partida | ver arquivo 2014_partidas_ids.csv |
| Mando | indica se o jogador era do time com mando de campo ou não | 1:Sim, 0:Não |
| Titular | indica se o jogador foi titular ou não | 1:Sim, 0:Não |
| Substituido | indica se o jogador foi substituído ou não | 1:Sim, 0:Não |
| TempoJogado | indica a fração de tempo (90 minutos) jogado pelo jogador | [0-1] |
| Nota | indica a nota do jogador pela crítica especializada | |
| FS | faltas sofridas | |
| PE | passes errados | |
| A | assistências | |
| FT | finalizações na trave | |
| FD | finalizações defendidas | |
| FF | finalizações para fora | |
| G | gols | |
| I | impedimentos | |
| PP | pênaltis perdidos | |
| RB | roubadas de bola | |
| FC | faltas cometidas | |
| GC | gols contra | |
| CA | cartões amarelo | |
| CV | cartões vermelho | |
| SG | jogos sem sofrer gols | |
| DD | defesas difíceis | |
| DP | defesas de pênalti | |
| GS | gols sofridos | |

## 2014_times.csv

| coluna | descrição | observações |
|------------|--------------|----------------------------------|
| ID | id do time | ver arquivo 2014_times.csv |
| Nome | nome do time | |
| Abreviacao | abreviação | |
| Slug | nome do time | lower-case, sem espaço e acentos |
Oops, something went wrong.

0 comments on commit 38e81ba

Please sign in to comment.