A distribuição de frequência é uma das ferramentas mais fundamentais da estatística descritiva. Ela organiza os dados em intervalos (classes), permitindo observar a dispersão, concentração e tendências de forma clara.
Neste pequeno projeto, vamos implementar uma tabela de frequência completa em Python, contendo:
- Classes (intervalos)
- Pontos médios
- Frequência absoluta
- Frequência acumulada
- Frequência relativa
- Frequência relativa acumulada
- Histograma visual
Imagine que temos as idades de 20 pessoas em um grupo. Listar todos os números não nos ajuda muito a entender o padrão, é aqui que entra a distribuição de frequência. Ela agrupa as idades em intervalos, mostrando quantas pessoas estão em cada faixa etária.
| Tipo de Frequência | Símbolo | Definição | 
|---|---|---|
| Classes | k | São intervalos de valores que agrupam os dados. | 
| Pontos médios | pm | Valores que representam o centro do intervalo das classes. | 
| Frequência Absoluta | f | Número de vezes que um valor aparece no conjunto de dados. | 
| Frequência Acumulada | F | Soma acumulada das frequências absolutas até um determinado valor. | 
| Frequência Relativa | (%) f% | Percentual que representa a proporção de cada valor em relação ao total de observações. | 
| Frequência Relativa Acumulada | (%) F% | Soma acumulada dos percentuais até aquele valor. | 
Essas medidas são amplamente utilizadas em análises exploratórias de dados e visualização estatística.
| id | Classes | Ponto_Médio | Freq_Absoluta | Freq_Acumulada | Freq_Relativa | Freq_Relativa_Acumulada | 
|---|---|---|---|---|---|---|
| 0 | 18-22 | 20.0 | 4 | 4 | 0.20 % | 0.20 % | 
| 1 | 22-26 | 24.0 | 5 | 9 | 0.25 % | 0.45 % | 
| 2 | 26-30 | 28.0 | 3 | 12 | 0.15 % | 0.60 % | 
| 3 | 30-34 | 32.0 | 3 | 15 | 0.15 % | 0.75 % | 
| 4 | 34-38 | 36.0 | 5 | 20 | 0.25 % | 1.00 % | 
- Python 3.x
- Biblioteca Pandas
- Biblioteca numpy
- Biblioteca matplotlib
- Clone o repositório ou baixe o notebook.
   git clone https://github.com/jcarlossc/python-frequency-distribution.git
   cd python-frequency-distribution
Se quiser contribuir:
- Faça um fork deste repositório
- Crie uma branch para sua feature ou correção (git checkout -b minha-feature)
- Faça commits descritos claramente
- Submeta um Pull Request
Este projeto está licenciado sob a MIT License.
📌Autor: Carlos da Costa
📌Recife, PE - Brasil
📌Telefone: +55 81 99712 9140
📌Telegram: @jcarlossc
📌Blogger linguagem R: https://informaticus77-r.blogspot.com/
📌Blogger linguagem Python: https://informaticus77-python.blogspot.com/
📌Email: jcarlossc1977@gmail.com
📌Portfólio em construção: https://portfolio-carlos-costa.netlify.app/
📌LinkedIn: https://www.linkedin.com/in/carlos-da-costa-669252149/
📌GitHub: https://github.com/jcarlossc
📌Kaggle: https://www.kaggle.com/jcarlossc/
📌Twitter/X: https://x.com/jcarlossc1977
