# Ordenação de dados
***

A ordenação de dados é uma etapa fundamental na análise de dados, pois permite organizar as informações de forma estruturada e facilitar a compreensão dos padrões, tendências e insights presentes nos dados. A ordenação é particularmente útil quando lidamos com conjuntos de dados grandes, nos quais a visualização e interpretação das informações podem se tornar mais desafiadoras sem uma ordem adequada.

Existem várias razões pelas quais a ordenação é importante na análise de dados:

<input type="checkbox" checked disabled> **Identificação de padrões:** identifica facilmente padrões crescentes, decrescentes ou repetitivos. Esses padrões podem fornecer informações valiosas sobre o comportamento dos dados e ajudar a identificar tendências ou anomalias.

<input type="checkbox" checked disabled> **Análise comparativa:** facilita a comparação de diferentes elementos dos dados. Por exemplo, ao ordenar uma coluna de valores de vendas, podemos identificar os produtos mais vendidos ou os clientes com maior volume de compras.

<input type="checkbox" checked disabled> **Facilidade de busca:** Com os dados organizados, é mais fácil localizar informações específicas. Ao realizar buscas ou consultas em um conjunto de dados ordenado, podemos encontrar rapidamente elementos específicos, como o valor máximo, mínimo ou um intervalo específico.

<input type="checkbox" checked disabled> **Visualização mais clara:** A ordenação dos dados pode tornar a visualização mais clara e compreensível. Gráficos e tabelas podem se beneficiar de dados ordenados, fornecendo uma representação visual mais intuitiva e facilitando a interpretação dos resultados. A ordenação dos dados pode tornar a visualização mais clara e compreensível. Gráficos e tabelas podem se beneficiar de dados ordenados, fornecendo uma representação visual mais intuitiva e facilitando a interpretação dos resultados.

#### Importando as Bibliotecas


In [2]:
import pandas as pd


#### Coletando Dados de Perfil
***

In [4]:
df_perfil_clientes = pd.read_csv('../../source_data/perfil_clientes.csv', sep=';')
df_perfil_clientes.sample(3)

Unnamed: 0,idade,classe_trabalho,escolaridade,anos_estudo,estado_civil,raca,sexo,UF,região,qtde_filhos,salario
1085,34,Funcionário Setor Privado,Ensino Médio Incompleto,9,Divorciado,Branco,Masculino,AL,Nordeste,3.0,1100
6097,46,Funcionário Setor Privado,Ensino Médio Incompleto,9,Solteiro,Branco,Feminino,PA,Norte,4.0,1100
7709,84,Aposentado,Mestrado,14,Solteiro,Branco,Masculino,GO,Centro-Oeste,5.0,2745


#### Método sort_values
***
Este método permite ordenar um DataFrame ou uma Series com base nos valores de uma ou mais colunas. É possível especificar a ordem ascendente ou descendente e definir colunas secundárias para a ordenação.

In [6]:
df_ordered = df_perfil_clientes.sort_values(by='anos_estudo')
df_ordered.head()

Unnamed: 0,idade,classe_trabalho,escolaridade,anos_estudo,estado_civil,raca,sexo,UF,região,qtde_filhos,salario
7883,26,Funcionário Setor Privado,Analfabeto,1,União Estável,Branco,Masculino,RN,Nordeste,3.0,1100
924,51,Empresário,Analfabeto,1,Casado,Branco,Masculino,SE,Nordeste,4.0,9263
2875,71,Aposentado,Analfabeto,1,Viúvo,Negro,Masculino,RS,Sul,1.0,3366
2937,31,Funcionário Setor Privado,Analfabeto,1,Solteiro,Branco,Feminino,RR,Norte,3.0,1100
4098,52,Funcionário Setor Privado,Analfabeto,1,Casado,Branco,Masculino,RR,Norte,1.0,1100


In [8]:
df_ordered_desc = df_perfil_clientes.sort_values(by='anos_estudo', ascending=False)
df_ordered_desc.head()


Unnamed: 0,idade,classe_trabalho,escolaridade,anos_estudo,estado_civil,raca,sexo,UF,região,qtde_filhos,salario
7913,36,Servidor Público,Doutorado,16,Solteiro,Branco,Masculino,AL,Nordeste,5.0,12471
3011,51,Servidor Público,Doutorado,16,Casado,Branco,Masculino,MS,Centro-Oeste,1.0,9668
696,46,Funcionário Setor Privado,Doutorado,16,Divorciado,Branco,Feminino,AM,Norte,0.0,9990
631,52,Autônomo,Doutorado,16,Casado,Branco,Masculino,RJ,Sudeste,5.0,13036
3004,64,Servidor Público,Doutorado,16,Solteiro,Branco,Feminino,MG,Sudeste,1.0,15630


#### Ordenação por Múltiplos Critérios
***

In [9]:
ordena = ['anos_estudo', 'UF']
df_perfil_clientes.sort_values(by=ordena)

Unnamed: 0,idade,classe_trabalho,escolaridade,anos_estudo,estado_civil,raca,sexo,UF,região,qtde_filhos,salario
3583,39,,Analfabeto,1,Viúvo,Branco,Feminino,AC,Norte,4.0,1100
3437,33,Funcionário Setor Privado,Analfabeto,1,Casado,Branco,Masculino,ES,Sudeste,0.0,1100
6424,27,Funcionário Setor Privado,Analfabeto,1,Casado,Branco,Masculino,MA,Nordeste,4.0,1100
7061,30,Funcionário Setor Privado,Analfabeto,1,Solteiro,Branco,Masculino,MS,Centro-Oeste,4.0,1100
223,53,Empresário,Analfabeto,1,Solteiro,Branco,Feminino,PI,Nordeste,0.0,6333
...,...,...,...,...,...,...,...,...,...,...,...
6350,75,Aposentado,Doutorado,16,Casado,Negro,Masculino,SE,Nordeste,0.0,3845
5302,36,Autônomo,Doutorado,16,Solteiro,Branco,Masculino,SP,Sudeste,5.0,9658
7111,47,Autônomo,Doutorado,16,Casado,Branco,Masculino,SP,Sudeste,4.0,14130
3102,45,Funcionário Setor Privado,Doutorado,16,Casado,Branco,Masculino,TO,Norte,0.0,13707


In [13]:
df_perfil_clientes.sort_values(by=ordena, ascending=[False, False])

Unnamed: 0,idade,classe_trabalho,escolaridade,anos_estudo,estado_civil,raca,sexo,UF,região,qtde_filhos,salario
3102,45,Funcionário Setor Privado,Doutorado,16,Casado,Branco,Masculino,TO,Norte,0.0,13707
7286,31,Servidor Público,Doutorado,16,Casado,Branco,Masculino,TO,Norte,0.0,11760
5302,36,Autônomo,Doutorado,16,Solteiro,Branco,Masculino,SP,Sudeste,5.0,9658
7111,47,Autônomo,Doutorado,16,Casado,Branco,Masculino,SP,Sudeste,4.0,14130
3272,31,Empresário,Doutorado,16,Solteiro,Branco,Masculino,SE,Nordeste,0.0,18867
...,...,...,...,...,...,...,...,...,...,...,...
223,53,Empresário,Analfabeto,1,Solteiro,Branco,Feminino,PI,Nordeste,0.0,6333
7061,30,Funcionário Setor Privado,Analfabeto,1,Solteiro,Branco,Masculino,MS,Centro-Oeste,4.0,1100
6424,27,Funcionário Setor Privado,Analfabeto,1,Casado,Branco,Masculino,MA,Nordeste,4.0,1100
3437,33,Funcionário Setor Privado,Analfabeto,1,Casado,Branco,Masculino,ES,Sudeste,0.0,1100


### Método sort_index
***
Este método permite ordenar um DataFrame ou uma Series com base nos índices. A ordenação é feita de forma ascendente por padrão.


In [14]:
df_perfil_clientes.sort_index()

Unnamed: 0,idade,classe_trabalho,escolaridade,anos_estudo,estado_civil,raca,sexo,UF,região,qtde_filhos,salario
0,39,Servidor Público,Ensino Médio Completo,13,Solteiro,Branco,Masculino,RO,Norte,2.0,4754
1,50,Autônomo,Superior Incompleto,13,Casado,Branco,Masculino,AC,Norte,1.0,3923
2,38,Funcionário Setor Privado,Ensino Médio Incompleto,9,Divorciado,Branco,Masculino,AM,Norte,0.0,1100
3,53,Funcionário Setor Privado,Ensino Médio Incompleto,7,Casado,Negro,Masculino,RR,Norte,1.0,1100
4,28,Funcionário Setor Privado,Ensino Médio Completo,13,Casado,Negro,Feminino,PA,Norte,0.0,3430
...,...,...,...,...,...,...,...,...,...,...,...
7994,23,Funcionário Setor Privado,Ensino Médio Completo,10,Casado,Negro,Masculino,AL,Nordeste,3.0,2856
7995,19,Funcionário Setor Privado,Ensino Médio Incompleto,9,Solteiro,Branco,Feminino,SE,Nordeste,1.0,1100
7996,44,,Ensino Médio Completo,10,Casado,Branco,Masculino,BA,Nordeste,0.0,3729
7997,20,Funcionário Setor Privado,Ensino Médio Incompleto,9,Solteiro,Negro,Masculino,MG,Sudeste,0.0,1100


In [15]:
df_perfil_clientes.sort_index(ascending=False)

Unnamed: 0,idade,classe_trabalho,escolaridade,anos_estudo,estado_civil,raca,sexo,UF,região,qtde_filhos,salario
7998,41,Funcionário Setor Privado,Ensino Médio Completo,13,Casado,Branco,Masculino,AP,Norte,1.0,2579
7997,20,Funcionário Setor Privado,Ensino Médio Incompleto,9,Solteiro,Negro,Masculino,MG,Sudeste,0.0,1100
7996,44,,Ensino Médio Completo,10,Casado,Branco,Masculino,BA,Nordeste,0.0,3729
7995,19,Funcionário Setor Privado,Ensino Médio Incompleto,9,Solteiro,Branco,Feminino,SE,Nordeste,1.0,1100
7994,23,Funcionário Setor Privado,Ensino Médio Completo,10,Casado,Negro,Masculino,AL,Nordeste,3.0,2856
...,...,...,...,...,...,...,...,...,...,...,...
4,28,Funcionário Setor Privado,Ensino Médio Completo,13,Casado,Negro,Feminino,PA,Norte,0.0,3430
3,53,Funcionário Setor Privado,Ensino Médio Incompleto,7,Casado,Negro,Masculino,RR,Norte,1.0,1100
2,38,Funcionário Setor Privado,Ensino Médio Incompleto,9,Divorciado,Branco,Masculino,AM,Norte,0.0,1100
1,50,Autônomo,Superior Incompleto,13,Casado,Branco,Masculino,AC,Norte,1.0,3923
