# Tutorial do Python Excel: O guia definitivo

Saiba como ler e importar arquivos do Excel em Python, gravar dados nessas planilhas e encontrar os melhores pacotes para fazer isso.

# Introdução ao Excel em Python

Quer você seja estudante ou profissional, é provável que já tenha usado o Excel para trabalhar com dados e processar números.

De fato, uma pesquisa realizada em 2019 constatou que cerca de 54% das empresas usam o Excel para realizar operações aritméticas, analisar dados, criar visualizações e gerar relatórios. Você também pode executar tarefas de modelagem preditiva, como regressão e agrupamento, usando o Excel.

No entanto, apesar dos pontos fortes indiscutíveis do Excel, a ferramenta tem seu próprio conjunto de desvantagens, tornando-a, às vezes, ineficiente ao executar tarefas específicas que envolvem grandes conjuntos de dados.

Uma limitação do Excel é sua incapacidade de lidar com grandes quantidades de dados. Você pode ter sérios problemas de desempenho ao tentar executar operações complexas em muitas entradas de dados no Excel, especialmente se suas fórmulas e macros não estiverem otimizadas para desempenho.

O Excel também pode consumir muito tempo se você precisar executar tarefas repetitivas. Por exemplo, se você precisar replicar uma análise em vários arquivos do Excel toda semana, terá que abri-los manualmente e copiar e colar as mesmas fórmulas várias vezes.

Pesquisas mostram que 93% dos usuários do Excel consideram demorada a consolidação de planilhas e que os funcionários gastam aproximadamente 12 horas por mês apenas combinando diferentes arquivos do Excel.

Essas desvantagens podem ser resolvidas automatizando os fluxos de trabalho do Excel com Python. Tarefas como consolidação de planilhas, limpeza de dados e modelagem preditiva podem ser realizadas em minutos usando um script Python simples que grava em um arquivo do Excel.

Os usuários do Excel também podem criar um agendador em Python que executa o script automaticamente em diferentes intervalos de tempo, reduzindo drasticamente a quantidade de intervenção humana necessária para executar a mesma tarefa repetidamente.

Neste artigo, mostraremos a você como fazer isso:

- Use uma biblioteca chamada Openpyxl para ler e gravar arquivos do Excel usando Python
- Criar operações aritméticas e fórmulas do Excel em Python
- Manipular planilhas do Excel usando Python
- Crie visualizações em Python e salve-as em um arquivo do Excel
- Formatar cores e estilos de células do Excel usando Python

# Introdução ao Openpyxl

O Openpyxl é uma biblioteca Python que permite aos usuários ler arquivos do Excel e gravar neles. 

Essa estrutura pode ajudar você a escrever funções, formatar planilhas, criar relatórios e criar gráficos diretamente no Python sem precisar abrir um aplicativo do Excel.

Além disso, o Openpyxl permite que os usuários iterem pelas planilhas e realizem a mesma análise em vários conjuntos de dados ao mesmo tempo. 

Isso aumenta a eficiência e permite a automação dos fluxos de trabalho do Excel, pois os usuários só precisam realizar a análise em uma planilha e podem replicá-la quantas vezes forem necessárias.

# Como instalar o Openpyxl

Para instalar o Openpyxl, basta abrir o prompt de comando ou o Powershell e digitar o seguinte comando:

```$pip install Openpyxl```

Você deverá ver a seguinte mensagem indicando que o pacote foi instalado com sucesso:

![image.png](attachment:image.png)

# Lendo arquivos do Excel em Python com o Openpyxl
Neste tutorial, usaremos o conjunto de dados de vendas de videogames da Kaggle. Esse conjunto de dados foi pré-processado por nossa equipe para fins deste tutorial, e você pode fazer o download da versão modificada neste link. Você pode importar o Excel para o Python seguindo o processo abaixo:

#### 1. Carregando a pasta de trabalho

Depois de fazer o download do conjunto de dados, importe a biblioteca Openpyxl e carregue a pasta de trabalho no Python:

In [1]:
import openpyxl 

wb = openpyxl.load_workbook('videogamesales.xlsx')

Esse código importa o módulo openpyxl, que é uma biblioteca Python para trabalhar com arquivos do Excel. Em seguida, ele carrega uma pasta de trabalho do Excel chamada videogamesales.xlsx usando a função load_workbook() do módulo openpyxl e a atribui à variável wb. Isso permite que o usuário acesse e manipule os dados no arquivo do Excel usando Python.

Agora que o arquivo do Excel está carregado como um objeto Python, você precisa informar à biblioteca qual planilha deve ser acessada. Há duas maneiras de fazer isso:

O primeiro método é simplesmente chamar a planilha ativa, que é a primeira planilha da pasta de trabalho, usando a seguinte linha de código:

In [2]:
ws = wb.active

Esse código atribui a planilha ativa na pasta de trabalho do Excel wb à variável ws. O atributo active retorna a planilha ativa no momento na pasta de trabalho. Esse código é escrito em Python.

Como alternativa, se você souber o nome da planilha, também poderá acessá-la pelo nome. Usaremos a planilha "vgsales" nesta seção do tutorial:

In [3]:
ws = wb['vgsales']

Esse código cria uma variável ws que faz referência a uma planilha específica em uma pasta de trabalho do Excel wb. A planilha é denominada `'vgsales''. Esse código é escrito em Python.

Agora, vamos contar o número de linhas e colunas dessa planilha:

In [4]:
print('Total number of rows: '+str(ws.max_row)+'. And total number of columns: '+str(ws.max_column))

Total number of rows: 16328. And total number of columns: 10


Esse trecho de código foi escrito em Python. O código imprime uma cadeia de caracteres que inclui o número total de linhas e colunas em uma planilha. As funções ws.max_row e ws.max_column são usadas para encontrar o número máximo de linhas e colunas na planilha ws. A função str() é usada para converter os valores inteiros retornados por ws.max_row e ws.max_column em strings para que possam ser concatenados com o restante da string. Por fim, o operador + é usado para concatenar as cadeias de caracteres e a cadeia inteira é impressa no console usando a função print().

O código acima deve gerar o seguinte resultado:
Total number of rows: 16328. And total number of columns: 10

Agora que você já conhece as dimensões da planilha, vamos prosseguir e aprender a ler os dados da pasta de trabalho. 

#### 2. Leitura de dados de uma célula

Aqui está uma captura de tela da planilha ativa com a qual trabalharemos nesta seção:

![image.png](attachment:image.png)

Para recuperar dados de uma célula específica com o Openpyxl, você pode digitar o valor da célula desta forma:

In [5]:
print('The value in cell A1 is: '+ws['A1'].value)

The value in cell A1 is: Rank


Esse código usa o Python para imprimir uma string que inclui o valor da célula A1 em uma planilha. A função print() é usada para enviar a string para o console. A string é criada concatenando o texto "O valor na célula A1 é: " com o valor da célula A1 na planilha. O valor da célula A1 é acessado usando a sintaxe ws['A1'], que se refere ao objeto célula na planilha com as coordenadas A1. O atributo .value é então usado para recuperar o valor dessa célula. Em geral, esse código recupera o valor da célula A1 em uma planilha e o imprime junto com algum texto explicativo.

Você deve obter o seguinte resultado: The value in cell A1 is: Rank

#### 3. Leitura de dados de várias células

Agora que sabemos como ler dados de uma célula específica, e se quiséssemos imprimir todos os valores das células em uma determinada linha da planilha?

Para fazer isso, você pode escrever um simples `for loop` para iterar todos os valores em uma linha específica:

In [6]:
values = [ws.cell(row=1,column=i).value for i in range(1,ws.max_column+1)]
print(values)

['Rank', 'Name', 'Platform', 'Year', 'Genre', 'Publisher', 'NA_Sales', 'EU_Sales', 'JP_Sales', 'Other_Sales']


Esse código usa a compreensão de lista para extrair os valores de todas as células na primeira linha de uma planilha. Primeiro, ele cria uma lista de números inteiros de 1 até o número máximo de colunas na planilha usando a função range() e ws.max_column+1. Em seguida, ele usa a compreensão de lista para iterar sobre essa lista de inteiros e extrair o valor da célula na primeira linha e a coluna correspondente usando o método ws.cell(). Por fim, ele armazena esses valores em uma lista chamada values e os imprime usando a função print().

O código acima imprimirá todos os valores na primeira linha: ['Rank', 'Name', 'Platform', 'Year', 'Genre', 'Publisher', 'NA_Sales', 'EU_Sales', 'JP_Sales', 'Other_Sales']

Em seguida, vamos tentar imprimir várias linhas em uma coluna específica.

Criaremos um loop for para renderizar as dez primeiras linhas da coluna "Name" como uma lista. Você deve obter os nomes destacados na caixa vermelha abaixo:

![image.png](attachment:image.png)

In [7]:
data=[ws.cell(row=i,column=2).value for i in range(2,12)]
print(data)

['Wii Sports', 'Super Mario Bros.', 'Mario Kart Wii', 'Wii Sports Resort', 'Pokemon Red/Pokemon Blue', 'Tetris', 'New Super Mario Bros.', 'Wii Play', 'New Super Mario Bros. Wii', 'Duck Hunt']


Esse código é escrito em Python. O código cria uma lista chamada "data" usando uma compreensão de lista. A compreensão de lista itera sobre um intervalo de linhas de 2 a 11 (exclusivo) e extrai o valor da célula na segunda coluna (coluna B) para cada linha usando o método "cell" da biblioteca openpyxl. Por fim, o código imprime a lista de "dados". Esse código é provavelmente usado para extrair uma coluna específica de dados de uma planilha do Excel usando a biblioteca openpyxl.

O código acima gerará o seguinte resultado: ['Wii Sports', 'Super Mario Bros.', 'Mario Kart Wii', 'Wii Sports Resort', 'Pokemon Red/Pokemon Blue', 'Tetris', 'New Super Mario Bros.', 'Wii Play', 'New Super Mario Bros. Wii', 'Duck Hunt']

Por fim, vamos imprimir as dez primeiras linhas em um intervalo de colunas na planilha:

In [10]:
# reading data from a range of cells (from column 1 to 6)

my_list = list()

for value in ws.iter_rows(
    min_row=1, max_row=11, min_col=1, max_col=6, 
    values_only=True):
    my_list.append(value)
    
for ele1, ele2, ele3, ele4, ele5, ele6 in my_list:
    print("{:<8}{:<35}{:<10}{:<10}{:<15}{:<15}".format(
        ele1, ele2, ele3, ele4, ele5, ele6))

Rank    Name                               Platform  Year      Genre          Publisher      
1       Wii Sports                         Wii       2006      Sports         Nintendo       
2       Super Mario Bros.                  NES       1985      Platform       Nintendo       
3       Mario Kart Wii                     Wii       2008      Racing         Nintendo       
4       Wii Sports Resort                  Wii       2009      Sports         Nintendo       
5       Pokemon Red/Pokemon Blue           GB        1996      Role-Playing   Nintendo       
6       Tetris                             GB        1989      Puzzle         Nintendo       
7       New Super Mario Bros.              DS        2006      Platform       Nintendo       
8       Wii Play                           Wii       2006      Misc           Nintendo       
9       New Super Mario Bros. Wii          Wii       2009      Platform       Nintendo       
10      Duck Hunt                          NES       1984   

Explicando o código acima:

In [11]:
# 1. INICIALIZAÇÃO DA LISTA
# ------------------------
# Cria uma lista vazia para armazenar cada linha da planilha como uma tupla de valores
my_list = list()  

# 2. LEITURA DA PLANILHA (EXCEL)
# ------------------------------
# Itera sobre um intervalo específico de células usando ws.iter_rows():
# - min_row=1: Começa na linha 1 (cabeçalho, se houver)
# - max_row=11: Lê até a linha 11 (inclusive)
# - min_col=1: Começa na coluna A (índice 1)
# - max_col=6: Lê até a coluna F (índice 6)
# - values_only=True: Retorna apenas os valores (ignora fórmulas, formatação, etc.)
for value in ws.iter_rows(
    min_row=1, max_row=11, min_col=1, max_col=6, 
    values_only=True):
    
    # 3. ARMAZENAMENTO DOS DADOS
    # --------------------------
    # 'value' é uma tupla onde cada elemento representa uma célula da linha
    # Ex: (Nome, Email, Idade, ...) para a linha 1
    my_list.append(value)  

# 4. FORMATAÇÃO E IMPRESSÃO
# -------------------------
# Desempacota cada tupla (linha) em 6 variáveis individuais
# ATENÇÃO: Se alguma linha tiver MENOS de 6 colunas, causará erro!
for ele1, ele2, ele3, ele4, ele5, ele6 in my_list:
    
    # 5. FORMATAÇÃO DE SAÍDA
    # ----------------------
    # Usa .format() para alinhar os valores com espaçamento fixo:
    # - {:<8}: ele1 alinhado à esquerda (<) com 8 caracteres de largura
    # - {:<35}: ele2 alinhado à esquerda com 35 caracteres (útil para textos longos)
    # - Os números (8, 35, 10...) podem ser ajustados conforme necessidade
    print(
        "{:<8}{:<35}{:<10}{:<10}{:<15}{:<15}".format(
            ele1, ele2, ele3, ele4, ele5, ele6
        )
    )

# OBSERVAÇÕES IMPORTANTES:
# 1. Se a planilha tiver células VAZIAS, ele retornará 'None' para essas posições.
# 2. Se houver MAIS de 6 colunas, as extras serão ignoradas (só pega as 6 primeiras).
# 3. Para evitar erros, verifique se todas as linhas têm EXATAMENTE 6 colunas.

Rank    Name                               Platform  Year      Genre          Publisher      
1       Wii Sports                         Wii       2006      Sports         Nintendo       
2       Super Mario Bros.                  NES       1985      Platform       Nintendo       
3       Mario Kart Wii                     Wii       2008      Racing         Nintendo       
4       Wii Sports Resort                  Wii       2009      Sports         Nintendo       
5       Pokemon Red/Pokemon Blue           GB        1996      Role-Playing   Nintendo       
6       Tetris                             GB        1989      Puzzle         Nintendo       
7       New Super Mario Bros.              DS        2006      Platform       Nintendo       
8       Wii Play                           Wii       2006      Misc           Nintendo       
9       New Super Mario Bros. Wii          Wii       2009      Platform       Nintendo       
10      Duck Hunt                          NES       1984   

Esse código lê dados de um intervalo de células em uma planilha usando o método iter_rows() da biblioteca openpyxl. O método iter_rows() recebe os parâmetros min_row, max_row, min_col e max_col para especificar o intervalo de células a ser lido. O parâmetro values_only=True garante que apenas os valores das células sejam retornados, e não qualquer formatação ou outros metadados. Os valores são então anexados a uma lista vazia chamada my_list. Por fim, os valores em my_list são impressos por meio de um loop for que percorre cada elemento da lista. A função print() utiliza a formatação de cadeia de caracteres para alinhar os valores em colunas de largura fixa. O símbolo &lt; é usado para alinhar os valores à esquerda em suas respectivas colunas, e a sintaxe {:8} especifica a largura de cada coluna. Em geral, esse código lê dados de um intervalo de células em uma planilha e os imprime em uma tabela formatada.

As primeiras dez linhas de dados nas primeiras seis colunas devem ser exibidas depois que você executar o código acima:

![image.png](attachment:image.png)

# Gravação em arquivos do Excel com o Openpyxl
Agora que sabemos como acessar e ler dados de arquivos do Excel, vamos aprender a gravar neles usando o Openpyxl.

#### 1. Escrevendo em uma célula

Há duas maneiras de você gravar em um arquivo com o Openpyxl.

Primeiro, você pode acessar a célula diretamente usando sua chave:

In [12]:
ws['K1'] = 'Sum of Sales'

Esse código atribui a string "Sum of Sales" (Soma das vendas) à célula K1 na planilha representada pela variável ws. A variável ws provavelmente é uma referência a uma planilha específica em um arquivo do Excel, e o código está usando a biblioteca openpyxl para manipular o conteúdo dessa planilha. Os colchetes são usados para acessar uma célula específica na planilha, com "K1" indicando a coluna e a linha da célula. O sinal de igual é usado para atribuir o valor "Soma das vendas" a essa célula.

Uma alternativa é especificar a posição da linha e da coluna da célula na qual você gostaria de escrever:

In [13]:
ws.cell(row=1, column=11, value = 'Sum of Sales')

<Cell 'vgsales'.K1>

Esse código salva um arquivo do Excel chamado "videogamesales.xlsx". A variável "wb" provavelmente está se referindo a um objeto de pasta de trabalho aberta no Python, e o método ".save()" é usado para salvar as alterações feitas na pasta de trabalho.

Se a pasta de trabalho estiver aberta quando você tentar salvá-la, ocorrerá o seguinte erro de permissão:
![image.png](attachment:image.png)

Certifique-se de fechar o arquivo do Excel antes de salvar suas alterações. Em seguida, você pode abri-la novamente para garantir que a alteração seja refletida na planilha:
![image.png](attachment:image.png)

Observe que uma nova coluna chamada "Soma das vendas" foi criada na célula K1.

#### 2. Criando uma nova coluna

Vamos agora adicionar a soma das vendas em cada região e escrevê-la na coluna K.

Faremos isso para os dados de vendas na primeira linha:

In [14]:
row_position = 2
col_position = 7

total_sales = ((ws.cell(row=row_position, column=col_position).value)+
               (ws.cell(row=row_position, column=col_position+1).value)+
               (ws.cell(row=row_position, column=col_position+2).value)+
               (ws.cell(row=row_position, column=col_position+3).value))

ws.cell(row=2,column=11).value=total_sales
wb.save('videogamesales.xlsx')

Esse código calcula o total de vendas de um videogame somando os números de vendas de quatro colunas consecutivas em uma planilha. Primeiro, o código define as posições de linha e coluna da célula inicial para os números de vendas. A variável row_position está definida como 2, o que significa que os números de vendas estão na segunda linha da planilha. A variável col_position está definida como 7, o que significa que os números de vendas começam na sétima coluna da planilha. Em seguida, o código calcula o total de vendas somando os valores de quatro células na mesma linha. O método ws.cell() é usado para acessar cada célula, com os parâmetros row e column especificando a posição de cada célula. O operador + é usado para somar os valores das quatro células. Por fim, o código define o valor do total de vendas em uma nova célula da planilha. O método ws.cell() é usado novamente para acessar a célula, com os parâmetros row e column especificando a posição da nova célula. O atributo value da célula é definido como o valor total de vendas. Em seguida, o método wb.save() é usado para salvar as alterações no arquivo da planilha.

Observe que o total de vendas foi calculado na célula K2 para o primeiro jogo da planilha:
![image.png](attachment:image.png)

Da mesma forma, vamos criar um loop for para somar os valores de vendas em cada linha:

In [15]:
row_position = 1

for i in range(1, ws.max_row):

    row_position += 1
    NA_Sales = ws.cell(row=row_position, column=7).value
    EU_Sales = ws.cell(row=row_position, column=8).value
    JP_Sales = ws.cell(row=row_position, column=9).value
    Other_Sales = ws.cell(row=row_position, column=10).value

    total_sales = (NA_Sales + EU_Sales + JP_Sales + Other_Sales)
    ws.cell(row=row_position, column=11).value = total_sales

wb.save("videogamesales.xlsx")

Esse código foi escrito em Python e é usado para calcular o total de vendas de videogames em diferentes regiões. A primeira linha do código inicializa a variável row_position como 1. O loop for itera sobre as linhas da planilha ws, começando na linha 1 e terminando no número máximo de linhas da planilha. Dentro do loop, a variável row_position é incrementada em 1. Em seguida, os dados de vendas de cada região (América do Norte, Europa, Japão e Outros) são extraídos das colunas correspondentes da linha atual usando o método ws.cell(). O total de vendas da linha atual é calculado pela soma dos dados de vendas de todas as regiões. Por fim, o valor total das vendas é gravado na 11ª coluna da linha atual usando o método ws.cell(). No final do loop, as alterações feitas na planilha são salvas no arquivo "videogamesales.xlsx" usando o método wb.save().

Agora, seu arquivo do Excel deve ter uma nova coluna que reflete o total de vendas de videogames em todas as regiões:
![image.png](attachment:image.png)

#### 3. Anexar novas linhas

Para anexar uma nova linha à pasta de trabalho, basta criar uma tupla com os valores que você gostaria de incluir e gravá-la na planilha:

In [16]:
new_row = (1,'The Legend of Zelda',1986,'Action','Nintendo',3.74,0.93,1.69,0.14,6.51,6.5)

ws.append(new_row)
    
wb.save('videogamesales.xlsx')

Esse código foi escrito em Python e acrescenta uma nova linha de dados a um arquivo existente do Excel chamado "videogamesales.xlsx". A primeira linha cria uma tupla chamada "new_row" que contém informações sobre um videogame, como título, ano de lançamento, gênero, editora e números de vendas. A segunda linha usa o método "append" para adicionar essa nova linha de dados à planilha (ws) no arquivo do Excel. Por fim, a terceira linha salva as alterações feitas no arquivo do Excel usando o método "save" do objeto workbook (wb).

Você pode confirmar que esses dados foram anexados imprimindo a última linha da pasta de trabalho:

In [17]:
values = [ws.cell(row=ws.max_row,column=i).value for i in range(1,ws.max_column+1)]
print(values)

[1, 'The Legend of Zelda', 1986, 'Action', 'Nintendo', 3.74, 0.93, 1.69, 0.14, 6.51, 6.5]


Esse código usa a compreensão de lista para extrair os valores de todas as células na última linha de uma planilha ws em uma planilha. A função range() gera uma sequência de números de 1 até o número máximo de colunas na planilha ws. O atributo ws.max_column retorna o número máximo de colunas na planilha. O método ws.cell() retorna o objeto de célula na linha e na coluna especificadas. Nesse caso, ele retorna o objeto de célula na última linha e a coluna atual no loop. O atributo value do objeto cell retorna o valor da célula. A compreensão de lista cria uma lista de valores por meio da iteração do intervalo de colunas e da extração do valor de cada célula na última linha. A lista resultante é atribuída à variável values. Por fim, a função print() é usada para exibir a lista de valores.

A seguinte saída será gerada:

In [18]:
[1, 'The Legend of Zelda', 1986, 'Action', 'Nintendo', 3.74, 0.93, 1.69, 0.14, 6.51, 6.5]

[1,
 'The Legend of Zelda',
 1986,
 'Action',
 'Nintendo',
 3.74,
 0.93,
 1.69,
 0.14,
 6.51,
 6.5]

Esse código cria uma lista que contém informações sobre um videogame. A lista contém 11 elementos, incluindo o título do jogo, o ano de lançamento, o gênero, o editor e várias classificações. O primeiro elemento da lista é um número inteiro que representa o número de identificação do jogo. Os elementos restantes são strings ou floats que representam diferentes atributos do jogo. Esse código não usa nenhum recurso específico da linguagem, ele simplesmente cria uma lista usando colchetes e separando os elementos com vírgulas.

#### 4. Exclusão de linhas

Para excluir a nova linha que acabamos de criar, você pode executar a seguinte linha de código:

In [19]:
ws.delete_rows(ws.max_row, 1) # row number, number of rows to delete

wb.save('videogamesales.xlsx')

Esse código foi escrito em Python e é usado para excluir linhas de um arquivo do Excel. A primeira linha de código ws.delete_rows(ws.max_row, 1) exclui a última linha do arquivo do Excel. O ws.max_row retorna o número máximo de linhas na planilha e 1 especifica o número de linhas a serem excluídas. Portanto, essa linha de código exclui a última linha da planilha. A segunda linha de código wb.save('videogamesales.xlsx') salva as alterações feitas no arquivo do Excel. Você pode usar wb como o objeto da pasta de trabalho e save() como um método usado para salvar as alterações feitas na pasta de trabalho. O nome do arquivo é especificado como videogamesales.xlsx.

O primeiro argumento da função delete_rows() é o número da linha que você deseja excluir. O segundo argumento indica o número de linhas que devem ser excluídas.

# Criando fórmulas do Excel com o Openpyxl

Você pode usar o Openpyxl para escrever fórmulas exatamente como faria no Excel. Aqui estão alguns exemplos de funções básicas que você pode criar usando o Openpyxl:

#### 1. MÉDIA

Vamos criar uma nova coluna chamada "Average Sales" para calcular o total médio de vendas de videogames em todos os mercados:

In [20]:
ws['P1'] = 'Average Sales'
ws['P2'] = '= AVERAGE(K2:K16220)'

wb.save('videogamesales.xlsx')

Esse código foi escrito em Python e usa a biblioteca openpyxl para manipular arquivos do Excel. O código primeiro atribui a string "Average Sales" à célula P1 na planilha do Excel (ws). Em seguida, ele atribui uma fórmula à célula P2 usando a função MÉDIA no Excel. A fórmula calcula a média dos valores nas células K2 a K16220. Por fim, o código salva as alterações feitas no arquivo do Excel usando o método save do objeto workbook (wb).

A média de vendas em todos os mercados é de aproximadamente 0,19. Isso será impresso na célula P2 de sua planilha.

#### 2. PAÍS

A função "COUNTA" do Excel conta as células que são preenchidas em um intervalo específico. Vamos usá-lo para encontrar o número de registros entre E2 e E16220:

In [21]:
ws['Q1'] = "Number of Populated Cells" 
ws['Q2'] = '=COUNTA(E2:E16220)'

wb.save('videogamesales.xlsx')

Esse código foi escrito em Python e é usado para gravar dados em um arquivo do Excel. A primeira linha define o valor da célula Q1 na planilha (ws) como "Number of Populated Cells" (Número de células preenchidas). A segunda linha define o valor da célula Q2 na planilha (ws) como o resultado da função COUNTA aplicada ao intervalo E2:E16220. A função COUNTA conta o número de células não vazias no intervalo especificado. A terceira linha salva as alterações feitas no arquivo do Excel com o nome "videogamesales.xlsx". Em geral, esse código é usado para adicionar dados a um arquivo do Excel e calcular o número de células não vazias em um intervalo específico.

Há 16.219 registros nesse intervalo que contêm informações.

#### 3. CONTRIBUIÇÃO

COUNTIF é uma função do Excel comumente usada para contar o número de células que atendem a uma condição específica. Vamos usá-lo para contar o número de jogos nesse conjunto de dados com o gênero "Esportes":

In [22]:
ws['R1'] = 'Number of Rows with Sports Genre'
ws['R2'] = '=COUNTIF(E2:E16220, "Sports")'

wb.save('videogamesales.xlsx')

Esse código foi escrito em Python e usa a biblioteca openpyxl para manipular arquivos do Excel. O código cria um novo objeto de planilha chamado ws e define o valor da célula R1 como a string "Number of Rows with Sports Genre" (Número de linhas com gênero esportivo). Em seguida, o valor da célula R2 é definido como o resultado da função COUNTIF aplicada ao intervalo E2:E16220 com o critério "Esportes". Essa função conta o número de células do intervalo que contêm a palavra "Sports" (Esportes). Por fim, as alterações feitas na planilha são salvas no arquivo do Excel "videogamesales.xlsx" usando o método save do objeto de pasta de trabalho wb.

Há 2.296 jogos esportivos no conjunto de dados.

#### 4. SUMIF

Agora, vamos descobrir a "Soma de vendas" total gerada pelos jogos esportivos usando a função SUMIF:

In [23]:
ws['S1'] = 'Total Sports Sales'
ws['S2'] = '=SUMIF(E2:E16220, "Sports",K2:K16220)'
 
wb.save('videogamesales.xlsx')

Esse código foi escrito em Python e usa a biblioteca openpyxl para manipular arquivos do Excel. A primeira linha define o valor da célula S1 na planilha (ws) como "Total Sports Sales". A segunda linha calcula a soma de todos os valores na coluna K (K2:K16220) em que o valor correspondente na coluna E (E2:E16220) é igual a "Esportes". Essa soma é então atribuída à célula S2 na planilha. Por fim, as alterações feitas na pasta de trabalho (wb) são salvas em um arquivo chamado "videogamesales.xlsx".

O número total de vendas geradas por jogos esportivos é 454.

#### 5. TETO

A função CEILING do Excel arredonda um número até o múltiplo especificado mais próximo. Vamos arredondar o valor total das vendas geradas pelos jogos esportivos usando essa função:

In [24]:
ws['T1'] = 'Rounded Sum of Sports Sales'
ws['T2'] = '=CEILING(S2,25)'

wb.save('videogamesales.xlsx')

Esse código foi escrito em Python e está usando a biblioteca openpyxl para manipular um arquivo do Excel. A primeira linha define o valor da célula T1 na planilha (ws) como "Rounded Sum of Sports Sales". A segunda linha define o valor da célula T2 na planilha como o resultado da função CEILING aplicada ao valor da célula S2. A função CEILING arredonda um número para o múltiplo mais próximo de um valor especificado, que, nesse caso, é 25. Por fim, a terceira linha salva as alterações feitas no arquivo do Excel com o nome "videogamesales.xlsx".

Arredondamos o total de vendas geradas por jogos esportivos para o múltiplo mais próximo de 25, o que gera um resultado de 475.

Os trechos de código acima devem gerar a seguinte saída em sua planilha do Excel (das células P1 a T2):

![image.png](attachment:image.png)

Você pode consultar nossa Folha de dicas básicas do Excel para saber mais sobre fórmulas, operadores, funções matemáticas e computação condicional do Excel.

# Trabalhando com planilhas no Openpyxl

Agora que sabemos como acessar planilhas e gravar nelas, vamos aprender a manipular, remover e duplicá-las usando o Openpyxl.

#### 1. Como alterar nomes de planilhas

Primeiro, vamos imprimir o nome da planilha ativa com a qual estamos trabalhando no momento usando o atributo title do Openpyxl:

In [25]:
print(ws.title)

vgsales


Esse trecho de código foi escrito em Python. A função print() é usada para exibir a saída no console. ws.title está acessando o atributo title do objeto ws. Esse código provavelmente faz parte de um programa maior que trabalha com uma planilha ou pasta de trabalho. O atributo title provavelmente armazena o título de uma planilha dentro da pasta de trabalho. Portanto, esse código está imprimindo o título da planilha no console.

Você verá o seguinte resultado: vgsales

Agora, vamos renomear essa planilha usando as seguintes linhas de código:

In [26]:
ws.title ='Video Game Sales Data'

wb.save('videogamesales.xlsx')

Esse código foi escrito em Python e está usando a biblioteca openpyxl para trabalhar com arquivos do Excel. A primeira linha define o título da planilha como "Video Game Sales Data". "ws" é uma variável que representa o objeto da planilha que foi criado anteriormente no código. A segunda linha salva a pasta de trabalho com o nome 'videogamesales.xlsx'. 'wb' é uma variável que representa o objeto da pasta de trabalho que foi criado anteriormente no código. Em geral, esse código define o título da planilha e salva a pasta de trabalho com o título atualizado e todas as alterações feitas nele.

O nome da planilha ativa agora deve ser alterado para "Video Game Sales Data".

#### 2. Criando uma nova planilha

Execute a seguinte linha de código para listar todas as planilhas da pasta de trabalho:

In [27]:
print(wb.sheetnames)

['Video Game Sales Data', 'Total Sales by Genre', 'Breakdown of Sales by Genre', 'Breakdown of Sales by Year']


Esse trecho de código foi escrito em Python. O código imprime os nomes das planilhas de uma pasta de trabalho do Excel. Presume-se que a variável wb seja uma instância da classe Workbook do módulo openpyxl, que representa uma pasta de trabalho do Excel. O atributo sheetnames da classe Workbook é uma lista dos nomes de todas as planilhas da pasta de trabalho. Portanto, wb.sheetnames retorna uma lista de nomes de planilhas e print(wb.sheetnames) imprime essa lista no console.

Você verá uma matriz listando os nomes de todas as planilhas do arquivo: ['Video Game Sales Data', 'Total Sales by Genre', 'Breakdown of Sales by Genre', 'Breakdown of Sales by Year']

Agora, vamos criar uma nova planilha vazia:

In [28]:
wb.create_sheet('Empty Sheet') # create an empty sheet
print(wb.sheetnames) # print sheet names again

wb.save('videogamesales.xlsx')

['Video Game Sales Data', 'Total Sales by Genre', 'Breakdown of Sales by Genre', 'Breakdown of Sales by Year', 'Empty Sheet']


Esse código cria uma nova planilha chamada 'Empty Sheet' em uma pasta de trabalho existente do Excel usando o método create_sheet() do objeto wb. Em seguida, ele imprime os nomes de todas as planilhas da pasta de trabalho usando o atributo sheetnames do objeto wb. Por fim, ele salva as alterações feitas na pasta de trabalho usando o método save() do objeto wb. Observe que se supõe que wb seja uma instância da classe openpyxl.Workbook, que é uma biblioteca Python para trabalhar com arquivos do Excel.

Observe que uma nova planilha chamada "Empty Sheet" foi criada: ['Video Game Sales Data', 'Total Sales by Genre', 'Breakdown of Sales by Genre', 'Breakdown of Sales by Year', ‘Empty Sheet’]