**Cientista de Dados EBAC** -> Exercício Módulo 6

# 0. Preparação do ambiente

## *carros.csv*

In [1]:
%%writefile carros.csv
id,valor_venda,valor_manutencao,portas,pessoas,porta_malas
1,vhigh,med,2,2,small
2,med,vhigh,2,2,small
3,low,vhigh,2,2,small
4,low,high,2,2,small
5,low,high,2,2,small
6,low,high,4,4,big
7,low,high,4,4,big
8,low,med,2,2,small
9,low,med,2,2,small
10,low,med,2,2,small
11,low,med,4,4,big
12,low,low,2,2,small
13,low,low,4,4,small
14,low,low,4,4,med

Overwriting carros.csv


## *musica.csv*

In [2]:
%%writefile musica.txt
Roda Viva
Chico Buarque

Tem dias que a gente se sente
Como quem partiu ou morreu
A gente estancou de repente
Ou foi o mundo então que cresceu
A gente quer ter voz ativa
No nosso destino mandar
Mas eis que chega a roda viva
E carrega o destino pra lá

Roda mundo, roda-gigante
Roda moinho, roda pião

O tempo rodou num instante
Nas voltas do meu coração
A gente vai contra a corrente
Até não poder resistir
Na volta do barco é que sente
O quanto deixou de cumprir
Faz tempo que a gente cultiva
A mais linda roseira que há
Mas eis que chega a roda viva
E carrega a roseira pra lá

Roda mundo, roda-gigante
Roda moinho, roda pião

Overwriting musica.txt


## 1\. Classe para ler arquivos de texto

## 1.1 Crie a classe `ArquivoTexto`. Ela deve conter os seguintes atributos:

*   `self.arquivo`: Atributo do tipo `str` com o nome do arquivo;
*   `self.conteudo`: Atributo do tipo `list` onde cada elemento é uma linha do arquivo;

A classe também deve conter o seguinte método:

*   `self.extrair_conteudo`: Método que realiza a leitura do arquivo e retorna o conteúdo.

*   `self.extrair_linha`: Método que recebe como parâmetro o número da linha e retorna a linha do conteúdo.


In [3]:
class ArquivoTexto:
    def __init__(self, arquivo: str) -> None:
        '''
            Inicializador da classe.
            :param arquivo (str): Caminho do arquivo
            :param conteudo (list): Lista com as linhas do arquivo
        '''
        self.arquivo = arquivo
        self.conteudo = self.__extrair_conteudo()

    def __extrair_conteudo(self) -> list|str:
        '''
          Função que abre o arquivo passado como atributo na instânciação
          da classe.

          :return linhas_listadas (list): Retorna o conteudo ou o erro.
        '''
        try:
          with open(file=self.arquivo, mode="r", encoding="utf8") as file:
              arquivo = file.readlines()

          # Formatando os valores da lista, para obter uma lista de listas
          edita_linhas = lambda x: x.strip().split(sep=",")
          linhas_listadas = list(map(edita_linhas, arquivo))
          return linhas_listadas
        except Exception as error:
          return error

    def extrair_linha(self, numero_linha: int) -> list|str:
        '''
            Função que recupera uma linha da lista instânciada na classe. Caso
            indíce não exista, retorna o erro.

            :param numero_linha (int): Index da linha na lista instanciada.
            :return self.conteudo (list): Retorna o conteudo da lista ou o erro.
        '''
        try:
            return self.conteudo[numero_linha]
        except IndexError as index_error:
            return index_error
        except Exception as exception_error:
            return exception_error

## 1.1.1 Utilize o código abaixo para testar sua classe.

In [4]:
# Simulando erro no caminho do arquivo
novo_arquivo = ArquivoTexto("music.txt")

novo_arquivo.extrair_linha(numero_linha=1)

TypeError("'FileNotFoundError' object is not subscriptable")

In [5]:
# Simulando erro no indice da linha
novo_arquivo = ArquivoTexto("musica.txt")

novo_arquivo.extrair_linha(numero_linha=100)

IndexError('list index out of range')

In [6]:
# Execução correta
novo_arquivo = ArquivoTexto("musica.txt")

print(novo_arquivo.extrair_linha(numero_linha=10), end="\n\n")

for conteudo in novo_arquivo.conteudo:
  print(conteudo)

['E carrega o destino pra lá']

['Roda Viva']
['Chico Buarque']
['']
['Tem dias que a gente se sente']
['Como quem partiu ou morreu']
['A gente estancou de repente']
['Ou foi o mundo então que cresceu']
['A gente quer ter voz ativa']
['No nosso destino mandar']
['Mas eis que chega a roda viva']
['E carrega o destino pra lá']
['']
['Roda mundo', ' roda-gigante']
['Roda moinho', ' roda pião']
['']
['O tempo rodou num instante']
['Nas voltas do meu coração']
['A gente vai contra a corrente']
['Até não poder resistir']
['Na volta do barco é que sente']
['O quanto deixou de cumprir']
['Faz tempo que a gente cultiva']
['A mais linda roseira que há']
['Mas eis que chega a roda viva']
['E carrega a roseira pra lá']
['']
['Roda mundo', ' roda-gigante']
['Roda moinho', ' roda pião']


---

# 2. Classe para ler arquivos de csv

Crie a classe `ArquivoCSV`. Ela deve extender (herdar) a classe `ArquivoTexto` para reaproveitar os seus atributos (`self.arquivo` e `self.conteudo`). Além disso, adicione o seguinte atributo:

*   `self.colunas`: Atributo do tipo `list` onde os elementos são os nome das colunas;

A classe também deve conter o seguinte método:

*   `self.extrair_nome_colunas`: Método que retorna o nome das colunas do arquivo.


*   `extrair_coluna`: Método que recebe como parâmetro o indice da coluna e retorna o valor em questão.

In [7]:
class ArquivoCSV(ArquivoTexto):
    def __init__(self, arquivo: str) -> None:
        '''
            Inicializador da classe que extende ArquivoTexto.

            :param arquivo (str): Caminho do arquivo
            :param conteudo (list): Lista com as linhas do arquivo
            :param colunas (list): Os elementos são os nome das colunas
        '''
        super().__init__(arquivo=arquivo)

        self.colunas = self.__extrair_nome_colunas()

    def __extrair_nome_colunas(self) -> list:
        '''
          Método que retorna o nome das colunas do arquivo.

          :return nome_colunas (list): Nome das colunas do arquivo.
        '''
        nome_colunas = self.extrair_linha(numero_linha=0)
        return nome_colunas


    def __converte_lista_para_dicionario(self) -> list:
        '''
            Método map para unir cada uma das varíáveis com seu index em um
            dicionário, usando a função zip.

            :return conteudos (list): Lista com o conteudo em formato dict
        '''
        obtendo_conteudo = lambda x: dict(zip(self.conteudo[0], x))
        conteudos = list(map(obtendo_conteudo, self.conteudo[1:]))
        return conteudos


    def extrair_coluna(self, nome_coluna: str) -> list|str:
        '''
            Método que recebe como parâmetro o indice da coluna e retorna o
            valor em questão.

            :param nome_coluna (str): Indice da coluna no dicionario conteudo.
            :return conteudo_coluna (list): Retorna o conteudo da lista ou o erro.
        '''
        try:
          conteudo_dict = self.__converte_lista_para_dicionario()
          conteudo_coluna = [conteudo[nome_coluna] for conteudo in conteudo_dict]
          return conteudo_coluna
        except KeyError as error:
          return f"Coluna {error} não encontrada"

In [8]:
# Execução correta
arquivo_csv = ArquivoCSV(arquivo='carros.csv')

numero_linha = 0
print(arquivo_csv.extrair_linha(numero_linha=numero_linha))
# id,valor_venda,valor_manutencao,portas,pessoas,porta_malas

print(arquivo_csv.colunas)
# ['id', 'valor_venda', 'valor_manutencao', 'portas', 'pessoas', 'porta_malas']

numero_linha = 9
print(arquivo_csv.extrair_linha(numero_linha=numero_linha))
# 9,low,med,2,2,small


nome_coluna = "valor_manutencao"
print(arquivo_csv.extrair_coluna(nome_coluna=nome_coluna))
# ['med', 'vhigh', 'vhigh', 'high', 'high', 'high', 'high', 'med', 'med', 'med', 'med', 'low', 'low', 'low']

['id', 'valor_venda', 'valor_manutencao', 'portas', 'pessoas', 'porta_malas']
['id', 'valor_venda', 'valor_manutencao', 'portas', 'pessoas', 'porta_malas']
['9', 'low', 'med', '2', '2', 'small']
['med', 'vhigh', 'vhigh', 'high', 'high', 'high', 'high', 'med', 'med', 'med', 'med', 'low', 'low', 'low']


In [9]:
# Recuperando o conteudo completo
arquivo_csv.conteudo

[['id', 'valor_venda', 'valor_manutencao', 'portas', 'pessoas', 'porta_malas'],
 ['1', 'vhigh', 'med', '2', '2', 'small'],
 ['2', 'med', 'vhigh', '2', '2', 'small'],
 ['3', 'low', 'vhigh', '2', '2', 'small'],
 ['4', 'low', 'high', '2', '2', 'small'],
 ['5', 'low', 'high', '2', '2', 'small'],
 ['6', 'low', 'high', '4', '4', 'big'],
 ['7', 'low', 'high', '4', '4', 'big'],
 ['8', 'low', 'med', '2', '2', 'small'],
 ['9', 'low', 'med', '2', '2', 'small'],
 ['10', 'low', 'med', '2', '2', 'small'],
 ['11', 'low', 'med', '4', '4', 'big'],
 ['12', 'low', 'low', '2', '2', 'small'],
 ['13', 'low', 'low', '4', '4', 'small'],
 ['14', 'low', 'low', '4', '4', 'med']]

In [10]:
# Simulação de erros
numero_linha = 1_000
print(arquivo_csv.extrair_linha(numero_linha=numero_linha))
# ilist index out of range

print(arquivo_csv.colunas)
# ['id', 'valor_venda', 'valor_manutencao', 'portas', 'pessoas', 'porta_malas']

numero_linha = 900
print(arquivo_csv.extrair_linha(numero_linha=numero_linha))
# list index out of range


nome_coluna = "valor_manutencao_erro"
print(arquivo_csv.extrair_coluna(nome_coluna=nome_coluna))
# Coluna 'valor_manutencao_erro' não encontrada

list index out of range
['id', 'valor_venda', 'valor_manutencao', 'portas', 'pessoas', 'porta_malas']
list index out of range
Coluna 'valor_manutencao_erro' não encontrada




---



# 3. Bônus

## 3.1 1. Classe para ler o arquivo csv

Crie a classe `ArquivoCSV2`. Ela deve extender (herdar) a classe `ArquivoTexto` para reaproveitar o seu atributos `self.arquivo` e o método `self.extrair_linha`.


A classe também deve conter o seguinte método:

*   `self.extrair_coluna_da_linha`: Método que recebe como parâmetro o numero da linha e o indice da coluna e retorna o valor em questão.

In [11]:
class ArquivoCSV3(ArquivoTexto):
  def __init__(self, arquivo: str) -> None:
    '''
        Inicializador da classe que extende ArquivoTexto.

        :param arquivo (str): Caminho do arquivo
    '''
    super().__init__(arquivo=arquivo)

  def extrair_coluna_da_linha(self, numero_linha: int, indice_coluna: int) -> str:
    '''
      Método que extrai um valor único de uma coordenada indice/coluna

      :return valor (str): Valor buscado na coordenada indice/coluna ou erro.
    '''
    try:
      coluna = self.extrair_linha(numero_linha=numero_linha)
      valor = coluna[indice_coluna]
      return valor
    except IndexError as error1:
      return error1
    except TypeError as error2:
      return error2

In [12]:
# Simula um erro no indice da coluna
arquivo_csv3 = ArquivoCSV3(arquivo="carros.csv")

indice_coluna = 1_000_000
numero_linha = 1
print(arquivo_csv3.extrair_coluna_da_linha(
                                            numero_linha=numero_linha,
                                            indice_coluna=indice_coluna
))
# list index out of range

list index out of range


In [13]:
# Simula um erro no indice da linha
indice_coluna = 1
numero_linha = 1_000_000
print(arquivo_csv3.extrair_coluna_da_linha(
                                            numero_linha=numero_linha,
                                            indice_coluna=indice_coluna
))
# 'IndexError' object is not subscriptable

'IndexError' object is not subscriptable


In [14]:
# Execução correta
indice_coluna = 1
numero_linha = 1
print(arquivo_csv3.extrair_coluna_da_linha(
                                            numero_linha=numero_linha,
                                            indice_coluna=indice_coluna
))
#'vhigh'

vhigh


In [15]:
class ArquivoCSV2(ArquivoCSV):
  def __init__(self, arquivo: str) -> None:
    '''
        Inicializador da classe que extende ArquivoTexto.

        :param arquivo (str): Caminho do arquivo
    '''
    super().__init__(arquivo=arquivo)

  def extrair_coluna_da_linha(self, numero_linha: int, indice_coluna: str) -> str:
    '''
      Método que extrai um valor único de uma coordenada indice/coluna

      :return valor (str): Valor buscado na coordenada indice/coluna ou erro.
    '''
    try:
      coluna = self.extrair_coluna(nome_coluna=indice_coluna)
      valor = str(coluna[numero_linha])
      return valor
    except IndexError as error:
      return error

In [16]:
# Simula erro no indice da linha
arquivo_csv2 = ArquivoCSV2(arquivo="carros.csv")

nome_coluna = "valor_manutencao"
print(arquivo_csv2.extrair_coluna(nome_coluna=nome_coluna))
# ['med', 'vhigh', 'vhigh', 'high', 'high', 'high', 'high', 'med', 'med', 'med', 'med', 'low', 'low', 'low']

numero_linha = 1_000_00
print(arquivo_csv2.extrair_coluna_da_linha(
                                            numero_linha=numero_linha,
                                            indice_coluna=nome_coluna
))
# list index out of range

['med', 'vhigh', 'vhigh', 'high', 'high', 'high', 'high', 'med', 'med', 'med', 'med', 'low', 'low', 'low']
list index out of range


In [17]:
# Simula um erro no nome da coluna
nome_coluna = "alor_manutencao"
print(arquivo_csv2.extrair_coluna(nome_coluna=nome_coluna))
# Coluna 'alor_manutencao' não encontrada

numero_linha = 1
print(arquivo_csv2.extrair_coluna_da_linha(
                                            numero_linha=numero_linha,
                                            indice_coluna=nome_coluna
))
# o

Coluna 'alor_manutencao' não encontrada
o


In [18]:
# Execução correta
nome_coluna = "valor_manutencao"
print(arquivo_csv2.extrair_coluna(nome_coluna=nome_coluna))
# ['med', 'vhigh', 'vhigh', 'high', 'high', 'high', 'high', 'med', 'med', 'med', 'med', 'low', 'low', 'low']

numero_linha = 1
print(arquivo_csv2.extrair_coluna_da_linha(
                                            numero_linha=numero_linha,
                                            indice_coluna=nome_coluna
))
#'vhigh'

['med', 'vhigh', 'vhigh', 'high', 'high', 'high', 'high', 'med', 'med', 'med', 'med', 'low', 'low', 'low']
vhigh




---

