# **Links fornecidos para análise**

Este link fornece [exemplos do *General Transit Feed Specification* (GTFS)](https://gtfs.org/pt-BR/schedule/examples) com informações mais detalhadas sobre o recurso. Já [este link forneciodo pelo Google](https://developers.google.com/transit/gtfs?hl=pt-br) apresenta as mesmas informações sobre o GTFS do link anterior, porém, com os dados seguindo uma coloração específica, ajudando na identificação de alguns dados como texto, número, links, etc. Entretanto, apenas alguns exemplos são apresentados em formato de tabela.

# **Lendo os dados em formato de tabela**

O código abaixo foi criado para facilitar a visualização dos dados em formato de tabela (DataFrame para analistas de dados). Você pode utilizá-lo para observar de forma estruturada os dados fornecidos nos links acima. Um dicionário foi criado para facilitar o acesso a cada um dos datasets quando necessário. Forneça a chave para o dicionário antes de guardar a informação na variável "fonte".


```
datasets = {
    1: "agency",
    2: "calendar",
    ...
    11: "trips"
}
```


Na chamada do dicionário identifique qual dataset gostaria de visualizar os dados e forneça sua chave correspondente ao arquivo escolhido.
```
dataset[1] # agency
dataset[2] # calendar
```

*Por Danilo Castro*

In [56]:
# Biblioteca utilizada para ler o arquivo e visualizar os dados em formato
# de DataFrame, uma espécie de tabela no universo da análise de dados.
import pandas as pd

# Estrutura criada para acessar os dados de cada dataset facilmente, assim,
# através de sua chave podemos acessar o valor.
datasets = {
    1: "agency",
    2: "calendar",
    3: "calendar_dates",
    4: "fare_attributes",
    5: "fare_rules",
    6: "frequencies",
    7: "routes",
    8: "shapes",
    9: "stop_times",
    10: "stops",
    11: "trips"
}

# Organizando a fonte dos dados antes do acesso, a separação ficou da seguinte
# forma, conforme tabela abaixo. Para ler um novo dataset, basta mudar a chave
# no par de colchetes na chamada do dicionário --> dataset[chave]
#
# |----------------------------------------------------------------------------|
# | ELEMENTO    | DESCRIÇÃO                                       | TIPO       |
# |---------------------------------------------------------------|------------|
# | sample_feed | pasta onde os datasets estão armazenados        | string     |
# | datasets    | dicionário que facilita o acesso a cada dataset | dictionary |
# | .txt        | é a extensão separada dos valores no dicionário | string     |
# |---------------------------------------------------------------|------------|
fonte = "sample_feed/" + datasets[1] + ".txt"

# Lendo o dataset que foi guardando na variável "fonte"
dados = pd.read_csv(fonte, encoding="utf8", sep=",")

# Visualizando os dados do dataset lido
dados

Unnamed: 0,agency_id,agency_name,agency_url,agency_timezone
0,DTA,Demo Transit Authority,http://google.com,America/Los_Angeles
