DataFrame


A DataFrame is a table. It contains an array of individual entries, each of which has a certain value. Each entry corresponds to a row (or record) and a column.

In [118]:
import pandas as pd
pd.DataFrame({'Yes': [50, 21], 'No': [131, 2]})
pd.DataFrame({'Yes': [50, 21], 'No': [131, 2]}, index=['A', 'B'])


Unnamed: 0,Yes,No
A,50,131
B,21,2


We are using the pd.DataFrame() constructor to generate these DataFrame objects. The syntax for declaring a new one is a dictionary whose keys are the column names (Bob and Sue in this example), and whose values are a list of entries. This is the standard way of constructing a new DataFrame, and the one you are most likely to encounter.

In [119]:
pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'], 'Sue': ['Pretty good.', 'Bland.']})

Unnamed: 0,Bob,Sue
0,I liked it.,Pretty good.
1,It was awful.,Bland.


fefef

In [120]:
pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'], 
              'Sue': ['Pretty good.', 'Bland.']},
             index=['Product A', 'Product B'])

Unnamed: 0,Bob,Sue
Product A,I liked it.,Pretty good.
Product B,It was awful.,Bland.


Series

A Series, by contrast, is a sequence of data values. If a DataFrame is a table, a Series is a list. And in fact you can create one with nothing more than a list:

In [121]:
pd.Series([1 , 2, 3 ,4 , 5])

0    1
1    2
2    3
3    4
4    5
dtype: int64

In [122]:
pd.Series([1 ,2, 3, 4, 5], index=['a', 'b', 'c', 'd', 'e'], name='series_name')

a    1
b    2
c    3
d    4
e    5
Name: series_name, dtype: int64

In [123]:
pd.Series([30, 35, 40], index=['2015 Sales', '2016 Sales', '2017 Sales'], name='Product A')

2015 Sales    30
2016 Sales    35
2017 Sales    40
Name: Product A, dtype: int64

Reading Data files

Being able to create a DataFrame or Series by hand is handy. But, most of the time, we won't actually be creating our own data by hand. Instead, we'll be working with data that already exists.

Data can be stored in any of a number of different forms and formats. By far the most basic of these is the humble CSV file. When you open a CSV file you get something that looks like this:

In [124]:
pd.read_csv('C:\Prog\Kaggle\Pandas\Create,Reading and Writing\Teoria\Pesquisa - Serviços de Streaming.csv')

Unnamed: 0,Carimbo de data/hora,Quais serviços você conhece? (selecione uma ou mais),Quais serviços você ou sua família assinam? (selecione uma ou mais),Quais serviços você mais gosta? (selecione uma ou mais),Idade,Gênero,Ocupação,Quantas crianças (menor de 10 anos) moram com você?,Tipo de conteúdo preferido:,"Durante a semana, quantas horas você assiste de streaming por dia?","De final de semana, quantas horas você assiste de streaming por dia?",Quais dispositivos você utiliza para assistir streaming? (selecione uma ou mais),Qual preço você julga justo assinar?,Qual sua renda familiar mensal?,O que poderia melhorar nos serviços de streaming que você assina?
0,2022/05/03 10:21:32 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Hulu...,Netflix;Prime Video;HBO Max ...,Disney+;Prime Video ...,20,Masculino,Estudando,0 ...,Séries,1,2,Celular ...,"R$15,00 - R$25,00","R$10.000,00 - R$20.000,00",Maior catálogo de filmes e séries
1,2022/05/03 10:27:36 AM GMT-3,Netflix;Disney+;Prime Video;HBO Max;Hulu;Globo...,Netflix;Prime Video;Crunchyroll ...,Netflix;Prime Video;HBO Max ...,20,Masculino,Estudando,0 ...,Séries,0,1,Smart TV ...,"R$15,00 - R$25,00","Mais de R$20.000,00",Maior catálogo de filmes e séries;Conexão;Inte...
2,2022/05/03 10:29:52 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Hulu...,Netflix;Disney+;Star+;Prime Video;HBO Max;NBA ...,Netflix;Disney+;Star+;HBO Max ...,19,Masculino,Estudando,0 ...,Séries,1,1,Smart TV;Google Chromecast ou similar;Tablet o...,"R$15,00 - R$25,00","R$10.000,00 - R$20.000,00",Preço
3,2022/05/03 10:49:56 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max ...,Netflix;Disney+;Prime Video;HBO Max ...,Netflix;Disney+;HBO Max ...,22,Masculino,Estudando e Trabalhando,0 ...,Séries,5,6,Notebook ou PC ...,"R$25,00 - R$35,00","R$1.000,00 - R$5.000,00",Preço;Maior catálogo de filmes e séries
4,2022/05/03 10:50:22 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Hulu...,Netflix;Disney+;Star+;Prime Video;HBO Max ...,Netflix;Disney+;Prime Video;HBO Max;Globoplay ...,20 anos,Feminino,Estudando e Trabalhando,0 ...,Séries,4,6,Smart TV;Celular ...,"R$15,00 - R$25,00","R$5.000,00 - R$10.000,00",Preço;Maior catálogo de filmes e séries
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
199,2022/05/04 5:07:18 PM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Glob...,Netflix;Disney+;Star+;HBO Max ...,Netflix;HBO Max ...,19,Masculino,Estudando,0 ...,Séries,1,4,Smart TV;Celular;Notebook ou PC ...,"R$15,00 - R$25,00","R$10.000,00 - R$20.000,00",Preço;Interface
200,2022/05/04 6:31:57 PM GMT-3,Netflix;Prime Video;HBO Max;Globoplay ...,Netflix;Prime Video;HBO Max ...,Netflix;HBO Max ...,69,Masculino,Trabalhando,0 ...,Filmes,1,6,Smart TV ...,"R$25,00 - R$35,00","Mais de R$20.000,00",Maior catálogo de filmes e séries
201,2022/05/04 7:55:56 PM GMT-3,Netflix;Disney+;Star+;Prime Video;Globoplay ...,Netflix;Star+;Prime Video;Globoplay ...,Netflix;Star+;Globoplay ...,54,Feminino,Estudando e Trabalhando,0 ...,Filmes,6,5,Smart TV;Celular;Notebook ou PC ...,"R$15,00 - R$25,00","R$10.000,00 - R$20.000,00",Preço;Maior catálogo de filmes e séries
202,2022/05/04 8:18:09 PM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Glob...,Netflix;Prime Video;Globoplay ...,Netflix;Globoplay ...,40,Masculino,Estudando e Trabalhando,0 ...,Filmes,2,2,Smart TV ...,"R$25,00 - R$35,00","R$10.000,00 - R$20.000,00",Maior catálogo de filmes e séries


We can use the shape attribute to check how large the resulting DataFrame is:

In [125]:
file = pd.read_csv('C:\Prog\Kaggle\Pandas\Create,Reading and Writing\Teoria\Pesquisa - Serviços de Streaming.csv')
file.shape

(204, 15)

We can examine the contents of the resultant DataFrame using the head() command, which grabs the first five rows:


In [126]:
file.head()

Unnamed: 0,Carimbo de data/hora,Quais serviços você conhece? (selecione uma ou mais),Quais serviços você ou sua família assinam? (selecione uma ou mais),Quais serviços você mais gosta? (selecione uma ou mais),Idade,Gênero,Ocupação,Quantas crianças (menor de 10 anos) moram com você?,Tipo de conteúdo preferido:,"Durante a semana, quantas horas você assiste de streaming por dia?","De final de semana, quantas horas você assiste de streaming por dia?",Quais dispositivos você utiliza para assistir streaming? (selecione uma ou mais),Qual preço você julga justo assinar?,Qual sua renda familiar mensal?,O que poderia melhorar nos serviços de streaming que você assina?
0,2022/05/03 10:21:32 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Hulu...,Netflix;Prime Video;HBO Max ...,Disney+;Prime Video ...,20,Masculino,Estudando,0 ...,Séries,1,2,Celular ...,"R$15,00 - R$25,00","R$10.000,00 - R$20.000,00",Maior catálogo de filmes e séries
1,2022/05/03 10:27:36 AM GMT-3,Netflix;Disney+;Prime Video;HBO Max;Hulu;Globo...,Netflix;Prime Video;Crunchyroll ...,Netflix;Prime Video;HBO Max ...,20,Masculino,Estudando,0 ...,Séries,0,1,Smart TV ...,"R$15,00 - R$25,00","Mais de R$20.000,00",Maior catálogo de filmes e séries;Conexão;Inte...
2,2022/05/03 10:29:52 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Hulu...,Netflix;Disney+;Star+;Prime Video;HBO Max;NBA ...,Netflix;Disney+;Star+;HBO Max ...,19,Masculino,Estudando,0 ...,Séries,1,1,Smart TV;Google Chromecast ou similar;Tablet o...,"R$15,00 - R$25,00","R$10.000,00 - R$20.000,00",Preço
3,2022/05/03 10:49:56 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max ...,Netflix;Disney+;Prime Video;HBO Max ...,Netflix;Disney+;HBO Max ...,22,Masculino,Estudando e Trabalhando,0 ...,Séries,5,6,Notebook ou PC ...,"R$25,00 - R$35,00","R$1.000,00 - R$5.000,00",Preço;Maior catálogo de filmes e séries
4,2022/05/03 10:50:22 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Hulu...,Netflix;Disney+;Star+;Prime Video;HBO Max ...,Netflix;Disney+;Prime Video;HBO Max;Globoplay ...,20 anos,Feminino,Estudando e Trabalhando,0 ...,Séries,4,6,Smart TV;Celular ...,"R$15,00 - R$25,00","R$5.000,00 - R$10.000,00",Preço;Maior catálogo de filmes e séries


In [127]:
file = pd.read_csv('C:\Prog\Kaggle\Pandas\Create,Reading and Writing\Teoria\Pesquisa - Serviços de Streaming.csv',index_col=0)
file.head()

Unnamed: 0_level_0,Quais serviços você conhece? (selecione uma ou mais),Quais serviços você ou sua família assinam? (selecione uma ou mais),Quais serviços você mais gosta? (selecione uma ou mais),Idade,Gênero,Ocupação,Quantas crianças (menor de 10 anos) moram com você?,Tipo de conteúdo preferido:,"Durante a semana, quantas horas você assiste de streaming por dia?","De final de semana, quantas horas você assiste de streaming por dia?",Quais dispositivos você utiliza para assistir streaming? (selecione uma ou mais),Qual preço você julga justo assinar?,Qual sua renda familiar mensal?,O que poderia melhorar nos serviços de streaming que você assina?
Carimbo de data/hora,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1
2022/05/03 10:21:32 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Hulu...,Netflix;Prime Video;HBO Max ...,Disney+;Prime Video ...,20,Masculino,Estudando,0 ...,Séries,1,2,Celular ...,"R$15,00 - R$25,00","R$10.000,00 - R$20.000,00",Maior catálogo de filmes e séries
2022/05/03 10:27:36 AM GMT-3,Netflix;Disney+;Prime Video;HBO Max;Hulu;Globo...,Netflix;Prime Video;Crunchyroll ...,Netflix;Prime Video;HBO Max ...,20,Masculino,Estudando,0 ...,Séries,0,1,Smart TV ...,"R$15,00 - R$25,00","Mais de R$20.000,00",Maior catálogo de filmes e séries;Conexão;Inte...
2022/05/03 10:29:52 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Hulu...,Netflix;Disney+;Star+;Prime Video;HBO Max;NBA ...,Netflix;Disney+;Star+;HBO Max ...,19,Masculino,Estudando,0 ...,Séries,1,1,Smart TV;Google Chromecast ou similar;Tablet o...,"R$15,00 - R$25,00","R$10.000,00 - R$20.000,00",Preço
2022/05/03 10:49:56 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max ...,Netflix;Disney+;Prime Video;HBO Max ...,Netflix;Disney+;HBO Max ...,22,Masculino,Estudando e Trabalhando,0 ...,Séries,5,6,Notebook ou PC ...,"R$25,00 - R$35,00","R$1.000,00 - R$5.000,00",Preço;Maior catálogo de filmes e séries
2022/05/03 10:50:22 AM GMT-3,Netflix;Disney+;Star+;Prime Video;HBO Max;Hulu...,Netflix;Disney+;Star+;Prime Video;HBO Max ...,Netflix;Disney+;Prime Video;HBO Max;Globoplay ...,20 anos,Feminino,Estudando e Trabalhando,0 ...,Séries,4,6,Smart TV;Celular ...,"R$15,00 - R$25,00","R$5.000,00 - R$10.000,00",Preço;Maior catálogo de filmes e séries
