**Objetivo**: responder preguntas sobre los datos usando Pandas.

Estos ejercicios son la traducción del tutorial de Brandon Rhodes "Pandas from the ground up" https://github.com/brandon-rhodes/pycon-pandas-tutorial. Bajo licencia MIT.

Su tutorial también está disponible en video: https://www.youtube.com/watch?v=5JnMutdy6Fw

Lo primero es descargar los datasets. Baja estos archivos y copialos al directorio ``data``:
- [titles.csv.gz](https://doc-08-7o-docs.googleusercontent.com/docs/securesc/e6usg7cilu8dk4jroot4hkp0j2enilu3/8jos36qsvkruj11t1ftffg6mvlq675ho/1507212000000/08589481064704159121/08589481064704159121/0B5A0V_ZHbZvQVWdRZWFPQUN5MDg?h=18025113476888111704&e=download)
- [cast.csv.gz](https://doc-0c-7o-docs.googleusercontent.com/docs/securesc/e6usg7cilu8dk4jroot4hkp0j2enilu3/el9hksr4tc2q2rmkveqglt3q7aile4fk/1507212000000/08589481064704159121/08589481064704159121/0B5A0V_ZHbZvQX0ktVmJZczgwSWM?h=18025113476888111704&e=download)

Si tienes problemas para descargar los datos, prueba con [este link](https://drive.google.com/drive/folders/0B5A0V_ZHbZvQWlItNTJUVUQ0WFk?usp=sharing).

In [1]:
%matplotlib inline
import pandas as pd

In [2]:
titles = pd.read_csv('data/titles.csv.gz', compression='gzip')
titles.head()

Unnamed: 0,title,year
0,The Rising Son,1990
1,The Thousand Plane Raid,1969
2,The Spider and the Fly,1949
3,Country,2000
4,The Golden Note,2017


In [92]:
cast = pd.read_csv('data/cast.csv.gz', compression='gzip')
cast.head()

Unnamed: 0,title,year,name,type,character,n
0,Closet Monster,2015,Buffy #1,actor,Buffy 4,31.0
1,Suuri illusioni,1985,Homo $,actor,Guests,22.0
2,Battle of the Sexes,2017,$hutter,actor,Bobby Riggs Fan,10.0
3,Secret in Their Eyes,2015,$hutter,actor,2002 Dodger Fan,
4,Steve Jobs,2015,$hutter,actor,1988 Opera House Patron,


### ¿Cuántas películas aparecen en el dataframe titles?

In [11]:
titles.shape

(239341, 2)

In [5]:
titles.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 239341 entries, 0 to 239340
Data columns (total 2 columns):
title    239341 non-null object
year     239341 non-null int64
dtypes: int64(1), object(1)
memory usage: 3.7+ MB


### ¿Cuáles son las dos películas más antiguas?

In [49]:
titles.sort_values('year').head(2)

Unnamed: 0,title,year
183064,Miss Jerry,1894
221680,The Startled Lover,1898


### ¿Cuántas películas se titulan "Hamlet"?

In [None]:
titles['title'] == 'Hamlet'

In [30]:
titles[titles['title'] == 'Hamlet']

Unnamed: 0,title,year
6170,Hamlet,1948
48165,Hamlet,1910
50789,Hamlet,2017
77310,Hamlet,2015
94903,Hamlet,1976
95253,Hamlet,1969
97157,Hamlet,1987
97359,Hamlet,2000
101498,Hamlet,1921
132300,Hamlet,1954


In [40]:
titles[titles.title=='Hamlet'].shape[0]

20

### ¿Cuántas películas se titulan "Blade Runner"?

In [41]:
titles[titles.title == 'Blade Runner']

Unnamed: 0,title,year
106633,Blade Runner,1982


### ¿Cuándo se creo la primera película "Hamlet"?

In [54]:
titles[titles.title=='Hamlet'].sort_values('year').head(1)

Unnamed: 0,title,year
48165,Hamlet,1910


In [56]:
hamlet = titles[titles.title == 'Hamlet']
min(hamlet.year)

1910

In [59]:
titles[titles.title=='Hamlet'].sort_values('year').head(1)

Unnamed: 0,title,year
48165,Hamlet,1910


In [60]:
(titles[titles.title=='Hamlet']
 .sort_values('year')
 .head(1))

Unnamed: 0,title,year
48165,Hamlet,1910


### Muestra todas las películas "Treasure Island" desde la más antigua a la más reciente.

In [63]:
(titles[titles.title=='Treasure Island']
 .sort_values('year')
)

Unnamed: 0,title,year
212183,Treasure Island,1918
52850,Treasure Island,1920
196758,Treasure Island,1934
99798,Treasure Island,1950
79515,Treasure Island,1972
114712,Treasure Island,1973
211531,Treasure Island,1985
184707,Treasure Island,1999


### ¿Cuántas películas se hicieron en 1950?

In [70]:
titles[titles['year'] == 1950]

Unnamed: 0,title,year
73,Campo O' Donnell,1950
94,Botta e risposta,1950
235,Madari,1950
568,Un certain monsieur,1950
1035,Vom Teufel gejagt,1950
1148,The Jackpot,1950
1619,Tanssi yli hautojen,1950
1730,The Elusive Pimpernel,1950
1735,Akatsuki no tsuiseki,1950
1743,Das doppelte Lottchen,1950


In [71]:
titles[titles['year'] == 1950].shape

(1111, 2)

### ¿Cuántas películas se hicieron en el año 1960?

In [72]:
titles[titles['year']==1960].shape[0]

1538

### ¿Cuántas películas se hicieron desde 1950 hasta el 1959?

In [79]:
titles[(titles.year >= 1950) & 
       (titles.year <= 1959)].shape[0]

12882

### ¿En qué años se lanzaron las películas "Batman"?

In [89]:
titles[titles.title=='Batman']['year']

57708    1989
76805    1943
Name: year, dtype: int64

In [90]:
titles[titles.title=='Batman'].year

57708    1989
76805    1943
Name: year, dtype: int64

### ¿Cuántos personajes hay en la película "Inception"?

In [98]:
cast[cast.title == 'Inception']

Unnamed: 0,title,year,name,type,character,n
98549,Inception,2010,Michael (III) August,actor,LAX Passenger,
149565,Inception,2010,Peter Basham,actor,Fischer's Jet Captain,44.0
184686,Inception,2010,Tom Berenger,actor,Browning,8.0
198674,Inception,2010,Ken Bhan,actor,Mombasan Gambler,
261166,Inception,2010,Virgile Bramly,actor,Bridge Sub Con,29.0
328093,Inception,2010,Michael Caine,actor,Miles,11.0
334806,Inception,2010,Earl Cameron,actor,Elderly Bald Man,20.0
376282,Inception,2010,John Ceallach,actor,LAX Passenger,
435626,Inception,2010,Nicolas Clerc,actor,Bridge Sub Con,26.0
446195,Inception,2010,Adam (IV) Cole,actor,Bar Sub Con,34.0


### ¿Cuántos roles de la película "Inception"  están rankeados por un  valor "n"?

In [115]:
(
    cast[(cast.title == 'Inception') 
         & (cast.n.notnull())].shape
)

(51, 6)

In [117]:
cast[(cast.title == 'Inception')].n.count()

51

In [118]:
inception = cast[cast.title == 'Inception']
inception

Unnamed: 0,title,year,name,type,character,n
98549,Inception,2010,Michael (III) August,actor,LAX Passenger,
149565,Inception,2010,Peter Basham,actor,Fischer's Jet Captain,44.0
184686,Inception,2010,Tom Berenger,actor,Browning,8.0
198674,Inception,2010,Ken Bhan,actor,Mombasan Gambler,
261166,Inception,2010,Virgile Bramly,actor,Bridge Sub Con,29.0
328093,Inception,2010,Michael Caine,actor,Miles,11.0
334806,Inception,2010,Earl Cameron,actor,Elderly Bald Man,20.0
376282,Inception,2010,John Ceallach,actor,LAX Passenger,
435626,Inception,2010,Nicolas Clerc,actor,Bridge Sub Con,26.0
446195,Inception,2010,Adam (IV) Cole,actor,Bar Sub Con,34.0


In [112]:
inception[inception.n.notnull()].shape

(51, 6)

In [114]:
inception.n.count()

51

In [116]:
inception[inception.n.notnull()]


Unnamed: 0,title,year,name,type,character,n
149565,Inception,2010,Peter Basham,actor,Fischer's Jet Captain,44.0
184686,Inception,2010,Tom Berenger,actor,Browning,8.0
261166,Inception,2010,Virgile Bramly,actor,Bridge Sub Con,29.0
328093,Inception,2010,Michael Caine,actor,Miles,11.0
334806,Inception,2010,Earl Cameron,actor,Elderly Bald Man,20.0
435626,Inception,2010,Nicolas Clerc,actor,Bridge Sub Con,26.0
446195,Inception,2010,Adam (IV) Cole,actor,Bar Sub Con,34.0
519315,Inception,2010,Jean-Michel Dagory,actor,Bridge Sub Con,30.0
592978,Inception,2010,Leonardo DiCaprio,actor,Cobb,1.0
712341,Inception,2010,Russ Fega,actor,Cab Driver,23.0


### Y cuántos roles de la película "Inception" NO están rankeados por un valor "n"?

In [120]:
inception[inception.n.isnull()].shape

(27, 6)

In [121]:

(cast[(cast.title == 'Inception')
     & (cast.n.isnull())].shape)


(27, 6)

In [123]:
(cast[(cast.title == 'Inception')
     & (~cast.n.notnull())].shape)

(27, 6)

### Muestra los roles de la película "Blade Runner" según su importancia "n"-rank, ignorando roles sin un valor "n".

In [129]:
cast[(cast.title == 'Blade Runner') & (cast.n.notnull())].sort_values('n')


Unnamed: 0,title,year,name,type,character,n
750763,Blade Runner,1982,Harrison Ford,actor,Rick Deckard,1.0
963653,Blade Runner,1982,Rutger Hauer,actor,Roy Batty,2.0
3754053,Blade Runner,1982,Sean Young,actress,Rachael,3.0
1712512,Blade Runner,1982,Edward James Olmos,actor,Gaff,4.0
2402591,Blade Runner,1982,M. Emmet Walsh,actor,Bryant,5.0
2992843,Blade Runner,1982,Daryl Hannah,actress,Pris,6.0
2017613,Blade Runner,1982,William Sanderson,actor,J.F. Sebastian,7.0
1092009,Blade Runner,1982,Brion James,actor,Leon Kowalski,8.0
2319789,Blade Runner,1982,Joe Turkel,actor,Dr. Eldon Tyrell,9.0
2719450,Blade Runner,1982,Joanna Cassidy,actress,Zhora,10.0


In [132]:
BladeRunner=cast[cast.title=='Blade Runner']
BladeRunner[BladeRunner.n.notnull()].sort_values('n')

Unnamed: 0,title,year,name,type,character,n
750763,Blade Runner,1982,Harrison Ford,actor,Rick Deckard,1.0
963653,Blade Runner,1982,Rutger Hauer,actor,Roy Batty,2.0
3754053,Blade Runner,1982,Sean Young,actress,Rachael,3.0
1712512,Blade Runner,1982,Edward James Olmos,actor,Gaff,4.0
2402591,Blade Runner,1982,M. Emmet Walsh,actor,Bryant,5.0
2992843,Blade Runner,1982,Daryl Hannah,actress,Pris,6.0
2017613,Blade Runner,1982,William Sanderson,actor,J.F. Sebastian,7.0
1092009,Blade Runner,1982,Brion James,actor,Leon Kowalski,8.0
2319789,Blade Runner,1982,Joe Turkel,actor,Dr. Eldon Tyrell,9.0
2719450,Blade Runner,1982,Joanna Cassidy,actress,Zhora,10.0


### Muestre el reparto completo de la película "Scarface" (1932) según el ranking "n".

In [133]:
cast[(cast.title=='Scarface')& (cast.year==1932)].sort_values('n')

Unnamed: 0,title,year,name,type,character,n
1617878,Scarface,1932,Paul Muni,actor,Tony,1.0
2852956,Scarface,1932,Ann Dvorak,actress,Cesca,2.0
3313881,Scarface,1932,Karen Morley,actress,Poppy,3.0
1785399,Scarface,1932,Osgood Perkins,actor,Johnny Lovo,4.0
861353,Scarface,1932,C. Henry Gordon,actor,Inspector Guarino,5.0
1869341,Scarface,1932,George Raft,actor,Rinaldo,6.0
140197,Scarface,1932,Vince Barnett,actor,Angelo,7.0
1159460,Scarface,1932,Boris Karloff,actor,Tom Gaffney,8.0
1841138,Scarface,1932,Purnell Pratt,actor,Publisher,9.0
1449153,Scarface,1932,Tully Marshall,actor,Managing Editor,10.0


### Ahora el reparto completo, pero la de la última versión de "Scarface".

In [134]:
titles[titles.title == 'Scarface']

Unnamed: 0,title,year
95224,Scarface,1983
113706,Scarface,2018
235924,Scarface,1932


In [135]:
cast[(cast.title=='Scarface')& (cast.year==1983)].sort_values('n')


Unnamed: 0,title,year,name,type,character,n
1732108,Scarface,1983,Al Pacino,actor,Tony Montana,1.0
154882,Scarface,1983,Steven Bauer,actor,Manny Ribera,2.0
3408000,Scarface,1983,Michelle Pfeiffer,actress,Elvira Hancock,3.0
3250479,Scarface,1983,Mary Elizabeth Mastrantonio,actress,Gina Montana,4.0
1361476,Scarface,1983,Robert Loggia,actor,Frank Lopez,5.0
2759061,Scarface,1983,Miriam Colon,actress,Mama Montana,6.0
5448,Scarface,1983,F. Murray Abraham,actor,Omar Suarez,7.0
2091349,Scarface,1983,Paul Shenar,actor,Alejandro Sosa,8.0
2518574,Scarface,1983,Harris Yulin,actor,Mel Bernstein,9.0
2006927,Scarface,1983,?ngel Salazar,actor,Chi Chi,10.0


### ¿Cuántos roles habían en la versión muda de Hamlet de 1921?

### ¿Cuántas actrices/actores han aparecido en las películas  "Hamlet" ?

### ¿Cuántas personas han interpretado el rol de Neo?

###  ¿Cuántas personas han interpretado el rol de  "Girl"?

###  ¿Cuántas personas han interpretado el rol de  "The Stranger"?

### ¿Cuántos roles ha interpretado "Tom Hanks" en toda su carrera?

### ¿y cuántos roles ha interpretado "Julianne Moore"?

### Liste los roles de soporte (con n=2) interpretados por Humphrey Bogart en los 1940s, ordenados por año.

### Liste los roles principales de Humphrey Bogart en los 1940s ordenados por año.

### ¿Cuántos roles habían disponible para actores (actor) en los 1950s?

### ¿Cuántos roles habían disponible para actrices (actress) en los 1950s?

### ¿Cuántos roles principales (n=1) han existido desde la exhibición de la primera película hasta 1980?

### ¿Cuántos roles no principales han existido desde la exhibición de la primera película hasta 1980?

### ¿Cuántos roles menores (tanto que no tenian ranking) han exisitido desde la primera película hasta 1980?