Importamos las librerías Pandas y Numpy

In [120]:
import pandas as pd
import numpy as np

### Step 2. Tomaremos el fichero en [esta URL](https://raw.githubusercontent.com/justmarkham/DAT8/master/data/chipotle.tsv) y lo leeremos como un dataframe.

Pista: [read_csv](https://numpy.org/doc/stable/user/absolute_beginners.html#importing-and-exporting-a-csv)

In [121]:
'https://raw.githubusercontent.com/justmarkham/DAT8/master/data/chipotle.tsv'

chipotle = pd.read_csv('https://raw.githubusercontent.com/justmarkham/DAT8/master/data/chipotle.tsv', sep='\t')


In [122]:
chipotle.head()

Unnamed: 0,order_id,quantity,item_name,choice_description,item_price
0,1,1,Chips and Fresh Tomato Salsa,,$2.39
1,1,1,Izze,[Clementine],$3.39
2,1,1,Nantucket Nectar,[Apple],$3.39
3,1,1,Chips and Tomatillo-Green Chili Salsa,,$2.39
4,2,2,Chicken Bowl,"[Tomatillo-Red Chili Salsa (Hot), [Black Beans...",$16.98


In [123]:
chipotle['item_price_float'] = chipotle['item_price'].str.replace("$","").astype(float)

chipotle['precio_unitario'] = chipotle['item_price_float'] / chipotle['quantity']






### Step 3. Veamos los tipos de datos. ¿Podríamos obtener el producto de mayor precio?

In [124]:
chipotle.loc[chipotle['precio_unitario'].idxmax()]


order_id                                                            123
quantity                                                              2
item_name                                              Steak Salad Bowl
choice_description    [Tomatillo Red Chili Salsa, [Black Beans, Chee...
item_price                                                      $23.78 
item_price_float                                                  23.78
precio_unitario                                                   11.89
Name: 281, dtype: object

### Step 4. ¿Qué productos cuestan más de $10?

In [125]:
productos_caros = chipotle[chipotle['precio_unitario'] >= 10]

print(productos_caros['item_name'].unique())
len(productos_caros['item_name'].unique())



['Chicken Bowl' 'Steak Burrito' 'Chicken Burrito' 'Barbacoa Bowl'
 'Veggie Burrito' 'Veggie Bowl' 'Chicken Soft Tacos' 'Steak Bowl'
 'Carnitas Burrito' 'Carnitas Bowl' 'Barbacoa Burrito'
 'Chicken Salad Bowl' 'Barbacoa Crispy Tacos' 'Veggie Salad Bowl'
 'Chicken Salad' 'Steak Salad Bowl' 'Chicken Crispy Tacos'
 'Veggie Soft Tacos' 'Barbacoa Soft Tacos' 'Carnitas Crispy Tacos'
 'Carnitas Salad Bowl' 'Barbacoa Salad Bowl' 'Steak Soft Tacos'
 'Carnitas Soft Tacos' 'Steak Crispy Tacos']


25

### Step 4.1: ¿Y cuántos pedidos se han hecho con un producto de más de 10$? ¿Es lo mismo?

In [126]:
pedidos = chipotle[chipotle['item_name'].isin(productos_caros['item_name'])]
len(pedidos)



2846

### Step 4.2: ¿Y cuántos pedidos se han hecho de más de 10$? ¿Es lo mismo?

In [127]:
total_pedido = chipotle.groupby('order_id')['item_price_float'].sum()

pedidos_10 = total_pedido[total_pedido >= 10]

len(pedidos_10)



1834

### Step 4.3: ¿Y en cuántos pedidos se ha pagado más de 10$ por un mismo producto? ¿Es lo mismo?

In [128]:
len(pedidos['order_id'].unique())

1826

### Step 5. ¿Qué precio tiene cada producto en distintos pedidos? ¿Hay productos con varios precios?

In [129]:
precios = chipotle.groupby('item_name')['precio_unitario'].unique()

precios

item_name
6 Pack Soft Drink                                                                   [6.49]
Barbacoa Bowl                                      [11.75, 9.25, 8.99, 11.48, 8.69, 11.49]
Barbacoa Burrito                                   [8.99, 9.25, 11.75, 11.08, 8.69, 11.48]
Barbacoa Crispy Tacos                                           [11.75, 9.25, 11.48, 8.99]
Barbacoa Salad Bowl                                                          [11.89, 9.39]
Barbacoa Soft Tacos                                             [9.25, 8.99, 11.75, 11.48]
Bottled Water                                                                  [1.09, 1.5]
Bowl                                                             [7.3999999999999995, 7.4]
Burrito                                                                              [7.4]
Canned Soda                                                                         [1.09]
Canned Soft Drink                                                               

### Step 6. Ordena el dataframe en base al nombre de producto (item name)

In [146]:
chipotle_agrupacion = chipotle.groupby('item_name').apply(lambda x: x)
chipotle_orden = chipotle_agrupacion.sort_index()
chipotle_orden


  chipotle_agrupacion = chipotle.groupby('item_name').apply(lambda x: x)


Unnamed: 0_level_0,Unnamed: 1_level_0,order_id,quantity,item_name,choice_description,item_price,item_price_float,precio_unitario
item_name,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
6 Pack Soft Drink,298,129,1,6 Pack Soft Drink,[Sprite],$6.49,6.49,6.49
6 Pack Soft Drink,341,148,1,6 Pack Soft Drink,[Diet Coke],$6.49,6.49,6.49
6 Pack Soft Drink,357,154,1,6 Pack Soft Drink,[Coke],$6.49,6.49,6.49
6 Pack Soft Drink,388,168,1,6 Pack Soft Drink,[Diet Coke],$6.49,6.49,6.49
6 Pack Soft Drink,417,182,1,6 Pack Soft Drink,[Diet Coke],$6.49,6.49,6.49
...,...,...,...,...,...,...,...,...
Veggie Soft Tacos,1395,567,1,Veggie Soft Tacos,"[Fresh Tomato Salsa (Mild), [Pinto Beans, Rice...",$8.49,8.49,8.49
Veggie Soft Tacos,1699,688,1,Veggie Soft Tacos,"[Fresh Tomato Salsa, [Fajita Vegetables, Rice,...",$11.25,11.25,11.25
Veggie Soft Tacos,2384,948,1,Veggie Soft Tacos,"[Roasted Chili Corn Salsa, [Fajita Vegetables,...",$8.75,8.75,8.75
Veggie Soft Tacos,2851,1132,1,Veggie Soft Tacos,"[Roasted Chili Corn Salsa (Medium), [Black Bea...",$8.49,8.49,8.49


### Step 7. ¿Cuantas veces se ha pedido los productos más caros?

In [95]:
pedidos_mascaro = chipotle[chipotle['item_name'] == 'Steak Salad Bowl']

len(pedidos_mascaro)


29

### Step 8. Veamos para el caso de Veggie Salad Bowl. Extrae esa información.

In [100]:
veggie = chipotle[chipotle['item_name'] == 'Veggie Salad Bowl']

print(len(veggie))
print(veggie['order_id'].unique())
precios_distintos = veggie['precio_unitario'].unique()
print(precios_distintos)
total_generado = veggie['item_price_float'].sum()
print(total_generado)


18
[  83  128  195  207  394  536  760  869  896  913 1066 1289 1321 1646
 1677 1700 1805 1818]
[11.25  8.75]
182.5
