## Repaso Pandas

### Los Datos

Este conjunto de datos proporciona información detallada sobre lanzamientos de cohetes:

    fairings: Información sobre las carenas del cohete.

    links: Varios enlaces externos relacionados con el lanzamiento.

    static_fire_date_utc: Fecha de la prueba estática de encendido en formato UTC.

    static_fire_date_unix: Fecha de la prueba estática de encendido en marca de tiempo Unix.

    net: Booleano que indica si es un lanzamiento NET (No Earlier Than).

    window: Duración de la ventana de lanzamiento en segundos.

    rocket: ID del cohete utilizado en el lanzamiento.

    success: Booleano que indica el éxito del lanzamiento.

    failures: Información sobre cualquier fallo en el lanzamiento.

    details: Detalles sobre el lanzamiento y su resultado.

    crew: Información sobre el personal involucrado.

    ships: Lista de barcos involucrados en el lanzamiento.

    capsules: Información sobre cualquier cápsula utilizada.

    payloads: Lista de cargas útiles transportadas por el cohete.

    launchpad: ID de la plataforma de lanzamiento utilizada para el lanzamiento.

    flight_number: Número de vuelo único del lanzamiento.

    name: Nombre de la misión o lanzamiento.

    date_utc: Fecha de lanzamiento en formato UTC.

    date_unix: Fecha de lanzamiento en marca de tiempo Unix.

    date_local: Fecha y hora local del lanzamiento.

    date_precision: Precisión de la fecha y hora del lanzamiento.

    upcoming: Booleano que indica si el lanzamiento está próximo.

    cores: Información sobre núcleos del cohete.

    auto_update: Booleano que indica si los datos se actualizan automáticamente.

    tbd: Booleano que indica si los detalles del lanzamiento están por determinar (TBD).

    launch_library_id: ID relacionado con el lanzamiento en una biblioteca.

    id: Identificador único del lanzamiento.

El objetivo

En esta sesión, repasaremos los conceptos clave de Pandas aprendidas en las semanas anteriores. Algunos conceptos que repasaremos son:

    Indexación y Selección: Recordaremos como seleccionar y filtrar datos utilizando métodos de indexación, incluyendo loc y iloc, así como técnicas para filtrar filas y columnas basadas en condiciones lógicas.

    Limpieza de Datos: Recordaremos estrategias para manejar datos faltantes (NaN) y duplicados mediante métodos como dropna(), fillna().

    Aplicación de Funciones (apply): Revisaremos cómo utilizar apply para aplicar funciones a lo largo de columnas, útil para transformaciones complejas en conjuntos de datos.

    Groupby: Utilizaremos groupby para dividir datos en grupos basados en criterios específicos, permitiendo realizar cálculos agregados, resúmenes y análisis detallados para cada grupo.

Indexación y Selección: Recordaremos como seleccionar y filtrar datos utilizando métodos de indexación, incluyendo loc y iloc, así como técnicas para filtrar filas y columnas basadas en condiciones lógicas.


In [45]:
import pandas as pd
from pandas import json_normalize
import json
 
pd.set_option('display.max_columns', None)

In [47]:
df_sx=pd.read_json('spaceX_Lunch.json')

In [48]:
#df_sx_1=pd.json_normalize()
df = json_normalize(df_sx.to_dict(orient='records'))

In [49]:
df_sx.shape


(205, 27)

In [50]:
df_sx.columns

Index(['fairings', 'links', 'static_fire_date_utc', 'static_fire_date_unix',
       'net', 'window', 'rocket', 'success', 'failures', 'details', 'crew',
       'ships', 'capsules', 'payloads', 'launchpad', 'flight_number', 'name',
       'date_utc', 'date_unix', 'date_local', 'date_precision', 'upcoming',
       'cores', 'auto_update', 'tbd', 'launch_library_id', 'id'],
      dtype='object')

In [51]:
df_sx.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 205 entries, 0 to 204
Data columns (total 27 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   fairings               169 non-null    object 
 1   links                  205 non-null    object 
 2   static_fire_date_utc   121 non-null    object 
 3   static_fire_date_unix  121 non-null    float64
 4   net                    205 non-null    bool   
 5   window                 117 non-null    float64
 6   rocket                 205 non-null    object 
 7   success                186 non-null    float64
 8   failures               205 non-null    object 
 9   details                134 non-null    object 
 10  crew                   205 non-null    object 
 11  ships                  205 non-null    object 
 12  capsules               205 non-null    object 
 13  payloads               205 non-null    object 
 14  launchpad              205 non-null    object 
 15  flight

In [52]:
# descomprimimos la columna de "fairings"
df_sx[["reused", "recovery_attempt", "recovered"]] = df_sx["fairings"].apply(pd.Series).iloc[:, :3]
df_sx.head(1)

Unnamed: 0,fairings,links,static_fire_date_utc,static_fire_date_unix,net,window,rocket,success,failures,details,crew,ships,capsules,payloads,launchpad,flight_number,name,date_utc,date_unix,date_local,date_precision,upcoming,cores,auto_update,tbd,launch_library_id,id,reused,recovery_attempt,recovered
0,"{'reused': False, 'recovery_attempt': False, '...",{'patch': {'small': 'https://images2.imgbox.co...,2006-03-17T00:00:00.000Z,1142554000.0,False,0.0,5e9d0d95eda69955f709d1eb,0.0,"[{'time': 33, 'altitude': None, 'reason': 'mer...",Engine failure at 33 seconds and loss of vehicle,[],[],[],[5eb0e4b5b6c3bb0006eeb1e1],5e9e4502f5090995de566f86,1,FalconSat,2006-03-24T22:30:00.000Z,1143239400,2006-03-25T10:30:00+12:00,hour,False,"[{'core': '5e9e289df35918033d3b2623', 'flight'...",True,False,,5eb87cd9ffd86e000604b32a,False,False,False


In [53]:
df_sx.drop('fairings', axis=1, inplace=True)

In [54]:
df_sx.columns

Index(['links', 'static_fire_date_utc', 'static_fire_date_unix', 'net',
       'window', 'rocket', 'success', 'failures', 'details', 'crew', 'ships',
       'capsules', 'payloads', 'launchpad', 'flight_number', 'name',
       'date_utc', 'date_unix', 'date_local', 'date_precision', 'upcoming',
       'cores', 'auto_update', 'tbd', 'launch_library_id', 'id', 'reused',
       'recovery_attempt', 'recovered'],
      dtype='object')

In [60]:
df_sx[["patch", "reddit", "flickr","presskit","webcast","youtube_id","article","wikipedia"]]= df_sx["links"].apply(pd.Series)
df_sx.head(2)

Unnamed: 0,links,static_fire_date_utc,static_fire_date_unix,net,window,rocket,success,failures,details,crew,ships,capsules,payloads,launchpad,flight_number,name,date_utc,date_unix,date_local,date_precision,upcoming,cores,auto_update,tbd,launch_library_id,id,reused,recovery_attempt,recovered,patch,reddit,flickr,presskit,webcast,youtube_id,article,wikipedia
0,{'patch': {'small': 'https://images2.imgbox.co...,2006-03-17T00:00:00.000Z,1142554000.0,False,0.0,5e9d0d95eda69955f709d1eb,0.0,"[{'time': 33, 'altitude': None, 'reason': 'mer...",Engine failure at 33 seconds and loss of vehicle,[],[],[],[5eb0e4b5b6c3bb0006eeb1e1],5e9e4502f5090995de566f86,1,FalconSat,2006-03-24T22:30:00.000Z,1143239400,2006-03-25T10:30:00+12:00,hour,False,"[{'core': '5e9e289df35918033d3b2623', 'flight'...",True,False,,5eb87cd9ffd86e000604b32a,False,False,False,{'small': 'https://images2.imgbox.com/94/f2/NN...,"{'campaign': None, 'launch': None, 'media': No...","{'small': [], 'original': []}",,https://www.youtube.com/watch?v=0a_00nJ_Y88,0a_00nJ_Y88,https://www.space.com/2196-spacex-inaugural-fa...,https://en.wikipedia.org/wiki/DemoSat
1,{'patch': {'small': 'https://images2.imgbox.co...,,,False,0.0,5e9d0d95eda69955f709d1eb,0.0,"[{'time': 301, 'altitude': 289, 'reason': 'har...",Successful first stage burn and transition to ...,[],[],[],[5eb0e4b6b6c3bb0006eeb1e2],5e9e4502f5090995de566f86,2,DemoSat,2007-03-21T01:10:00.000Z,1174439400,2007-03-21T13:10:00+12:00,hour,False,"[{'core': '5e9e289ef35918416a3b2624', 'flight'...",True,False,,5eb87cdaffd86e000604b32b,False,False,False,{'small': 'https://images2.imgbox.com/f9/4a/Zb...,"{'campaign': None, 'launch': None, 'media': No...","{'small': [], 'original': []}",,https://www.youtube.com/watch?v=Lk4zQ2wP-Nc,Lk4zQ2wP-Nc,https://www.space.com/3590-spacex-falcon-1-roc...,https://en.wikipedia.org/wiki/DemoSat


In [72]:
a=dict(df_sx['flickr']).values()
for i in a:
    if len(i['original']) !=0:
        print(i['original'])
    

['https://farm9.staticflickr.com/8617/16789019815_f99a165dc5_o.jpg', 'https://farm8.staticflickr.com/7619/16763151866_35a0a4d8e1_o.jpg', 'https://farm9.staticflickr.com/8569/16169086873_4d8829832e_o.png']
['https://farm8.staticflickr.com/7615/16670240949_8d43db0e36_o.jpg', 'https://farm9.staticflickr.com/8597/16856369125_e97cd30ef7_o.jpg', 'https://farm8.staticflickr.com/7586/16166732954_9338dc859c_o.jpg', 'https://farm8.staticflickr.com/7603/16855223522_462da54e84_o.jpg', 'https://farm8.staticflickr.com/7618/16234010894_e1210ec300_o.jpg', 'https://farm8.staticflickr.com/7617/16855338881_69542a2fa9_o.jpg']
['https://farm8.staticflickr.com/7585/16602893909_1181317089_o.jpg', 'https://farm9.staticflickr.com/8747/16581738577_83e0690136_o.png', 'https://farm8.staticflickr.com/7285/16581736047_6fd536ab11_o.jpg', 'https://farm8.staticflickr.com/7597/16789021675_35f0148f78_o.jpg', 'https://farm8.staticflickr.com/7631/16236321533_829ae07b42_o.jpg', 'https://farm9.staticflickr.com/8726/16830422