# Actividad 9
# 🔍 Parte 2: Análisis de Datasets
Objetivo: Analizar datasets con Pandas, utilizando filtros y visualización con:
* tablas
* gráficos
* mapas



## Elegí un dataset
* Realizar exploración básica

*  ### Avistajes de felinos en Argentina
    * Link para descarga: https://archivos.linti.unlp.edu.ar/index.php/s/5iC9FrYWiGi11d0
    * Nombre del archivo: felinos_filtrado.csv
    * Descargado y adaptado de: https://www.gbif.org/
    * Descripción: describe los avistajes de felinos en peligro de extinción con ubicación, especie, fecha etc.
* ### Áreas protegidas
    * Link para descarga: https://archivos.linti.unlp.edu.ar/index.php/s/Eqw1eAVC1pdefmb
    * Descargado de: https://dnsg.ign.gob.ar/apps/api/v1/capas-sig/Geodesia+y+demarcaci%C3%B3n/L%C3%ADmites/area_protegida/csv*
    * Página consultada: https://www.ign.gob.ar/NuestrasActividades/InformacionGeoespacial/CapasSIG
    * Descripción: detalle de las áreas protegidas terrestres y marítimas
    * Documento con detalle de los datos: https://archivos.linti.unlp.edu.ar/index.php/s/PEFAt1t2vRusqCI
* ### Aeropuertos Argentina
    * Link para  descarga: https://archivos.linti.unlp.edu.ar/index.php/s/RwFLzTUtqEfqOkc
    * Nombre del archivo: ar-airports.csv
    * Descargado de: https://ourairports.com/countries/AR/airports.csv
    * Descripción: Aeropuertos de Argentina por tipo y localidad
* ### Conectividad Argentina
    * Link para descarga: https://archivos.linti.unlp.edu.ar/index.php/s/3k2TO5sSzaAU6IY
    * Nombre del archivo: Conectividad_Internet.csv
    * Descargado de : https://datos.gob.ar/dataset/enacom-conectividad-al-servicio-internet/archivo/enacom_CONEC-AL-SERVI-DE-INTER_0
    * Descripción: Describe las tecnologías disponibles en las localidades para acceder al servicio de Internet fijo y móvil
* ### Precios combustibles
    * [Link para descarga](https://archivos.linti.unlp.edu.ar/index.php/s/x0InilFLhgt1B1R).
    * Descargado de: https://www.datos.gob.ar/dataset/energia-precios-surtidor---resolucion-3142016
    * Descripción: Datos del Sistema en línea de información de precios de combustibles en surtidor, a través del cual los titulares de bocas de expendio de combustibles líquidos inscriptos en el registro creado por la resolución n° 1.102/2004 presentan la información relativa a precios de comercialización minorista dentro de las 8 (ocho) horas de producida una modificación en el precio en surtidor.
* ### Ferrocarriles.
    *  [Link para descarga](https://archivos.linti.unlp.edu.ar/index.php/s/6OrxQjJihfu0Gd3)
    * Descargado de :https://catalogo.datos.gba.gob.ar/dataset/007e56d4-9123-485c-83e0-4556b6c75784/resource/dc2d7c3e-96ba-4fe6-b18c-9becd9643e87/download/estaciones-ferrocarril-pba.csv
    * Descripción: Estaciones del sistema ferroviario en la provincia de Buenos Aires Instituto Geográfico Nacional. Dirección Nacional de Servicios Geográficos. Dirección de Información Geoespacial. Datos de la ubicación y descripción de las estaciones de la red ferroviaria en territorio provincial.
    * Explicación de los datos: https://catalogo.datos.gba.gob.ar/dataset/007e56d4-9123-485c-83e0-4556b6c75784/resource/f01259b2-ad3d-4d53-8f89-7c39468c8c49/download/estaciones-ferrocarril-provincia.pdf


In [1]:
import pandas as pd
import folium
import plotly.express as px

In [2]:
air = pd.read_csv('ar-airports.csv')

# ✅ Etapa 1: Exploración Básica (10 min)
* Cantidad de filas y columans
* Nombres de las columnas
* Tipos de datos de las columnas
* Ver las primeras 10 filas del dataset

In [3]:
#muestra la catidad de filas y columnas
air.shape

(955, 24)

In [4]:
#muestra el nombre de todas las columnas
air.columns

Index(['id', 'ident', 'type', 'name', 'latitude_deg', 'longitude_deg',
       'elevation_ft', 'continent', 'country_name', 'iso_country',
       'region_name', 'iso_region', 'local_region', 'municipality',
       'scheduled_service', 'gps_code', 'icao_code', 'iata_code', 'local_code',
       'home_link', 'wikipedia_link', 'keywords', 'score', 'last_updated'],
      dtype='object')

In [5]:
#muestra el tipo de dato de cada columna
air.dtypes

id                     int64
ident                 object
type                  object
name                  object
latitude_deg         float64
longitude_deg        float64
elevation_ft         float64
continent             object
country_name          object
iso_country           object
region_name           object
iso_region            object
local_region          object
municipality          object
scheduled_service      int64
gps_code              object
icao_code             object
iata_code             object
local_code            object
home_link             object
wikipedia_link        object
keywords              object
score                  int64
last_updated          object
dtype: object

In [5]:
#muestra las primeras 10 filas
air.head(10)

Unnamed: 0,id,ident,type,name,latitude_deg,longitude_deg,elevation_ft,continent,country_name,iso_country,...,scheduled_service,gps_code,icao_code,iata_code,local_code,home_link,wikipedia_link,keywords,score,last_updated
0,5781,SAEZ,large_airport,Minister Pistarini International Airport,-34.8222,-58.5358,67.0,SA,Argentina,AR,...,1,SAEZ,SAEZ,EZE,EZE,http://www.aa2000.com.ar/index.php,https://en.wikipedia.org/wiki/Ministro_Pistari...,"BUE, Ezeiza",1275,2022-10-27T15:05:29+00:00
1,5771,SABE,large_airport,Jorge Newbery Airpark,-34.5592,-58.4156,18.0,SA,Argentina,AR,...,1,SABE,SABE,AEP,AER,,https://en.wikipedia.org/wiki/Aeroparque_Jorge...,,1050,2021-10-07T15:55:36+00:00
2,5835,SAWH,medium_airport,Ushuaia - Malvinas Argentinas International Ai...,-54.8433,-68.2958,102.0,SA,Argentina,AR,...,1,SAWH,SAWH,USH,USU,,https://en.wikipedia.org/wiki/Ushuaia_%E2%80%9...,,750,2025-03-22T20:48:42+00:00
3,5806,SARI,medium_airport,Cataratas Del Iguazú International Airport,-25.737301,-54.4734,916.0,SA,Argentina,AR,...,1,SARI,SARI,IGR,IGU,http://www.aa2000.com.ar/iguazu,https://en.wikipedia.org/wiki/Cataratas_del_Ig...,Iguaçu,750,2018-09-13T12:34:47+00:00
4,5831,SAWC,medium_airport,El Calafate - Commander Armando Tola Internati...,-50.2803,-72.053101,669.0,SA,Argentina,AR,...,1,SAWC,,FTE,ECA,http://www.aeropuertoelcalafate.com/en/,https://en.wikipedia.org/wiki/Comandante_Arman...,,500,2022-01-12T18:23:15+00:00
5,5786,SAME,medium_airport,El Plumerillo Airport,-32.831699,-68.7929,2310.0,SA,Argentina,AR,...,1,SAME,SAME,MDZ,DOZ,,https://en.wikipedia.org/wiki/Governor_Francis...,,750,2011-02-17T01:49:01+00:00
6,5852,SAZS,medium_airport,San Carlos de Bariloche Airport,-41.151199,-71.157501,2774.0,SA,Argentina,AR,...,1,SAZS,SAZS,BRC,BAR,http://www.aa2000.com.ar/bariloche,https://en.wikipedia.org/wiki/San_Carlos_de_Ba...,Teniente Luis Candelaria,750,2025-03-09T01:30:49+00:00
7,5811,SASA,medium_airport,Martin Miguel De Guemes International Airport,-24.856001,-65.486198,4088.0,SA,Argentina,AR,...,1,SASA,SASA,SLA,SAL,,https://en.wikipedia.org/wiki/Mart%C3%ADn_Migu...,,750,2011-07-03T00:07:47+00:00
8,5773,SACO,medium_airport,Ingeniero Ambrosio Taravella Airport,-31.323601,-64.208,1604.0,SA,Argentina,AR,...,1,SACO,SACO,COR,CBA,,https://en.wikipedia.org/wiki/Ingeniero_Ambros...,,750,2019-04-15T20:31:25+00:00
9,37,AR-0742,closed,Colonia Catriel Airport,-37.910198,-67.834999,1026.0,SA,Argentina,AR,...,0,,,,,,https://en.wikipedia.org/wiki/Colonia_Catriel_...,"SA30, SA0U, SA30, CCT, CLT",50,2025-02-25T14:37:41+00:00


# ✅ Etapa 2: Análisis por temática(10 min)
* Cada dataset se analizará según categorías correspondiente a los datos que lo conforman

In [6]:
#te muesta la frecuencia de la columna "type"
air["type"].value_counts()

type
small_airport     693
heliport          148
medium_airport     69
closed             42
large_airport       2
balloonport         1
Name: count, dtype: int64

In [8]:
#te muestra la frencueda que tiene cada dato en la columna region name
air["region_name"].value_counts()

Buenos Aires Province             268
Córdoba Province                  100
Santa Fe Province                  97
Santa Cruz Province                75
Entre Ríos Province                43
Chubut Province                    41
Corrientes Province                35
Río Negro Province                 32
Neuquén Province                   31
La Pampa Province                  29
Salta Province                     26
Tierra del Fuego Province          24
Mendoza Province                   23
Santiago del Estero Province       22
Chaco Province                     20
Misiones Province                  16
Buenos Aires (Autonomous City)     14
Formosa Province                   12
San Luis Province                  12
Catamarca Province                  9
Tucumán Province                    8
Jujuy Province                      7
La Rioja Province                   6
San Juan Province                   5
Name: region_name, dtype: int64

# ✅ Etapa 3: Filtrar y Limpiar Datos (15 min)

In [7]:
#declaras la variable para filtrar la provincia santa cruz
provincia1 = air[air["region_name"] == "Santa Cruz Province"]

In [8]:
#ves la frecuenta de cada dato de la provincia filtrada en este caso es santa cruz
provincia1["type"].value_counts()

type
small_airport     57
heliport           9
medium_airport     7
closed             2
Name: count, dtype: int64

In [80]:
#declaras la variable para filtrar la provincia salta
provincia2 = air[air["region_name"] == "Salta Province"]

In [82]:
#ves la frecuenta de cada dato de la provincia filtrada en este caso es salta
provincia2["type"].value_counts()

small_airport     19
heliport           4
medium_airport     3
Name: type, dtype: int64

# ✅ Etapa 4: Valores Nulos y Estadísticas (10 min)
* Mostrar la composición de las columnas indicando aquellas con datos faltantes

In [10]:
#te muestra la informacion 
air.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 955 entries, 0 to 954
Data columns (total 24 columns):
 #   Column             Non-Null Count  Dtype  
---  ------             --------------  -----  
 0   id                 955 non-null    int64  
 1   ident              955 non-null    object 
 2   type               955 non-null    object 
 3   name               955 non-null    object 
 4   latitude_deg       955 non-null    float64
 5   longitude_deg      955 non-null    float64
 6   elevation_ft       922 non-null    float64
 7   continent          955 non-null    object 
 8   country_name       955 non-null    object 
 9   iso_country        955 non-null    object 
 10  region_name        955 non-null    object 
 11  iso_region         955 non-null    object 
 12  local_region       955 non-null    object 
 13  municipality       940 non-null    object 
 14  scheduled_service  955 non-null    int64  
 15  gps_code           228 non-null    object 
 16  icao_code          95 non-

# ✅ Etapa 5: Visualización con Mapas (15 min)

*  ### Avistajes de felinos en Argentina
    * **Mapa**: mostrar iconos de color según el tipo de "genus" .
* ### Áreas protegidas
    * **Mapa**: mostrar iconos de color según el tipo de área protegida definida en la columna "tap".
* ### Aeropuertos Argentina
    * **Mapa**: mostrar iconos de color según el tipo de aeropuerto: type
* ### Conectividad Argentina
    * **Mapa**: mostrar las localidades donde hay FIBRAOPTICA.
* ### Precios combustibles
    *  **Mapa**: mostrar los registros de las provincias de la Patagonia según "tipohorario".
* ### Ferrocarriles.
    * **Mapa**: mostrar las estaciones en el mapa según el tipo indicado en la columna "gna".

## 📌 Paso 1.Generar un mapa **base** para luego agregar los puntos

In [6]:
def generar_mapa():
    attr = (
        '&copy; <a href="https://www.openstreetmap.org/copyright">OpenStreetMap</a> '
        'contributors, &copy; <a href="https://cartodb.com/attributions">CartoDB</a>'
    )

    tiles = 'https://wms.ign.gob.ar/geoserver/gwc/service/tms/1.0.0/capabaseargenmap@EPSG%3A3857@png/{z}/{x}/{-y}.png'
    m = folium.Map(
        location=(-33.457606, -65.346857),
        control_scale=True,
        zoom_start=5,
        name='es',
        tiles=tiles,
        attr=attr
    )
    return m

In [7]:
mapa = generar_mapa()

## 📌 Paso 2. Definir la función para  agregar los puntos

In [8]:
air.columns

Index(['id', 'ident', 'type', 'name', 'latitude_deg', 'longitude_deg',
       'elevation_ft', 'continent', 'country_name', 'iso_country',
       'region_name', 'iso_region', 'local_region', 'municipality',
       'scheduled_service', 'gps_code', 'icao_code', 'iata_code', 'local_code',
       'home_link', 'wikipedia_link', 'keywords', 'score', 'last_updated'],
      dtype='object')

In [9]:
def agregar_marca_aire(row):
    folium.Marker(
        [row['latitude_deg'], row['longitude_deg']],
        popup=row['name'],
        icon=folium.Icon()
        ).add_to(mapa)

## 📌 Paso 3. Agrergar los puntos al mapa

In [10]:
air.apply(agregar_marca_aire, axis=1)
mapa

In [21]:
air['type'].unique()

array(['large_airport', 'medium_airport', 'closed', 'small_airport',
       'heliport', 'balloonport'], dtype=object)

In [11]:
mapa_color = generar_mapa()

In [12]:
def agregar_marca_airo(row):
    colores_tipo = {'large_airport': 'purple', 'medium_airport': 'green', 'small_airport': 'yellow', 'heliport': 'blue', 'balloonport': 'red'}
    color = colores_tipo.get(row['type'], 'gray')
    folium.CircleMarker(
        location=[row['latitude_deg'], row['longitude_deg']],
        radius=6,
        color=color,
        fill=True,
        popup=row['name']
        ).add_to(mapa_color)

In [13]:
air.apply(agregar_marca_airo, axis=1)
mapa_color