# Lab. Metro w Paryżu

* Krzysztof Molenda, 2025-05-15

Ćwiczenie do samodzielnego wykonania, ze wspomaganiem asystenta AI

In [None]:
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt
import scipy

## Analiza danych źródłowych

W załączonych w katalogu projektu plikach `.csv` zamieszczone zostały dane dotyczące fragmentu sieci metra w Paryżu.

Wczytaj je. Zapoznaj się z tymi danymi.

In [None]:
# Wczytaj dane, wyświetl


## Utworzenie grafu

Utwórz graf połączeń między stacjami (wielokrawędziowy - bo stacje mogą być połączone wieloma liniami)

In [None]:
# Utwórz graf wielokrawędziowy


## Rysowanie grafu

Narysuj ten graf (jakkolwiek)

Spróbuj ustalić parametry i narysować go jak na załączonym pliku (wspomaganie AI, dokumentacja NetworkX)

> współrzędne geograficzne stacji są informacją o lokalizacji węzłów na rysunku grafu w `matplotlib`

## Graf na mapie

Chcemy uzyć biblioteki `Folium`. Współrzędne stacji podane są w lokalnym układzie francuskim - musimy przeliczyć je na na szerokość i długość geograficzną (lat/lon w WGS84).

Zrobić to można przy uzyciu biblioteki `pyproj`

In [None]:
from pyproj import Transformer

# Utwórz transformator: z EPSG:2154 (Lambert-93) do EPSG:4326 (WGS84)

# Przelicz współrzędne


In [None]:
%pip install folium
import folium

In [None]:
# Utwórz mapę w centrum Paryża

# Dodaj stacje jako punkty

# Dodaj linie jako polylines

# Zapisz mapę do pliku HTML

# wyświetl mapę

## Pytania do grafu

### Statystyki opisowe

* liczba stacji
* liczba połączeń
* liczba linii
* stopnie węzłów: minimalny, średni, kasymalny stopień
* top 5 stacji pod względem liczby połączeń
* największe stacje pod względem ruchu pasażerskiego (`Trafic`)
* liczba stacji przesiadkowych

### Analiza centralności

* Średnica grafu (maksymalna liczba przesiadek potrzebnych do przejazdu między dwiema stacjami)
* Promień grafu (najmniejsza maksymalna odległość od najbardziej centralnej stacji)
* Średnia długość wszystkich najkrótszych ścieżek (przeciętna liczba przesiadek w podróży)
* Gęstosć grafu

In [None]:
# PageRank - Stacje wpływowe przez połączenia z innymi ważnymi stacjami, Top 5


:::{seealso} Degree Centrality
:class: dropdown
**Degree Centrality** (_centralność stopnia_)
: to podstawowa miara w analizie sieci, która określa liczbę bezpośrednich połączeń danego węzła (stacji metra) z innymi węzłami. W kontekście metra paryskiego mierzy, ile linii lub połączeń przechodzi przez daną stację. Im wyższa wartość, tym większe znaczenie stacji jako węzła przesiadkowego.

*  Stacje o wysokim stopniu skracają czas podróży, minimalizując liczbę przesiadek.
*  Zamknięcie stacji z wysokim degree_centrality sparaliżuje znaczną część sieci.
*  Te stacje mają zwykle najwyższy ruch 
:::

In [None]:
# 1. Degree Centrality (liczba połączeń)


:::{seealso} Betweenness Centrality
:class: dropdown
**Betweenness Centrality** (_centralność pośrednictwa_)
:  to miara centralności oparta na najkrótszych ścieżkach w grafie. Mierzy, jak często dany węzeł (stacja) leży na najkrótszych trasach pomiędzy wszystkimi parami innych stacji w sieci.

* Miara ta koncentruje się nie na lokalizacji stacji jako punktu docelowego, ale na jej roli jako węzła przesiadkowego. Stacja może być mocno używana niekoniecznie dlatego, że znajduje się przy atrakcyjnym miejscu, ale dlatego, że służy jako punkt przesiadkowy do wielu innych lokalizacji
* Stacje o wysokiej centralności pośrednictwa mają znaczny wpływ na sieć metra, ponieważ kontrolują przepływ pasażerów między innymi stacjami
* Usunięcie stacji o wysokiej betweenness centrality (np. z powodu awarii) najbardziej zakłóci funkcjonowanie całego systemu metra
:::

In [None]:
# 2. Betweenness Centrality (pośrednictwo w ścieżkach)


:::{seealso} Closeness Centrality
:class: dropdown
**Closeness centrality** (_centralność bliskości_)
: to miara w analizie sieci, która określa, jak "blisko" dany węzeł znajduje się względem wszystkich pozostałych węzłów w sieci. Węzły o wysokiej centralności bliskości mogą szybko dotrzeć do wszystkich innych węzłów, co czyni je strategicznymi punktami przepływu informacji lub ruchu.

closeness centrality mierzy
* jak łatwo ze stacji można dotrzeć do wszystkich innych stacji (z minimalną liczbą przesiadek)
* efektywność stacji jako punktu startowego podróży w całej sieci
:::

In [None]:
# 3. Closeness Centrality (bliskość do innych)


In [None]:
# Połączenie wyników z danymi o ruchu


In [None]:
# Najważniejsze stacje według wszystkich metryk


### Spójnosć, mosty i punkty artykulacji

In [None]:
# Czy graf jest spójny?


# Liczba komponentów spójnych


# Lista komponentów spójnych


# Spójność krawędziowa i wierzchołkowa


In [None]:
# Lista wszystkich mostów w grafie


In [None]:
# Lista punktów artykulacji


### Nakrótsza ścieżka między stacją `A` a stacją `B`

In [None]:
# Funkcja wypisująca najkrótszą ścieżkę między dwiema stacjami


### Linie
* Napisz funkcję zwracającą listę stacji dla wskazanej linii. Przetestuj
* Wypisz wszystkie linie, podając stację początkową, posrednie i końcową
* Stacje końcowe na poszczególnych liniach

### Traffic

* Top 10 stacji wg ruchu
* Suma ruchu na każdej linii
* Stacje przesiadkowe z największym ruchem

### Odległości między stacjami (dla linii)

Współrzędne `x` oraz `y` zdefiniowane są w układzie płaskim (x/y w metrach, Lambert 93). Aby obliczyć odległość w linii prostej między wskazanymi punktami można użyć miary euklidesowej.

* Utwórz zestawienie odległości (w linii prostej) między sąsiadującymi stacjami, zgodnie z grafem
* Oblicz długość każdej linii