# Temporal analysis of messages by channel

In [1]:
# import libraries
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [2]:
# import dataset
df = pd.read_json("../../Datasets/voluntariosdanavalencia_old.json") # Import data from Voluntarios de Valencia groupchat.

### Check channels

In [3]:
# Check data structure
print(df.shape)
print(df.columns)
df.head()

(18064, 17)
Index(['id', 'date', 'message', 'reply_to_msg_id', 'views', 'forwards',
       'edit_date', 'pinned', 'post_author', 'sender_id', 'sender_username',
       'sender_name', 'has_media', 'reactions', 'subgroup', 'topic_name',
       'reply'],
      dtype='object')


Unnamed: 0,id,date,message,reply_to_msg_id,views,forwards,edit_date,pinned,post_author,sender_id,sender_username,sender_name,has_media,reactions,subgroup,topic_name,reply
0,3,2024-10-30 12:39:24+00:00,Os paso por aqu√≠ el correo,,,,,False,,1110241832,Manuel_deRonde,Manuel DeRonde - Coordinador Civil ü´±üèª‚Äçü´≤üèº,False,[],,Discusi√≥n general,False
1,4,2024-10-30 12:40:50+00:00,LO AVIS√â EL VIERNES PASADO Y NADIE ME HIZO CAS...,,46823.0,1057.0,2024-11-01T18:21:38+00:00,False,,1110241832,Manuel_deRonde,Manuel DeRonde - Coordinador Civil ü´±üèª‚Äçü´≤üèº,True,"[{'user_id': 5887977931, 'username': '', 'disp...",,Discusi√≥n general,False
2,5,2024-10-30 12:43:17+00:00,,,,,2024-11-03T22:44:05+00:00,False,,1110241832,Manuel_deRonde,Manuel DeRonde - Coordinador Civil ü´±üèª‚Äçü´≤üèº,True,"[{'user_id': 6970134793, 'username': '', 'disp...",,Discusi√≥n general,False
3,6,2024-10-30 12:43:23+00:00,Probad si podeis,,,,,False,,1110241832,Manuel_deRonde,Manuel DeRonde - Coordinador Civil ü´±üèª‚Äçü´≤üèº,False,[],,Discusi√≥n general,False
4,7,2024-10-30 12:46:02+00:00,Durante la tormenta al parecer s√≠ estaba opera...,4.0,,,,False,,941865373,Camelocota,V√≠ctor Conejero,False,[],Thread_4,Discusi√≥n general,True


In [7]:
# Convert date to datetime and sort by time
df['date'] = pd.to_datetime(df['date'])
df = df.sort_values('date').reset_index(drop=True)

print(f"Total messages: {len(df)}")
print(f"Date range: {df['date'].min()} to {df['date'].max()}")

Total messages: 18064
Date range: 2024-10-30 12:39:24+00:00 to 2025-11-10 11:06:47+00:00


In [10]:
# Calculate waiting times (inter-arrival times) between consecutive messages
import numpy as np

# Calculate time differences in seconds
df['waiting_time'] = df['date'].diff().dt.total_seconds()

# Remove the first NaN value and negative values (if any)
waiting_times = df['waiting_time'].dropna()
waiting_times = waiting_times[waiting_times > 0]

In [8]:
# Check possible values for 'topic_name' column
print(df['topic_name'].unique())

['Discusi√≥n general' 'Bienvenid@s a la Red de Voluntari@s (leed primero)'
 'Transporte de personas a Comunidad Valenciana'
 'Grupos de Acci√≥n Voluntarios en Terreno' 'Asistencia Jur√≠dica/Seguros'
 'Asistencia T√©cnica y Maquinaria (mec√°nica, fontaner√≠a, electricidad, agricola)'
 'Asistencia animales compa√±ia y otros'
 'Asistencia Inform√°tica/Soporte EAT'
 'Log√≠stica Interna Valencia(puntos de recepci√≥n)' 'Ayuda de Empresas'
 'Investigaci√≥n Ciudadana: Responsabilidades Pol√≠ticas'
 'Asistencia a Voluntarios (Comida y Acogida))'
 'Asis. Grupos Vulnerables (Maternidad , Infancia, Mayores, etc)'
 'Material Video/Fotogr√°fico' 'Webs Esenciales'
 'Mensajes de Ayuda (Ofrezco/Necesito)'
 'Voluntarios de fuera de Valencia (Madrid, Catalu√±a, Alicante, Castell√≥n)'
 'Viviendas Edificaci√≥n , Muebles y Acondicionamiento']


In [9]:
# Generate dataframe for each channel
df_general = df[df['topic_name'] == 'Discusi√≥n general']
df_bienvenidos = df[df['topic_name'] == 'Bienvenid@s a la Red de Voluntari@s (leed primero)']
df_tranporte = df[df['topic_name'] == 'Transporte de personas a Comunidad Valenciana']
df_grupos_accion = df[df['topic_name'] == 'Grupos de Acci√≥n Voluntarios en Terreno']
df_juridica = df[df['topic_name'] == 'Asistencia Jur√≠dica/Seguros']
df_tecnica = df[df['topic_name'] == 'Asistencia T√©cnica y Maquinaria (mec√°nica, fontaner√≠a, electricidad, agricola)']
df_animales = df[df['topic_name'] == 'Asistencia animales compa√±ia y otros']
df_informatica = df[df['topic_name'] == 'Asistencia Inform√°tica/Soporte EAT']
df_logistica = df[df['topic_name'] == 'Log√≠stica Interna Valencia(puntos de recepci√≥n)']
df_ayudaempresas = df[df['topic_name'] == 'Ayuda de Empresas']
df_investigacion = df[df['topic_name'] == 'Investigaci√≥n Ciudadana: Responsabilidades Pol√≠ticas']
df_asistencia_voluntarios = df[df['topic_name'] == 'Asistencia a Voluntarios (Comida y Acogida))']
df_asistencia_vulnerables = df[df['topic_name'] == 'Asis. Grupos Vulnerables (Maternidad , Infancia, Mayores, etc)']
df_material = df[df['topic_name'] == 'Material Video/Fotogr√°fico']
df_webs = df[df['topic_name'] == 'Webs Esenciales']
df_mensajes_ayuda = df[df['topic_name'] == 'Mensajes de Ayuda (Ofrezco/Necesito)']
df_voluntarios_fuera = df[df['topic_name'] == 'Voluntarios de fuera de Valencia (Madrid, Catalu√±a, Alicante, Castell√≥n)']
df_viviendas = df[df['topic_name'] == 'Viviendas Edificaci√≥n , Muebles y Acondicionamiento']


In [11]:
# Check lenght for the different channels
print(f"Total messages in 'Discusi√≥n general': {len(df_general)}")
print(f"Total messages in 'Bienvenid@s a la Red de Voluntari@s (leed primero)': {len(df_bienvenidos)}")
print(f"Total messages in 'Transporte de personas a Comunidad Valenciana': {len(df_tranporte)}")
print(f"Total messages in 'Grupos de Acci√≥n Voluntarios en Terreno': {len(df_grupos_accion)}")
print(f"Total messages in 'Asistencia Jur√≠dica/Seguros': {len(df_juridica)}")
print(f"Total messages in 'Asistencia T√©cnica y Maquinaria (mec√°nica, fontaner√≠a, electricidad, agricola)': {len(df_tecnica)}")
print(f"Total messages in 'Asistencia animales compa√±ia y otros': {len(df_animales)}")
print(f"Total messages in 'Asistencia Inform√°tica/Soporte EAT': {len(df_informatica)}")
print(f"Total messages in 'Log√≠stica Interna Valencia(puntos de recepci√≥n)': {len(df_logistica)}")
print(f"Total messages in 'Ayuda de Empresas': {len(df_ayudaempresas)}")
print(f"Total messages in 'Investigaci√≥n Ciudadana: Responsabilidades Pol√≠ticas': {len(df_investigacion)}")
print(f"Total messages in 'Asistencia a Voluntarios (Comida y Acogida))': {len(df_asistencia_voluntarios)}")
print(f"Total messages in 'Asis. Grupos Vulnerables (Maternidad , Infancia, Mayores, etc)': {len(df_asistencia_vulnerables)}")
print(f"Total messages in 'Material Video/Fotogr√°fico': {len(df_material)}")
print(f"Total messages in 'Webs Esenciales': {len(df_webs)}")
print(f"Total messages in 'Mensajes de Ayuda (Ofrezco/Necesito)': {len(df_mensajes_ayuda)}")
print(f"Total messages in 'Voluntarios de fuera de Valencia (Madrid, Catalu√±a, Alicante, Castell√≥n)': {len(df_voluntarios_fuera)}") 
print(f"Total messages in 'Viviendas Edificaci√≥n , Muebles y Acondicionamiento': {len(df_viviendas)}")

Total messages in 'Discusi√≥n general': 256
Total messages in 'Bienvenid@s a la Red de Voluntari@s (leed primero)': 2856
Total messages in 'Transporte de personas a Comunidad Valenciana': 2076
Total messages in 'Grupos de Acci√≥n Voluntarios en Terreno': 1052
Total messages in 'Asistencia Jur√≠dica/Seguros': 819
Total messages in 'Asistencia T√©cnica y Maquinaria (mec√°nica, fontaner√≠a, electricidad, agricola)': 488
Total messages in 'Asistencia animales compa√±ia y otros': 1033
Total messages in 'Asistencia Inform√°tica/Soporte EAT': 1964
Total messages in 'Log√≠stica Interna Valencia(puntos de recepci√≥n)': 1307
Total messages in 'Ayuda de Empresas': 300
Total messages in 'Investigaci√≥n Ciudadana: Responsabilidades Pol√≠ticas': 2770
Total messages in 'Asistencia a Voluntarios (Comida y Acogida))': 1163
Total messages in 'Asis. Grupos Vulnerables (Maternidad , Infancia, Mayores, etc)': 144
Total messages in 'Material Video/Fotogr√°fico': 1170
Total messages in 'Webs Esenciales': 12
