In [1]:
pip install eventregistry

Collecting eventregistry
  Downloading eventregistry-9.1.tar.gz (59 kB)
  Preparing metadata (setup.py) ... [?25ldone
Building wheels for collected packages: eventregistry
[33m  DEPRECATION: Building 'eventregistry' using the legacy setup.py bdist_wheel mechanism, which will be removed in a future version. pip 25.3 will enforce this behaviour change. A possible replacement is to use the standardized build interface by setting the `--use-pep517` option, (possibly combined with `--no-build-isolation`), or adding a `pyproject.toml` file to the source tree of 'eventregistry'. Discussion can be found at https://github.com/pypa/pip/issues/6334[0m[33m
[0m  Building wheel for eventregistry (setup.py) ... [?25ldone
[?25h  Created wheel for eventregistry: filename=eventregistry-9.1-py3-none-any.whl size=67624 sha256=3b83e6dad1dbb7f61dd718494c5888c224d15d149f98a1f4a2303ef94a7b86d5
  Stored in directory: /root/.cache/pip/wheels/ef/b4/df/d901df881884202dc1fcb1a2ce42852f26ecf6fd1200ebf2b8
Suc

In [3]:
import pandas as pd
from eventregistry import *
from datetime import date, timedelta

er = EventRegistry(apiKey="ced441ab-7fa4-4e20-b4af-8bd02fbb5431")

italian_source_uris = [
    'ansa.it', 'corriere.it', 'repubblica.it', 'lastampa.it', 'ilsole24ore.com',
    'adnkronos.com', 'ilfattoquotidiano.it', 'ilmessaggero.it', 'ilgiornale.it',
    'avvenire.it', 'internazionale.it', 'ilmattino.it', 'ilgazzettino.it',
    'unionesarda.it', 'ilsecoloxix.it', 'gds.it', 'quotidiano.net', 
    'liberoquotidiano.it', 'huffingtonpost.it', 'fanpage.it'
]

end_date = date.today()
start_date = end_date - timedelta(days=30)

all_articles = []
max_articles_to_fetch = 10000

print(f"Inizio raccolta per un massimo di {max_articles_to_fetch} articoli italiani da {start_date} a {end_date}.") #dati ottenuti nel mese tra il primo giugno e il primo luglio
print(f"Numero di fonti utilizzate: {len(italian_source_uris)}")

requested_info = RequestArticlesInfo(
    returnInfo=ReturnInfo(
        articleInfo=ArticleInfoFlags(
            body=True,
            title=True,
            url=True,
            source=SourceInfoFlags(title=True),
            dateTimePub=True
        )
    )
)

q = QueryArticlesIter( #classe utile per gestire richieste API
    sourceUri=QueryItems.OR(italian_source_uris), #dice ad API dove (quale fonte) cercare gli articoli
    dateStart=start_date,
    dateEnd=end_date,
    lang="ita",
    requestedResult=requested_info
)

# Esegui la query
print(f"Eseguo la query... La libreria scaricherà gli articoli in blocchi.")
try:
    for article in q.execQuery(er, sortBy="date", max_items=max_articles_to_fetch):
        all_articles.append({
            'source': article.get('source', {}).get('title', 'N/A'),
            'title': article.get('title'),
            'description': article.get('body', '')[:300] + '...' if article.get('body') else '',
            'content': article.get('body'),
            'published_at': article.get('dateTimePub'),
            'url': article.get('url')
        })

        if len(all_articles) > 0 and len(all_articles) % 250 == 0:
            print(f"  -> Raccolti {len(all_articles)} articoli...")

except Exception as e:
    print(f"\nERRORE durante il download degli articoli: {e}")
    print("Potrebbe essere stato raggiunto il limite del piano gratuito o un altro problema con la richiesta.")

# Crea un DataFrame e salvalo
df = pd.DataFrame(all_articles)
df.to_csv('articoli_italia_ultimi_30_giorni.csv', index=False)
print(f"\nRaccolta completata! Totale articoli salvati: {len(df)}")

Inizio raccolta per un massimo di 10000 articoli italiani da 2025-06-01 a 2025-07-01.
Numero di fonti utilizzate: 20
Eseguo la query... La libreria scaricherà gli articoli in blocchi.
  -> Raccolti 250 articoli...
  -> Raccolti 500 articoli...
  -> Raccolti 750 articoli...
  -> Raccolti 1000 articoli...
  -> Raccolti 1250 articoli...
  -> Raccolti 1500 articoli...
  -> Raccolti 1750 articoli...
  -> Raccolti 2000 articoli...
  -> Raccolti 2250 articoli...
  -> Raccolti 2500 articoli...
  -> Raccolti 2750 articoli...
  -> Raccolti 3000 articoli...
  -> Raccolti 3250 articoli...
  -> Raccolti 3500 articoli...
  -> Raccolti 3750 articoli...
  -> Raccolti 4000 articoli...
  -> Raccolti 4250 articoli...
  -> Raccolti 4500 articoli...
  -> Raccolti 4750 articoli...
  -> Raccolti 5000 articoli...
  -> Raccolti 5250 articoli...
  -> Raccolti 5500 articoli...
  -> Raccolti 5750 articoli...
  -> Raccolti 6000 articoli...
  -> Raccolti 6250 articoli...
  -> Raccolti 6500 articoli...
  -> Raccolti

The processing of the request took a lot of time (20 sec). By repeatedly making slow requests your account will be temporarily disabled.


  -> Raccolti 75250 articoli...
  -> Raccolti 75500 articoli...
  -> Raccolti 75750 articoli...
  -> Raccolti 76000 articoli...
  -> Raccolti 76250 articoli...
  -> Raccolti 76500 articoli...
  -> Raccolti 76750 articoli...
  -> Raccolti 77000 articoli...
  -> Raccolti 77250 articoli...
  -> Raccolti 77500 articoli...
  -> Raccolti 77750 articoli...
  -> Raccolti 78000 articoli...
  -> Raccolti 78250 articoli...
  -> Raccolti 78500 articoli...
  -> Raccolti 78750 articoli...
  -> Raccolti 79000 articoli...
  -> Raccolti 79250 articoli...
  -> Raccolti 79500 articoli...
  -> Raccolti 79750 articoli...
  -> Raccolti 80000 articoli...
  -> Raccolti 80250 articoli...
  -> Raccolti 80500 articoli...
  -> Raccolti 80750 articoli...
  -> Raccolti 81000 articoli...
  -> Raccolti 81250 articoli...
  -> Raccolti 81500 articoli...
  -> Raccolti 81750 articoli...

Raccolta completata! Totale articoli salvati: 81892


In [23]:
df.head(20)

Unnamed: 0,source,title,description,content,published_at,url
0,ANSA.it,"Sfollati Ancona senza contributo, 'paghiamo mu...","I cittadini in Aula: ""ci considerino come gli ...","I cittadini in Aula: ""ci considerino come gli ...",2025-07-01T11:08:09Z,https://www.ansa.it/marche/notizie/2025/07/01/...
1,Internazionale,Bombardamento israeliano di un internet café a...,"Nonostante i ripetuti appelli per una tregua, ...","Nonostante i ripetuti appelli per una tregua, ...",2025-07-01T11:01:13Z,https://www.internazionale.it/ultime-notizie/2...
2,ANSA.it,Contro il caldo cento alberi nelle piazze del ...,L'allerta caldo non dà tregua e il Comune di B...,L'allerta caldo non dà tregua e il Comune di B...,2025-07-01T11:09:41Z,https://www.ansa.it/emiliaromagna/notizie/2025...
3,ANSA.it,"Regione, approvato programma per il Fondo Stra...",Il consiglio regionale della Liguria ha approv...,Il consiglio regionale della Liguria ha approv...,2025-07-01T11:02:44Z,https://www.ansa.it/liguria/notizie/2025/07/01...
4,ANSA.it,++ La premier Meloni domani da Papa Leone ++ -...,Papa Leone XIV riceverà domani in udienza la p...,Papa Leone XIV riceverà domani in udienza la p...,2025-07-01T11:00:14Z,https://www.ansa.it/sito/notizie/flash/2025/07...
5,Adnkronos,"Algeria, lo scrittore Sansal condannato a 5 an...",Lo scrittore franco algerino Boualem Sansal è ...,Lo scrittore franco algerino Boualem Sansal è ...,2025-07-01T11:11:01Z,https://www.adnkronos.com/internazionale/ester...
6,HuffPost Italia,"Bergamo, pubblicava reel e post di propaganda ...",Aveva postato sui social media numerosi reel e...,Aveva postato sui social media numerosi reel e...,2025-07-01T09:13:00Z,https://www.huffingtonpost.it/video/2025/07/01...
7,HuffPost Italia,"Bergamo, pubblicava reel e post di propaganda ...",Aveva postato sui social media numerosi reel e...,Aveva postato sui social media numerosi reel e...,2025-07-01T09:14:00Z,https://www.huffingtonpost.it/video/2025/07/01...
8,HuffPost Italia,"Incendi a Roma, in fiamme rivenditore di auto ...","Copiato negli appunti <iframe src=""https://www...","Copiato negli appunti <iframe src=""https://www...",2025-07-01T09:12:00Z,https://www.huffingtonpost.it/video/2025/07/01...
9,HuffPost Italia,"Dazi, Tajani: ""Il mio obiettivo è 0-0 con Cana...",Il ministro degli Esteri e vicepremier Antonio...,Il ministro degli Esteri e vicepremier Antonio...,2025-07-01T09:11:00Z,https://www.huffingtonpost.it/video/2025/07/01...
