In [1]:
import requests
import pymongo
from config import API_KEY
from countries import countries, country_codes

In [4]:
rawData = {}
countriesData = []
for i in range(len(country_codes)):
    #visit news api
    query_url = f"https://newsapi.org/v2/top-headlines?country={country_codes[i]}&apiKey={API_KEY}"
    #get response
    response = requests.get(query_url).json()
    #add raw articles data to rawData dict
    rawData[countries[i]] = response["articles"]
    
    #set empty articles list
    articlesList = []
    #for each article
    for article in response["articles"]:
        #construct article dictionary
        articleDict = {"source": article["source"]["name"], 
                       "title": article["title"].split(" - ")[0], 
                       "url": article["url"], 
                       "date": article["publishedAt"][:10]}
        #add dict to articles list
        articlesList.append(articleDict)
    
    #construct country dictionary
    countryDict = {
        "country": countries[i],
        "country_code": country_codes[i],
        "articles": articlesList
    }
    #add dict to countries data
    countriesData.append(countryDict)

In [5]:
countriesData

[{'country': 'Argentina',
  'country_code': 'ar',
  'articles': [{'source': 'Infobae',
    'title': 'La lista de ganadores de los premios Grammy 2019',
    'url': 'https://www.infobae.com/teleshow/infoshow/2019/02/10/la-lista-de-ganadores-de-los-premios-grammy-2019/',
    'date': '2019-02-10'},
   {'source': 'La Nacion',
    'title': 'Al ángulo: el golazo de tiro libre de Juan Fernando Quintero en River-Racing',
    'url': 'https://www.lanacion.com.ar/2219035-river-racing-quintero-superliga',
    'date': '2019-02-10'},
   {'source': 'Infobae',
    'title': 'Pelea de trapitos en el Rosedal: uno fue apuñalado y lucha por su vida',
    'url': 'https://www.infobae.com/sociedad/2019/02/10/pelea-de-trapitos-en-el-rosedal-uno-fue-apunalado-y-lucha-por-su-vida/',
    'date': '2019-02-10'},
   {'source': 'Tycsports.com',
    'title': 'Godoy Cruz ganó y cortó una racha de cuatro partidos sin triunfos',
    'url': 'https://www.tycsports.com/nota/superliga/2019/02/10/godoy-cruz-gano-y-corto-una-ra

In [9]:
conn = 'mongodb://localhost:27017/'
client = pymongo.MongoClient(conn)

# Declare the database
db = client["top_headlines"]

db["countries_data"].drop()
db["raw_countries_data"].drop()

# Declare the collection
rawCollection = db["raw_countries_data"]
collection = db["countries_data"]

In [10]:
rawCollection.insert_one(rawData)
collection.insert_many(countriesData)

  """Entry point for launching an IPython kernel.


<pymongo.results.InsertManyResult at 0x143f1ca77c8>

In [11]:
results = db.countries_data.find()
for result in results:
    print(result)

{'_id': ObjectId('5c60c8134a065403549f9495'), 'country': 'Argentina', 'country_code': 'ar', 'articles': [{'source': 'Infobae', 'title': 'La lista de ganadores de los premios Grammy 2019', 'url': 'https://www.infobae.com/teleshow/infoshow/2019/02/10/la-lista-de-ganadores-de-los-premios-grammy-2019/', 'date': '2019-02-10'}, {'source': 'La Nacion', 'title': 'Al ángulo: el golazo de tiro libre de Juan Fernando Quintero en River-Racing', 'url': 'https://www.lanacion.com.ar/2219035-river-racing-quintero-superliga', 'date': '2019-02-10'}, {'source': 'Infobae', 'title': 'Pelea de trapitos en el Rosedal: uno fue apuñalado y lucha por su vida', 'url': 'https://www.infobae.com/sociedad/2019/02/10/pelea-de-trapitos-en-el-rosedal-uno-fue-apunalado-y-lucha-por-su-vida/', 'date': '2019-02-10'}, {'source': 'Tycsports.com', 'title': 'Godoy Cruz ganó y cortó una racha de cuatro partidos sin triunfos', 'url': 'https://www.tycsports.com/nota/superliga/2019/02/10/godoy-cruz-gano-y-corto-una-racha-de-cuatro

In [12]:
results = db.raw_countries_data.find()
for result in results:
    print(result)

