In [None]:
!pip install sparqlwrapper
# https://rdflib.github.io/sparqlwrapper/





In [None]:
import sys
from SPARQLWrapper import SPARQLWrapper, JSON
import numpy as np
from tabulate import tabulate


In [None]:
endpoint_url = "https://query.wikidata.org/sparql"

In [None]:
def get_results(endpoint_url, query):
    user_agent = "WDQS-example Python/%s.%s" % (sys.version_info[0], sys.version_info[1])
    # TODO adjust user agent; see https://w.wiki/CX6
    sparql = SPARQLWrapper(endpoint_url, agent=user_agent)
    sparql.setQuery(query)
    sparql.setReturnFormat(JSON)
    return sparql.query().convert()

# List of 10 **MOST** populated countries and  their capital(s)

In [None]:
query = """

SELECT DISTINCT  ?countryLabel  ?capitalLabel ?population
WHERE
{
  ?country wdt:P31 wd:Q3624078 ;
           wdt:P1082 ?population .
  #not a former country
  FILTER NOT EXISTS {?country wdt:P31 wd:Q3024240}
  #and no an ancient civilisation (needed to exclude ancient Egypt)
  FILTER NOT EXISTS {?country wdt:P31 wd:Q28171280}
  OPTIONAL { ?country wdt:P36 ?capital } .

  SERVICE wikibase:label { bd:serviceParam wikibase:language "hi" }
}
ORDER BY DESC(?population)
LIMIT 10
"""

results = get_results(endpoint_url, query)


In [None]:
results

{'head': {'vars': ['countryLabel', 'capitalLabel', 'population']},
 'results': {'bindings': [{'capitalLabel': {'type': 'literal',
     'value': 'बीजिंग',
     'xml:lang': 'hi'},
    'countryLabel': {'type': 'literal',
     'value': 'चीनी जनवादी गणराज्य',
     'xml:lang': 'hi'},
    'population': {'datatype': 'http://www.w3.org/2001/XMLSchema#decimal',
     'type': 'literal',
     'value': '1443497378'}},
   {'capitalLabel': {'type': 'literal',
     'value': 'नई दिल्ली',
     'xml:lang': 'hi'},
    'countryLabel': {'type': 'literal', 'value': 'भारत', 'xml:lang': 'hi'},
    'population': {'datatype': 'http://www.w3.org/2001/XMLSchema#decimal',
     'type': 'literal',
     'value': '1326093247'}},
   {'capitalLabel': {'type': 'literal',
     'value': 'वॉशिंगटन डी॰ सी॰',
     'xml:lang': 'hi'},
    'countryLabel': {'type': 'literal',
     'value': 'संयुक्त राज्य अमेरिका',
     'xml:lang': 'hi'},
    'population': {'datatype': 'http://www.w3.org/2001/XMLSchema#decimal',
     'type': 'litera

In [None]:

top_10 = []
top_10_pop_country = results['results']['bindings']
for item in top_10_pop_country:
    country = item['countryLabel']['value']
    capital = item['capitalLabel']['value']
    population = item['population']['value']
    top_10.append([country, capital, population])
    

In [None]:
 print(tabulate(top_10, headers=['COUNTRY', 'CAPITAL', 'COUNTRY POPULATION']))

COUNTRY             CAPITAL            COUNTRY POPULATION
------------------  ---------------  --------------------
चीनी जनवादी गणराज्य  बीजिंग                      1443497378
भारत                नई दिल्ली                   1326093247
संयुक्त राज्य अमेरिका    वॉशिंगटन डी॰ सी॰             331449281
इंडोनेशिया            जकार्ता                      270625568
पाकिस्तान            इस्लामाबाद                   216565318
ब्राज़ील              ब्रासीलिया                   213317639
नाईजीरिया           अबुजा                        190886311
बांग्लादेश             ढाका                        165775000
रूस                  मास्को                       146804372
जापान               टोक्यो                       126434565


In [None]:
text1 = 'दुनिया में कुछ सबसे बड़ी आबादी वाले देश हैं '
text2 = ''
top_10 = []
top_10_pop_country = results['results']['bindings']
for idx, item in enumerate(top_10_pop_country):
    
    country = item['countryLabel']['value']
    capital = item['capitalLabel']['value']
    population = item['population']['value']
    
    if idx == len(top_10_pop_country)-1:
        text1 +=  country + "।"
    elif idx == len(top_10_pop_country)-2:
        text1 +=  country + " और "
    else:
        text1 +=  country + ", "
    text2 += country + " की आबादी लगभग " + population + " है और इसकी राजधानी " + capital + " है।\n"
print(text1)
print(text2)

दुनिया में कुछ सबसे बड़ी आबादी वाले देश हैं चीनी जनवादी गणराज्य, भारत, संयुक्त राज्य अमेरिका, इंडोनेशिया, पाकिस्तान, ब्राज़ील, नाईजीरिया, बांग्लादेश, रूस और जापान।
चीनी जनवादी गणराज्य की आबादी लगभग 1443497378 है और इसकी राजधानी बीजिंग है।
भारत की आबादी लगभग 1326093247 है और इसकी राजधानी नई दिल्ली है।
संयुक्त राज्य अमेरिका की आबादी लगभग 331449281 है और इसकी राजधानी वॉशिंगटन डी॰ सी॰ है।
इंडोनेशिया की आबादी लगभग 270625568 है और इसकी राजधानी जकार्ता है।
पाकिस्तान की आबादी लगभग 216565318 है और इसकी राजधानी इस्लामाबाद है।
ब्राज़ील की आबादी लगभग 213317639 है और इसकी राजधानी ब्रासीलिया है।
नाईजीरिया की आबादी लगभग 190886311 है और इसकी राजधानी अबुजा है।
बांग्लादेश की आबादी लगभग 165775000 है और इसकी राजधानी ढाका है।
रूस की आबादी लगभग 146804372 है और इसकी राजधानी मास्को है।
जापान की आबादी लगभग 126434565 है और इसकी राजधानी टोक्यो है।



# List of 10 **LEAST** populated countries and  their capital(s)

In [None]:
query = """
#List of present-day countries and capital(s)
SELECT DISTINCT  ?countryLabel  ?capitalLabel ?population
WHERE
{
  ?country wdt:P31 wd:Q3624078 ;
           wdt:P1082 ?population .
  #not a former country
  FILTER NOT EXISTS {?country wdt:P31 wd:Q3024240}
  #and no an ancient civilisation (needed to exclude ancient Egypt)
  FILTER NOT EXISTS {?country wdt:P31 wd:Q28171280}
  OPTIONAL { ?country wdt:P36 ?capital } .

  SERVICE wikibase:label { bd:serviceParam wikibase:language "hi" }
}
ORDER BY ?population
LIMIT 11
"""

results = get_results(endpoint_url, query)


In [None]:

top_10 = []
top_10_pop_country = results['results']['bindings']
for item in top_10_pop_country[1:]:
    country = item['countryLabel']['value']
    capital = item['capitalLabel']['value']
    population = item['population']['value']
    top_10.append([country, capital, population])
    

In [None]:
 print(tabulate(top_10, headers=['COUNTRY', 'CAPITAL', 'COUNTRY POPULATION']))

COUNTRY           CAPITAL          COUNTRY POPULATION
----------------  -------------  --------------------
तुवालू              फुनाफुति                        11192
नौरु               यारेन जिला                     13650
पलाउ              ञुरूलमुड                         21729
सान मारिनो        सैन मारिनो नगर                 33400
लिक्टेन्स्टाइन        वादुज़                          37922
मोनैको             Q55115                        38695
मार्शल द्वीपसमूह     माजुरो                         53127
सन्त किट्स और नेविस  बासेटेयर                        55345
डोमिनिका          रोसीयू                         73925
अण्डोरा            अण्डोरा ला वेला                 78151


In [None]:
text1 = 'दुनिया में कुछ सबसे कम आबादी वाले देश हैं '
text2 = ''
top_10 = []
top_10_pop_country = results['results']['bindings']
for idx, item in enumerate(top_10_pop_country[1:]):
    
    country = item['countryLabel']['value']
    capital = item['capitalLabel']['value']
    population = item['population']['value']
    
    if idx == len(top_10_pop_country[1:])-1:
        text1 +=  country + "।"
    elif idx == len(top_10_pop_country[1:])-2:
        text1 +=  country + " और "
    else:
        text1 +=  country + ", "
    text2 += country + " की आबादी लगभग " + population + " है और इसकी राजधानी " + capital + " है।\n"
print(text1)
print(text2)

दुनिया में कुछ सबसे कम आबादी वाले देश हैं तुवालू, नौरु, पलाउ, सान मारिनो, लिक्टेन्स्टाइन, मोनैको, मार्शल द्वीपसमूह, सन्त किट्स और नेविस, डोमिनिका और अण्डोरा।
तुवालू की आबादी लगभग 11192 है और इसकी राजधानी फुनाफुति है।
नौरु की आबादी लगभग 13650 है और इसकी राजधानी यारेन जिला है।
पलाउ की आबादी लगभग 21729 है और इसकी राजधानी ञुरूलमुड है।
सान मारिनो की आबादी लगभग 33400 है और इसकी राजधानी सैन मारिनो नगर है।
लिक्टेन्स्टाइन की आबादी लगभग 37922 है और इसकी राजधानी वादुज़ है।
मोनैको की आबादी लगभग 38695 है और इसकी राजधानी Q55115 है।
मार्शल द्वीपसमूह की आबादी लगभग 53127 है और इसकी राजधानी माजुरो है।
सन्त किट्स और नेविस की आबादी लगभग 55345 है और इसकी राजधानी बासेटेयर है।
डोमिनिका की आबादी लगभग 73925 है और इसकी राजधानी रोसीयू है।
अण्डोरा की आबादी लगभग 78151 है और इसकी राजधानी अण्डोरा ला वेला है।



# List of 10 **MOST** populated CITIES

In [None]:

query = """#Largest cities of the world
#defaultView:BubbleChart
SELECT DISTINCT ?cityLabel ?population 
WHERE
{
  ?city wdt:P31/wdt:P279* wd:Q515 .
  ?city wdt:P1082 ?population .
  SERVICE wikibase:label {
    bd:serviceParam wikibase:language "hi" .
  }
}
ORDER BY DESC(?population) 
LIMIT 10"""

results = get_results(endpoint_url, query)


In [None]:
top_10_cities = []
top_10_cities_data = results['results']['bindings']
for item in top_10_cities_data[1:]:
    city = item['cityLabel']['value']
    population = item['population']['value']
    top_10_cities.append([city,  population])
    
print(tabulate(top_10_cities, headers=['CITY', 'POPULATION']))

CITY      POPULATION
------  ------------
शंघाई        23390000
बीजिंग       21710000
ढाका        16800000
मुम्बई        15414288
कराची       14910352
लागोस       14862000
इस्तांबुल      14657434
टोक्यो       14049146
तिआंजिन      13245000


In [None]:

text = ""
text1 = 'दुनिया के कुछ सबसे बड़े आबादी वाले शहर हैं '
top_10_cities_data = results['results']['bindings']
for idx, item in enumerate(top_10_cities_data[1:]):
    city = item['cityLabel']['value']
    population = item['population']['value']
    text += city + " की आबादी लगभग " + population + " है।\n"
    if idx == len(top_10_cities_data[1:])-1:
        text1 +=  city + "।"
    elif idx == len(top_10_cities_data[1:])-2:
        text1 +=  city + " और "
    else:
        text1 +=  city + ", "
    #text1 += city + ", "
print(text1)
print(text)

दुनिया के कुछ सबसे बड़े आबादी वाले शहर हैं शंघाई, बीजिंग, ढाका, मुम्बई, कराची, लागोस, इस्तांबुल, टोक्यो और तिआंजिन।
शंघाई की आबादी लगभग 23390000 है।
बीजिंग की आबादी लगभग 21710000 है।
ढाका की आबादी लगभग 16800000 है।
मुम्बई की आबादी लगभग 15414288 है।
कराची की आबादी लगभग 14910352 है।
लागोस की आबादी लगभग 14862000 है।
इस्तांबुल की आबादी लगभग 14657434 है।
टोक्यो की आबादी लगभग 14049146 है।
तिआंजिन की आबादी लगभग 13245000 है।



# Names of Asian countries and common languages used there


In [None]:

query = """
SELECT DISTINCT ?official_language ?itemLabel_en WHERE {
  ?item wdt:P30 wd:Q48 ;
        wdt:P37 ?officiallanguage ;
        wdt:P31 wd:Q6256 .
  ?officiallanguage wdt:P424 ?langcode .
  ?item rdfs:label ?itemLabel_ol . FILTER(lang(?itemLabel_ol)=?langcode)
  ?item rdfs:label ?itemLabel_en . FILTER(lang(?itemLabel_en)='hi')
  ?officiallanguage rdfs:label ?official_language . FILTER(lang(?official_language)='hi')
}
ORDER BY ?item ?itemLabel_lol ?official_language
"""
results = get_results(endpoint_url, query)


In [None]:
import pprint
country_lang = []
data = results['results']['bindings']
for item in data:
    city = item['official_language']['value']
    population = item['itemLabel_en']['value']
    country_lang.append([city,  population])
    
print(tabulate(country_lang, headers=['COUNTRY', 'LANGUAGE']))

COUNTRY              LANGUAGE
-------------------  --------------------
जापानी भाषा          जापान
आधुनिक यूनानी भाषा     साइप्रस
तुर्कीयाई भाषा         साइप्रस
यूनानी भाषा           साइप्रस
कज़ाख़ भाषा            कज़ाख़िस्तान
रूसी भाषा             कज़ाख़िस्तान
इंडोनेशियाई भाषा       इंडोनेशिया
जावा भाषा            इंडोनेशिया
तुर्कीयाई भाषा         तुर्की
अरबी भाषा            मिस्र
फ़ारसी भाषा           पहलवी वंश
आर्मीनियाई भाषा       नागोरो-कराबाख गणराज्य
रूसी भाषा             नागोरो-कराबाख गणराज्य
उज़्बेक भाषा            उज़्बेकिस्तान
अंग्रेज़ी भाषा           सिंगापुर
तमिल भाषा            सिंगापुर
मलय भाषा             सिंगापुर
अरबी भाषा            बहरीन
खमेर भाषा             कम्बोडिया
तेतुम भाषा             पूर्वी तिमोर
पुर्तगाली भाषा         पूर्वी तिमोर
अंग्रेज़ी भाषा           भारत
हिन्दी                भारत
मंगोल भाषा और साहित्य  मंगोलिया
फ़ारसी भाषा           ईरान
अरबी भाषा            इराक
कुर्दी भाषा            इराक
अरबी भाषा            इज़राइल
इब्रानी भाषा          इज़राइल
अरब

In [None]:
country_lang = {}
data = results['results']['bindings']
for item in data:
    lang = item['official_language']['value']
    country = item['itemLabel_en']['value']
    try:
      country_lang[country].append(lang)
    except:
      country_lang[country]= [lang]
pprint.pprint(country_lang)    
#print(tabulate(country_lang, headers=['COUNTRY', 'LANGUAGE']))

{'अफ़्गानिस्तान': ['अरबी भाषा', 'उज़्बेक भाषा', 'तुर्कमेन भाषा', 'पश्तो भाषा'],
 'इंडोनेशिया': ['इंडोनेशियाई भाषा', 'जावा भाषा'],
 'इज़राइल': ['अरबी भाषा', 'इब्रानी भाषा'],
 'इराक': ['अरबी भाषा', 'कुर्दी भाषा'],
 'ईरान': ['फ़ारसी भाषा'],
 'उज़्बेकिस्तान': ['उज़्बेक भाषा'],
 'ओमान': ['अरबी भाषा'],
 'कज़ाख़िस्तान': ['कज़ाख़ भाषा', 'रूसी भाषा'],
 'कम्बोडिया': ['खमेर भाषा'],
 'क़तर': ['अरबी भाषा'],
 'किर्गिज़स्तान': ['किर्गिज़ भाषा', 'रूसी भाषा'],
 'चीनी गणराज्य': ['होक्का भाषा'],
 'जापान': ['जापानी भाषा'],
 'जॉर्डन': ['अरबी भाषा'],
 'ताजिकिस्तान': ['ताजिकी भाषा', 'रूसी भाषा'],
 'तुर्कमेनिस्तान': ['तुर्कमेन भाषा'],
 'तुर्की': ['तुर्कीयाई भाषा'],
 'थाईलैण्ड': ['थाई भाषा'],
 'दक्षिण कोरिया': ['कोरियाई भाषा'],
 'नागोरो-कराबाख गणराज्य': ['आर्मीनियाई भाषा', 'रूसी भाषा'],
 'नेपाल': ['नेपाली भाषा'],
 'पहलवी वंश': ['फ़ारसी भाषा'],
 'पाकिस्तान': ['अंग्रेज़ी भाषा', 'अरबी भाषा', 'उर्दू'],
 'पूर्वी तिमोर': ['तेतुम भाषा', 'पुर्तगाली भाषा'],
 'फ़िलीपीन्स': ['अंग्रेज़ी भाषा'],
 'बहरीन': ['अरबी भाषा'],
 '

In [None]:
text = ""
for key in country_lang.keys():
    if len(country_lang[key]) > 1:
      text += key + " में लोग " 
      for idx, lang in enumerate(country_lang[key]):
          lang = lang.split()[0]
          if idx == len(country_lang[key])-1:
              text +=  lang 
          elif idx == len(country_lang[key])-2:
              text +=  lang + " और "
          else:
              text +=  lang + ", "
      text += " बोलते हैं । \n"
    else:
        lang = country_lang[key][0]
        text += key + " में लोग " + lang + " बोलते हैं । \n"
print(text)

जापान में लोग जापानी भाषा बोलते हैं । 
साइप्रस में लोग आधुनिक, तुर्कीयाई और यूनानी बोलते हैं । 
कज़ाख़िस्तान में लोग कज़ाख़ और रूसी बोलते हैं । 
इंडोनेशिया में लोग इंडोनेशियाई और जावा बोलते हैं । 
तुर्की में लोग तुर्कीयाई भाषा बोलते हैं । 
मिस्र में लोग अरबी भाषा बोलते हैं । 
पहलवी वंश में लोग फ़ारसी भाषा बोलते हैं । 
नागोरो-कराबाख गणराज्य में लोग आर्मीनियाई और रूसी बोलते हैं । 
उज़्बेकिस्तान में लोग उज़्बेक भाषा बोलते हैं । 
सिंगापुर में लोग अंग्रेज़ी, तमिल और मलय बोलते हैं । 
बहरीन में लोग अरबी भाषा बोलते हैं । 
कम्बोडिया में लोग खमेर भाषा बोलते हैं । 
पूर्वी तिमोर में लोग तेतुम और पुर्तगाली बोलते हैं । 
भारत में लोग अंग्रेज़ी और हिन्दी बोलते हैं । 
मंगोलिया में लोग मंगोल भाषा और साहित्य बोलते हैं । 
ईरान में लोग फ़ारसी भाषा बोलते हैं । 
इराक में लोग अरबी और कुर्दी बोलते हैं । 
इज़राइल में लोग अरबी और इब्रानी बोलते हैं । 
यमन में लोग अरबी भाषा बोलते हैं । 
जॉर्डन में लोग अरबी भाषा बोलते हैं । 
किर्गिज़स्तान में लोग किर्गिज़ और रूसी बोलते हैं । 
लाओस में लोग लाओ भाषा बोलते हैं । 
लेबन