# Scopus

Para recuperar los datos de Scopus se va a utilizar la libreria de [pybliometrics](https://pybliometrics.readthedocs.io/en/stable/index.html). Para eso es necesario utilizar una credencial que será almacenada en un archivo de configuración. Más información en [Configuration](https://pybliometrics.readthedocs.io/en/stable/configuration.html)

In [77]:
import os
from pathlib import Path
from os import path

os.environ['PYB_CONFIG_FILE'] = "{main_path}/config/scopus_config.ini".format(main_path = Path.cwd().parent)
import pybliometrics

if (not path.exists(os.environ['PYB_CONFIG_FILE'])):
    # TODO no esta creando el archivo de configuración en la carpeta indicada, sino en ~/.pybliometrics/config.ini
    pybliometrics.scopus.utils.create_config()

Creating config file at /home/pablo/.pybliometrics/config.ini with default paths...
Configuration file successfully created at /home/pablo/.pybliometrics/config.ini
For details see https://pybliometrics.rtfd.io/en/stable/configuration.html.


<configparser.ConfigParser at 0x7f70ac6b7850>

Para recuperar datos sobre instituciones de Scopus, se utiliza la [Affiliation Retrieval API
](https://dev.elsevier.com/documentation/AffiliationRetrievalAPI.wadl) y una instancia de la clase [AffiliationRetrieval](https://pybliometrics.readthedocs.io/en/stable/classes/AffiliationRetrieval.html)

In [86]:
import pandas as pd
from pybliometrics.scopus import AffiliationRetrieval

Se recueperan datos de la Universidad Nacional de La Plata a través del identificador '60032057'.

In [89]:
aff = AffiliationRetrieval(60032057)
aff

<pybliometrics.scopus.affiliation_retrieval.AffiliationRetrieval at 0x7f70adf922b0>

La clase AffiliationRetrieval esta compuesta por:
* **address**
La dirección de la afiliación.

* **affiliation_name**
El nombre de la afiliación.

* **author_count**
Número de autores asociados a la afiliación.

* **city**
La ciudad de la afiliación.

* **country**
El país de la afiliación.

* **date_created**
Fecha de creación del registro de Scopus.

* **document_count**
Número de documentos de la afiliación.

* **eid**
El EID de la afiliación. Represenado en wikidata a través de la propiedad [P1154](https://www.wikidata.org/wiki/Property:P1154 )

* **identifier**
El ID de Scopus de la afiliación.

* **name_variants**
Una lista de namedtuples que representan variantes del nombre de la afiliación con el número de documentos que se refieren a esta variante.

* **org_domain**
Tipo de afiliación. Requiere la vista ESTÁNDAR y sólo está presente si el perfil es de tipo org.

* **org_type**
Sitio web de la afiliación. Requiere la vista STANDARD.

* **org_URL**
Sitio web de la afiliación. Requiere la vista STANDARD.

* **postal_code**
El código postal de la afiliación. Requiere la vista STANDARD.

* **scopus_affiliation_link**
Enlace a la vista web de Scopus de la afiliación.

* **self_link**
Enlace a la página API de la afiliación.

* **search_link**
URL to the API page listing documents of the affiliation.

* **state**
Estado (subunidad administrativa del país) de la afiliación. Requiere la vista STANDARD.

* **sort_name**
El nombre de la afiliación utilizado para la clasificación. Requiere la vista STANDARD.

* **url**
URL de la página API de la afiliación.


Se consulta los autores de la UNLP a partir del ID de filiación en Scopus, el '60032057'   

In [45]:
from pybliometrics.scopus import AuthorSearch
author_search = AuthorSearch('AF-ID(60032057)')
pd.set_option('display.max_columns', None)
df = pd.DataFrame(author_search.authors)
df

Unnamed: 0,eid,orcid,surname,initials,givenname,affiliation,documents,affiliation_id,city,country,areas
0,9-s2.0-56114080200,,Castro,E.A.,Eduardo Alberto,Universidad Nacional de La Plata,476,60032057,La Plata,Argentina,CHEM (403); PHYS (281); COMP (114)
1,9-s2.0-6602863112,,Azzaroni,O.,Omar,Universidad Nacional de La Plata,241,60032057,La Plata,Argentina,MATE (213); CHEM (189); PHYS (87)
2,9-s2.0-7005511248,,Romanelli,G.P.,Gustavo Pablo,Universidad Nacional de La Plata,204,60032057,La Plata,Argentina,CHEM (171); CENG (143); ENVI (52)
3,9-s2.0-7004101620,0000-0003-2771-7805,Althaus,L.G.,L. G.,Consejo Nacional de Investigaciones Científica...,200,60004518,Buenos Aires,Argentina,EART (169); PHYS (159); ENGI (2)
4,9-s2.0-7004599588,0000-0003-2954-6675,Muravchik,C.H.,Carlos Horacio,Comision de Investigaciones Cientificas - La P...,159,60020211,La Plata,Argentina,COMP (127); ENGI (121); MATH (24)
...,...,...,...,...,...,...,...,...,...,...,...
3312,9-s2.0-12344569900,,Urcola,U.,U.,Universidad Nacional de La Plata,1,60032057,La Plata,Argentina,MATE (2); PHYS (1); ENGI (1)
3313,9-s2.0-12140966300,,Dela Sota,L.,Luzbel,Universidad Nacional de La Plata,1,60032057,La Plata,Argentina,VETE (1)
3314,9-s2.0-12140525200,,Legarto,M.L.,María Leticia,Universidad Nacional de La Plata,1,60032057,La Plata,Argentina,CHEM (3); BIOC (1); PHYS (1)
3315,9-s2.0-12042407300,,Schamun,A.,Alejandro,Universidad Nacional de La Plata,1,60032057,La Plata,Argentina,PSYC (1); MEDI (1)


Alamaceno los datos en un dataframe de Pandas

In [38]:
pd.set_option('display.max_columns', None)
df = pd.DataFrame(author_search.authors)

24000

In [15]:
# normalizo tipos de datos
dfn = df.convert_dtypes()
dfn.dtypes

eid               string
orcid             string
surname           string
initials          string
givenname         string
affiliation       string
documents          Int64
affiliation_id    string
city              string
country           string
areas             string
dtype: object

## Valores Faltantes

En cuanto a los valores faltantes, podemos ver que un 94,78 % de autores carece de ORCID, un 0,54 % no registra un ciudad, y aproximadamente 0,15 % no registra ni iniciales ni nombre, mientras que un 0,06 no registra un pais.

In [51]:
na_ratio = ((dfn.isnull().sum() / len(dfn))*100).sort_values(ascending = False)
print(na_ratio)

orcid             94.784444
city               0.542659
initials           0.150739
givenname          0.150739
country            0.060295
eid                0.000000
surname            0.000000
affiliation        0.000000
documents          0.000000
affiliation_id     0.000000
areas              0.000000
dtype: float64


In [28]:
from pybliometrics.scopus import AuthorRetrieval
au = AuthorRetrieval('9-s2.0-6602079376')
for affiliation in au.affiliation_history:
    print(affiliation.preferred_name)


Consejo Nacional de Investigaciones Científicas y Técnicas
Universidad Nacional de La Plata
Multidisciplinary Training Laboratory for Technological Research (LEMIT)
Department of Civil Engineering
Comision de Investigaciones Cientificas - La Plata
LEMIT
Department of Construction Engineering
Commission of Scientific Research
Facultad de Ingeniería, Universidad Nacional de La Plata
Engineering Faculty
Research Council (CONICET
Department of Civil Engineering
A&#x0301;rea Tecnologi&#x0301;a Vial
None
LEMIT
Área Tecnología Vial 52 entre 121 y 122
LEMIT
Civil Engineering Department La Plata University (UNLP
Dirección de Vialidad de la Provincia de Buenos Aires
Área Tecnología Vial
Faculty of Engineering
Civil Engineering Department of UNLP
Commission of Scientific Research .52 y 121
LEMIT-Comisión de lnvestigaciones Cientificas
Dpto. de Construcciones
None
Laboratorio de Entrenamiento Multidisciplinario para la Investigación Tecnológica
Fac. Ing. UNLP Investigador CONICET
National Research

In [36]:
docs = au.get_documents()
df_doc = pd.DataFrame(docs)
df_doc

Unnamed: 0,eid,doi,pii,pubmed_id,title,subtype,subtypeDescription,creator,afid,affilname,affiliation_city,affiliation_country,author_count,author_names,author_ids,author_afids,coverDate,coverDisplayDate,publicationName,issn,source_id,eIssn,aggregationType,volume,issueIdentifier,article_number,pageRange,description,authkeywords,citedby_count,openaccess,freetoread,freetoreadLabel,fund_acr,fund_no,fund_sponsor
0,2-s2.0-85138362502,10.1002/suco.202200302,,,A practical approach for monitoring reinforcem...,ar,Article,Gomez E.,60032487;60032057;60023393;60021056;60015300;6...,Pontificia Universidad Catolica Argentina;Univ...,Buenos Aires;La Plata;San Martin;Buenos Aires;...,Argentina;Argentina;Argentina;Argentina;Italy;...,6,"Gomez, Enzo;Leporace-Guimil, Bruno;Conforti, A...",57203571457;57248759700;55646251900;6603837479...,60021056-60032487;60015300;60015300;60015300;6...,2022-01-01,2022,Structural Concrete,14644177,17442,17517648,Journal,,,,,The use of fibers in Reinforced Concrete (RC) ...,corrosion monitoring | corrosion potential | f...,0,1,publisherhybridgold,Hybrid Gold,FonCyT,undefined,Fondo para la Investigación Científica y Tecno...
1,2-s2.0-85129763349,10.7764/RDLC.21.1.135,,,Compressive resistance level effect on impact ...,ar,Article,Vivas J.C.,60004518,Consejo Nacional de Investigaciones Científica...,Buenos Aires,Argentina,2,"Vivas, Juan Carlos;Zerbino, Raúl",57218224071;6602079376,60004518;60004518,2022-01-01,2022,Revista de la Construccion,07177925,17600155205,0718915X,Journal,21,1,,135-144,impact resistance represents a key property of...,Compressive resistance | Drop-weight impact te...,0,0,repositoryvor,Green,CONICET,undefined,Consejo Nacional de Investigaciones Científica...
2,2-s2.0-85114519747,10.1007/978-3-030-83719-8_55,,,Design and Execution of Floors on Ground and I...,ch,Book Chapter,Pombo R.,60032057;60016063;126849164,Universidad Nacional de La Plata;Universidad T...,"La Plata;Buenos Aires;Beccar, Buenos Aires",Argentina;Argentina;Argentina,4,"Pombo, Roberto;Altamirano, Marcelo G.;Giaccio,...",57250770100;57250420000;6602169131;6602079376,126849164;60016063;60032057;60032057,2022-01-01,2022,RILEM Bookseries,22110844,21100229405,22110852,Book Series,36,,,640-651,Steel and synthetic macrofibres are widely use...,Crack control | Fibre reinforced concrete | Fl...,0,0,,,,undefined,
3,2-s2.0-85114504819,10.1007/978-3-030-83719-8_6,,,Drop-Weight Impact Test for Fibre Reinforced C...,ch,Book Chapter,Vivas J.C.,60110328;60004518;60003933,"Facultad de Ingeniería, Universidad Nacional d...",La Plata;Buenos Aires;San Miguel de Tucuman,Argentina;Argentina;Argentina,6,"Vivas, Juan Carlos;Isla, Facundo;Torrijos, Mar...",57218224071;55343190400;24177904500;6602169131...,60004518;60003933;60004518;60110328;60003933;6...,2022-01-01,2022,RILEM Bookseries,22110844,21100229405,22110852,Book Series,36,,,61-73,Impact resistance represents a key property of...,Fibres | FRC | Impact tests | Numerical modell...,0,0,,,CONICET,PIP112-201501-00861,Consejo Nacional de Investigaciones Científica...
4,2-s2.0-85118319464,10.1617/s11527-021-01804-9,,,A test procedure for evaluating the impact beh...,ar,Article,Vivas J.C.,60020211;60004518,Comision de Investigaciones Cientificas - La P...,La Plata;Buenos Aires,Argentina;Argentina,4,"Vivas, Juan Carlos;Zerbino, Raúl;Torrijos, Mar...",57218224071;6602079376;24177904500;6602169131,60004518;60004518;60004518;60020211,2021-12-01,December 2021,Materials and Structures/Materiaux et Construc...,13595997,17139,,Journal,54,6,208,,Many structures are subjected to impact and di...,Crack control | Cracked state | Fibre reinforc...,2,0,,,CONICET,PIP112-201501-00861,Consejo Nacional de Investigaciones Científica...
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
98,2-s2.0-0027642367,10.1007/BF02472938,,,The fracture energy (G<inf> F</inf>) of high-s...,ar,Article,Giaccio G.,60110328,"Facultad de Ingeniería, Universidad Nacional d...",La Plata,Argentina,3,"Giaccio, G.;Rocco, C.;Zerbino, R.",6602169131;7004508310;6602079376,60110328;60110328;60110328,1993-08-01,August 1993,Materials and Structures,00255432,35616,18716873,Journal,26,7,,381-386,This paper presents results for the fracture e...,,48,0,,,,undefined,
99,2-s2.0-51249167876,10.1007/BF02472451,,,Extensibility of high-strength concretes,ar,Article,Giovambattista A.,60032057,Universidad Nacional de La Plata,La Plata,Argentina,3,"Giovambattista, A.;Violini, D.;Zerbino, R.",6602630641;6504294177;6602079376,60032057;60032057;60032057,1992-11-01,November 1992,Materials and Structures,00255432,35616,18716873,Journal,25,9,,552-557,This paper analyses the extensibility under fl...,,3,0,,,,undefined,
100,2-s2.0-0026856744,,,,High-strength concretes incorporating differen...,ar,Article,Giaccio G.,60032057,Universidad Nacional de La Plata,La Plata,Argentina,5,"Giaccio, G.;Rocco, C.;Violini, D.;Zappitelli, ...",6602169131;7004508310;6504294177;6506480777;66...,60032057;60032057;60032057;60032057;60032057,1992-05-01,May 1992,ACI Materials Journal,0889325X,25159,,Journal,89,3,,242-246,Concretes is an heterogeneous material whose p...,,92,0,,,,undefined,
101,2-s2.0-0022680488,,,,CONCRETE REINFORCED WITH COLLATED STEEL FIBERS...,ar,Article,Giaccio G.,60032057,Universidad Nacional de La Plata,La Plata,Argentina,3,"Giaccio, Graciela;Giovambattista, Alberto;Zerb...",6602169131;6602630641;6602079376,60032057;60032057;60032057,1986-03-01,March 1986,Journal of the American Concrete Institute,00028061,30760,,Journal,83,2,,232-235,The behavior of collated steel fibers when the...,,3,0,,,,undefined,


In [3]:
import requests

In [4]:
my_headers = {
    'Accept': '*/*',
    'Accept-Encoding': 'gzip, deflate, br',
    'User-Agent': 'PostmanRuntime/7.26.8',
    'Connection': 'keep-alive',
    'X-ELS-APIKey' : '0898c8564268aab1b0d35e954fe7bcfa'
    }
query = {'query':'affil(universidad nacional de la plata)', 'apikey': '0898c8564268aab1b0d35e954fe7bcfa'}

response = requests.get(
  # 'https://api.elsevier.com/content/search/scopus',
  'https://api.elsevier.com/content/search/author',
  params=query,
  headers=my_headers
)
response.json()

{'search-results': {'opensearch:totalResults': '12760',
  'opensearch:startIndex': '0',
  'opensearch:itemsPerPage': '25',
  'opensearch:Query': {'@role': 'request',
   '@searchTerms': 'affil(universidad nacional de la plata)',
   '@startPage': '0'},
  'link': [{'@_fa': 'true',
    '@ref': 'self',
    '@href': 'https://api.elsevier.com/content/search/author?start=0&count=25&query=affil%28universidad+nacional+de+la+plata%29&apiKey=0898c8564268aab1b0d35e954fe7bcfa',
    '@type': 'application/json'},
   {'@_fa': 'true',
    '@ref': 'first',
    '@href': 'https://api.elsevier.com/content/search/author?start=0&count=25&query=affil%28universidad+nacional+de+la+plata%29&apiKey=0898c8564268aab1b0d35e954fe7bcfa',
    '@type': 'application/json'},
   {'@_fa': 'true',
    '@ref': 'next',
    '@href': 'https://api.elsevier.com/content/search/author?start=25&count=25&query=affil%28universidad+nacional+de+la+plata%29&apiKey=0898c8564268aab1b0d35e954fe7bcfa',
    '@type': 'application/json'},
   {'@_