# Автоматизация поисковых запросов на R

Язык для статистического моделирования [R (S-plus)](http://r-project.org) широко распространен при решении научных и прикладных задач анализа данных.

За время своего более 20-ти летнего существования, среда статистичекого моделирования R обзавелась огромной [экосистемой](https://cran.r-project.org/mirrors.html) различных проблемно-ориентированных пакетов, позволяющих автоматизировать процесс решения самых разнообразных научных и приклданых задач, связанных с обработкой данных.

Выполняемый код в приводимом документе содержится в блоках, имеющих вид In[xxx]; его можно выполнить с использованием интерпретатора R, либо интерактивном режиме, либо предварительно сохранив в файл R-скрипта -- текстовой файл с расширением .r.

Данный документ создан при помощи [Jupyter](http://jupyter.org) и [IRkernel](https://irkernel.github.io/).

## Подготовка вычислительной среды

Автоматизация поисковых запросов в среде R предполагает:
* Формирование HTTP-запроса к серверу, согласно [HTTP-API](https://github.com/VBGI/herbs/blob/master/herbs/docs/httpapi/ru/http_api.rst);
* Преобразование полученного JSON-ответа в удобный в среде R вид (например, DataFrame-объект);

Для решения этих двух задач в экосистеме R имеется большое число пакетов. 
Приводимый далее код предполагает, что в вычислительной среде установлен пакет [jsonlite](https://cran.r-project.org/web/packages/jsonlite/index.html)

In [1]:
library(jsonlite)

In [2]:
data<-fromJSON('http://botsad.ru/hitem/json/?collectedby=Пименова')

In [3]:
data$data

species_authorship,updated,collectors,acronym,species_status,gpsbased,species_epithet,identification_finished,identification_started,dethistory,⋯,itemcode,additionals,collection_finished,branch,country,latitude,genus,fieldid,region,details
(C. Presl) Fraser-Jenk. & Jermy,2017-06-29,"Баркалов В.Ю., Крестов П.В., Колдаева М.Н.., Пименова Е.А., Петруненко Е.А.",VBGI,From plantlist,FALSE,expansa,,2014-05-21,"(C. Presl) Fraser-Jenk. & Jermy , 212819 , 2016-09-17 , DRYOPTERIDACEAE , From plantlist , Храпко О.В. , , , expansa , Dryopteris , , Dryopteris expansa (C. Presl) Fraser-Jenk. & Jermy",⋯,113758,,,,Russia,43.49402,Dryopteris,,Приморский края,"Борисовское плато, верх. течение р. Нежинка, водораздел руч. Раздольненский и р. Вторая Речка, склон, смешанный лес."
(C. Presl) Fraser-Jenk. & Jermy,2017-06-29,"Баркалов В.Ю., Крестов П.В., Колдаева М.Н.., Пименова Е.А., Петруненко Е.А.",VBGI,From plantlist,FALSE,expansa,,2014-05-21,"(C. Presl) Fraser-Jenk. & Jermy , 212819 , 2016-09-17 , DRYOPTERIDACEAE , From plantlist , Храпко О.В. , , , expansa , Dryopteris , , Dryopteris expansa (C. Presl) Fraser-Jenk. & Jermy",⋯,113760,,,,Russia,43.49402,Dryopteris,,Приморский края,"Борисовское плато, верх. течение р. Нежинка, водораздел руч. Раздольненский и р. Вторая Речка, склон, смешанный лес."
(C. Presl) Fraser-Jenk. & Jermy,2017-06-29,"Баркалов В.Ю., Крестов П.В., Колдаева М.Н.., Пименова Е.А., Петруненко Е.А.",VBGI,From plantlist,FALSE,expansa,,2014-05-21,"(C. Presl) Fraser-Jenk. & Jermy , 212819 , 2016-09-17 , DRYOPTERIDACEAE , From plantlist , Храпко О.В. , , , expansa , Dryopteris , , Dryopteris expansa (C. Presl) Fraser-Jenk. & Jermy",⋯,113757,,,,Russia,43.49402,Dryopteris,,Приморский края,"Борисовское плато, верх. течение р. Нежинка, водораздел руч. Раздольненский и р. Вторая Речка, склон, смешанный лес."
(C. Presl) Fraser-Jenk. & Jermy,2017-06-29,"Баркалов В.Ю., Крестов П.В., Колдаева М.Н.., Пименова Е.А., Петруненко Е.А.",VBGI,From plantlist,FALSE,expansa,,2014-05-21,"(C. Presl) Fraser-Jenk. & Jermy , 212819 , 2016-09-17 , DRYOPTERIDACEAE , From plantlist , Храпко О.В. , , , expansa , Dryopteris , , Dryopteris expansa (C. Presl) Fraser-Jenk. & Jermy",⋯,113751,,,,Russia,43.49402,Dryopteris,,Приморский края,"Борисовское плато, верх. течение р. Нежинка, водораздел руч. Раздольненский и р. Вторая Речка, склон, смешанный лес."
(C. Presl) Fraser-Jenk. & Jermy,2017-06-29,"Баркалов В.Ю., Крестов П.В., Колдаева М.Н.., Пименова Е.А., Петруненко Е.А.",VBGI,From plantlist,FALSE,expansa,,2014-05-21,"(C. Presl) Fraser-Jenk. & Jermy , 212819 , 2016-09-17 , DRYOPTERIDACEAE , From plantlist , Храпко О.В. , , , expansa , Dryopteris , , Dryopteris expansa (C. Presl) Fraser-Jenk. & Jermy",⋯,113759,,,,Russia,43.49402,Dryopteris,,Приморский края,"Борисовское плато, верх. течение р. Нежинка, водораздел руч. Раздольненский и р. Вторая Речка, склон, смешанный лес."
(C. Presl) Fraser-Jenk. & Jermy,2017-06-28,"Пименова Е.А., Колдаева М.Н., Калинкина В.А., Петруненко Е.А., Шилова А.",VBGI,From plantlist,FALSE,expansa,,2014-06-25,"(C. Presl) Fraser-Jenk. & Jermy , 212819 , 2016-09-17 , DRYOPTERIDACEAE , From plantlist , Храпко О.В. , , , expansa , Dryopteris , , Dryopteris expansa (C. Presl) Fraser-Jenk. & Jermy",⋯,113739,,,,Russia,43.31606,Dryopteris,,Приморский край,"р. Амба, водораздел руч. Пятый и руч. Кривой, смешанный лес."
(C. Presl) Fraser-Jenk. & Jermy,2017-06-28,"Пименова Е.А., Колдаева М.Н., Калинкина В.А., Петруненко Е.А., Шилова А.",VBGI,From plantlist,FALSE,expansa,,2014-06-25,"(C. Presl) Fraser-Jenk. & Jermy , 212819 , 2016-09-17 , DRYOPTERIDACEAE , From plantlist , Храпко О.В. , , , expansa , Dryopteris , , Dryopteris expansa (C. Presl) Fraser-Jenk. & Jermy",⋯,113740,,,,Russia,43.31606,Dryopteris,,Приморский край,"р. Амба, водораздел руч. Пятый и руч. Кривой, смешанный лес."
(Franch. & Sav.) Ching,2017-06-22,"Баркалов В.Ю., Крестов П.В., Колдаева М.Н.., Пименова Е.А., Петруненко Е.А.",VBGI,From plantlist,FALSE,nipponica,,2014-05-21,"(Franch. & Sav.) Ching , 569368 , 2016-09-17 , THELYPTERIDACEAE , From plantlist , Храпко О.В. , , , nipponica , Parathelypteris , , Parathelypteris nipponica (Franch. & Sav.) Ching",⋯,113701,,,,Russia,43.43939,Parathelypteris,,Приморский край,"Борисовское плато, верх. течение р. Нежинка, водораздел руч. Раздольненский и р. Вторая Речка, мочажина с кочками среди леса."
Tzvelev,2017-06-22,"Баркалов В.Ю., Крестов П.В., Колдаева М.Н.., Пименова Е.А., Петруненко Е.А.",VBGI,From plantlist,TRUE,amurensis,,2014-05-21,,⋯,113748,,,,Russia,43.43889,Leptorumohra,,Приморский край,"Борисовское плато, верх. течение р. Нежинка, водораздел руч. Раздольненский и р. Вторая Речка, смешанный лес на вершине."
(Franch. & Sav.) Ching,2017-06-20,"Пименова Е.А., Колдаева М.Н., Калинкина В.А., Петруненко Е.А., Шилова А.",VBGI,From plantlist,TRUE,nipponica,,2014-06-26,"(Franch. & Sav.) Ching , 569368 , 2016-09-17 , THELYPTERIDACEAE , From plantlist , Храпко О.В. , , , nipponica , Parathelypteris , , Parathelypteris nipponica (Franch. & Sav.) Ching",⋯,113601,,,,Russia,43.29804,Parathelypteris,,Приморский край,"р. Амба, водораздел руч. Пятый и Четверный, каменистый склон, подножье скального массива, смеш.-широк. лес."


Более сложные поисковые запросы можно структурировать используя списки:

In [4]:
http_api_base_url <- 'http://botsad.ru/hitem/json/?'
search_parameters <- c('collectedby', 'Пименова', 'identifiedby', 'Крестов')

В данном случае, параметры, наряду с их значениями, определены в виде списка `search_parameters`; далее, используется функция `paste`, чтобы построить из параметров и их значений поисковый URI (`c(TRUE,FALSE)` и `c(False, True)` используется, чтобы получить все четные и нечетные позиции массива `search_parameters` и правильно расставить символы `&` и `=`):

In [5]:
search_url<-paste(http_api_base_url, paste(search_parameters[c(TRUE, FALSE)], search_parameters[c(FALSE, TRUE)], sep='=',collapse='&'), sep='')

In [6]:
new_data<-fromJSON(search_url)

In [7]:
dim(new_data$data)

In [8]:
new_data$data

species_authorship,updated,collectors,acronym,species_status,gpsbased,species_epithet,identification_finished,identification_started,dethistory,⋯,itemcode,additionals,collection_finished,branch,country,latitude,genus,fieldid,region,details
Tzvelev,2017-06-13,"Баркалов В.Ю., Крестов П.В., Колдаева М.Н.., Пименова Е.А., Петруненко Е.А.",VBGI,From plantlist,False,subtripteron,,2014-05-20,"Tzvelev , 216942 , 2016-09-17 , DRYOPTERIDACEAE , From plantlist , Храпко О.В. , , , subtripteron , Polystichum , , Polystichum subtripteron Tzvelev",⋯,113761,,,,,43.44694,Polystichum,,Приморский край,"Борисовское плато, верх. течение р. Нежинка, выше устья руч. Раздольненский, долинный смешанный лес на надпойменной террасе."
Tzvelev,2017-06-13,"Баркалов В.Ю., Крестов П.В., Колдаева М.Н.., Пименова Е.А., Петруненко Е.А.",VBGI,From plantlist,False,subtripteron,,2014-05-20,,⋯,113762,,2014-05-20,,,43.53312,Polystichum,,Приморский край,"Борисовское плато. верх. течение р. Нежинка, р. Раздольненский, долинный смешанный лес на надпойменной террасе."


Вложенные структуры данных, представленные полями `dethistory` и `additionals`, также корректно преобразуются в data.frame посредством функции `fromJSON`:

In [9]:
new_data$data$dethistory

species_authorship,species_id,valid_from,family,species_status,identifiers,family_authorship,valid_to,species_epithet,genus,genus_authorship,species_fullname
Tzvelev,216942,2016-09-17,DRYOPTERIDACEAE,From plantlist,Храпко О.В.,,,subtripteron,Polystichum,,Polystichum subtripteron Tzvelev
