# Загрузка данных о количестве видов на островах

Один из наборов данных, идущих с пакетом R - [описание](https://vincentarelbundock.github.io/Rdatasets/doc/Stat2Data/SpeciesArea.html)

Число видов млекопитающих на разных островах в Юго-Восточной Азии.

- Name 	Название острвоа
- Area 	Площадь (км2)
- Species 	Количество видов млекопитающих
- logArea 	логарифм Area
- logSpecies 	логарифм Species


Первоисточник

Heaney, Lawrence R. (1984) Mammalian species richness on islands on the Sunda Shelf, Southeast Asia, Oecologia. 


In [1]:
%pylab notebook
import pandas as pd
import seaborn as sns

Populating the interactive namespace from numpy and matplotlib


Загружаем данные из текстового файла.

In [2]:
D = pd.read_csv('SpeciesArea.csv', index_col=0)
D

Unnamed: 0,Name,Area,Species,logArea,logSpecies
1,Borneo,743244,129,13.5188,4.85981
2,Sumatra,473607,126,13.0681,4.83628
3,Java,125628,78,11.7411,4.35671
4,Bangka,11964,38,9.38966,3.63759
5,Bunguran,1594,24,7.374,3.17805
6,Banggi,450,18,6.10925,2.89037
7,Jemaja,194,15,5.26786,2.70805
8,Karimata Besar,130,19,4.86753,2.94444
9,Tioman,114,23,4.7362,3.13549
10,Siantan,113,16,4.72739,2.77259


Посмотрим распределение значений.

In [3]:
sns.regplot('Area', 'Species', data=D, fit_reg=False);

<IPython.core.display.Javascript object>

Мы видим прямую записимость:
больше площадь - больше видов.
При этом график функции замедляет свой рост при высоких значениях площади. 

Чтобы нагляднее отобразить зависимость используются логарифмическая шкала. В данном наборе данных прологарифмированные значения уже включены в набор.


In [4]:
sns.regplot('logArea', 'logSpecies', data=D);

<IPython.core.display.Javascript object>

Логарифмированные данные в таблице получены логарифмом с основанием $e$. Логарифмирование позволяет получить более равномерное распределение.

Такой же паттерн точек можно получить, если данные не преобразовывать, а только менять шкалу по обеим осям.

In [5]:
axes().set(xscale="log", yscale="log")
sns.regplot('Area', 'Species', data=D, fit_reg=False);

<IPython.core.display.Javascript object>

Чтобы рассчитать линейную модель логарифмов данных, их нужно преобразовать до построения рисунка.

In [6]:
sns.regplot(D.Area.apply(log), D['Species'].apply(log), data=D, fit_reg=True);

<IPython.core.display.Javascript object>

Логарифмирование с другим основанием дает другие значения (см. на оси), но такой же паттерн точек.

In [7]:
sns.regplot(D.Area.apply(log10), D['Species'].apply(log10));

<IPython.core.display.Javascript object>

### +++:

[О кривой "вид-площадь"](https://en.wikipedia.org/wiki/Species%E2%80%93area_curve)