# 設定

In [1]:
import numpy as np
import pandas as pd
import pyper
import time
from IPython.display import display
from contextlib import contextmanager

In [2]:
# 時間計測関数
@contextmanager
def timer(name):
    t0 = time.time()
    yield
    print(f'[{name}] done in {time.time() - t0:.0f} s')

In [17]:
with timer('test'):
    time.sleep(5)

[test] done in 5 s


# pyperの使い方

In [11]:
r = pyper.R()
r("a <- 5")
print(r("a"))
# 結果
# try({a})
# [1] 5

r("b <- 10")
print(r("a + b"))
# 結果
# try({a + b})
# [1] 15

try({a})
[1] 5

try({a + b})
[1] 15

15


# packageの活用

In [10]:
r = pyper.R()
print(r("glimpse(iris)"))
# could not find function "glimpse"

try({glimpse(iris)})
Error in glimpse(iris) : 
   関数 "glimpse" を見つけることができませんでした 



In [9]:
r = pyper.R()
r("library(tidyverse)")
print(r("glimpse(iris)"))
# try({glimpse(iris)})

print(r("iris %>% glimpse"))
# try({iris %>% glimpse})

try({glimpse(iris)})
Observations: 150
Variables: 5
$ Sepal.Length <dbl> 5.1, 4.9, 4.7, 4.6, 5.0, 5.4, 4.6, 5.0, 4.4, 4.9, 5.4, …
$ Sepal.Width  <dbl> 3.5, 3.0, 3.2, 3.1, 3.6, 3.9, 3.4, 3.4, 2.9, 3.1, 3.7, …
$ Petal.Length <dbl> 1.4, 1.4, 1.3, 1.5, 1.4, 1.7, 1.4, 1.5, 1.4, 1.5, 1.5, …
$ Petal.Width  <dbl> 0.2, 0.2, 0.2, 0.2, 0.2, 0.4, 0.3, 0.2, 0.2, 0.1, 0.2, …
$ Species      <fct> setosa, setosa, setosa, setosa, setosa, setosa, setosa,…

try({iris %>% glimpse})
Observations: 150
Variables: 5
$ Sepal.Length <dbl> 5.1, 4.9, 4.7, 4.6, 5.0, 5.4, 4.6, 5.0, 4.4, 4.9, 5.4, …
$ Sepal.Width  <dbl> 3.5, 3.0, 3.2, 3.1, 3.6, 3.9, 3.4, 3.4, 2.9, 3.1, 3.7, …
$ Petal.Length <dbl> 1.4, 1.4, 1.3, 1.5, 1.4, 1.7, 1.4, 1.5, 1.4, 1.5, 1.5, …
$ Petal.Width  <dbl> 0.2, 0.2, 0.2, 0.2, 0.2, 0.4, 0.3, 0.2, 0.2, 0.1, 0.2, …
$ Species      <fct> setosa, setosa, setosa, setosa, setosa, setosa, setosa,…



# pandas, numpy の連携

In [14]:
# random generate
n = 300
x = np.random.normal(0, 10, n)
y = np.random.normal(0, 10, n)

# DataFrame
df = pd.DataFrame({"X":x, "Y":y})

r = pyper.R(use_pandas='True', use_numpy="True")
r.assign("p_df", df)
print(r("summary(p_df)"))

try({summary(p_df)})
       X                  Y            
 Min.   :-29.6753   Min.   :-29.80802  
 1st Qu.: -7.0988   1st Qu.: -7.53904  
 Median : -0.7220   Median :  0.47032  
 Mean   : -0.4317   Mean   :  0.01988  
 3rd Qu.:  7.6480   3rd Qu.:  7.19818  
 Max.   : 22.4956   Max.   : 29.35565  



# 実践

In [3]:
r = pyper.R(use_pandas='True')
r("source('~/Desktop/TokyoR/script/function.R', echo=FALSE)")
print(r("view_data(iris)"))

try({view_data(iris)})
Observations: 150
Variables: 5
$ Sepal.Length <dbl> 5.1, 4.9, 4.7, 4.6, 5.0, 5.4, 4.6, 5.0, 4.4, 4.9, 5.4, …
$ Sepal.Width  <dbl> 3.5, 3.0, 3.2, 3.1, 3.6, 3.9, 3.4, 3.4, 2.9, 3.1, 3.7, …
$ Petal.Length <dbl> 1.4, 1.4, 1.3, 1.5, 1.4, 1.7, 1.4, 1.5, 1.4, 1.5, 1.5, …
$ Petal.Width  <dbl> 0.2, 0.2, 0.2, 0.2, 0.2, 0.4, 0.3, 0.2, 0.2, 0.1, 0.2, …
$ Species      <fct> setosa, setosa, setosa, setosa, setosa, setosa, setosa,…



In [4]:
from sklearn.datasets import load_iris
iris = load_iris()
iris = pd.DataFrame(data=iris.data, columns=iris.feature_names)

r.assign("p_iris", iris)
print(r("view_data(p_iris)"))

try({view_data(p_iris)})
Observations: 150
Variables: 4
$ sepal.length..cm. <dbl> 5.1, 4.9, 4.7, 4.6, 5.0, 5.4, 4.6, 5.0, 4.4, 4.9, …
$ sepal.width..cm.  <dbl> 3.5, 3.0, 3.2, 3.1, 3.6, 3.9, 3.4, 3.4, 2.9, 3.1, …
$ petal.length..cm. <dbl> 1.4, 1.4, 1.3, 1.5, 1.4, 1.7, 1.4, 1.5, 1.4, 1.5, …
$ petal.width..cm.  <dbl> 0.2, 0.2, 0.2, 0.2, 0.2, 0.4, 0.3, 0.2, 0.2, 0.1, …

