# <font color='blue'>Data Science Academy - Python Fundamentos - Capítulo 9</font>

## Download: http://github.com/dsacademybr

****** Este Jupyter Notebook foi atualizado para a versão 3.6.1 da Linguagem Python em 05/06/2017 ******

# Python e R juntos

### Por que não utilizar Python e R juntos e aproveitar o melhor de ambos? 
### Este Jupyter Notebook será executado em Python e R e para isso você precisa ter o R instalado. Download aqui: https://www.r-project.org
### E também configurar o kernel do R para o Jupyter Notebook. O procedimento de configuração pode ser encontrado aqui: https://irkernel.github.io
### Dúvidas sobre instalação e configuração da linguagem R, consulte nosso treinamento <font color='blue'><a href="http://www.datascienceacademy.com.br/pages/curso-big-data-analytics-r-e-azure">Big Data Analytics com R e Azure</a>.</font>

## Importando Objetos R no Python

In [None]:
### Instalar o pacote rpy2: 
!pip install rpy2

In [None]:
# Importando o o rpy2
import rpy2.robjects as robjects

In [None]:
# Criando um objeto R com Python
obj = robjects.r['pi']

In [None]:
obj

In [None]:
obj[0]

In [None]:
# Criando um função R a partir do Python
robjects.r('''
        rfunc <- function(x, verbose = FALSE) {
            if (verbose) {
                cat("Eu sou uma função em R.\n")
            }
            2 * pi * x
        }
        rfunc(3)
        ''')

In [None]:
# Imprimindo a definição da função
r_func = robjects.globalenv['rfunc']
print(r_func.r_repr())

In [None]:
# Fazendo chamada à função
res = r_func(4)
print(res)

In [None]:
# Fazendo chamada à função
res = r_func(4, 'TRUE')
print(res)

In [None]:
# Importando outros objetos do R
letras = robjects.r['letters']

In [None]:
rcode = 'paste(%s, collapse = "-")' %(letras.r_repr())

In [None]:
resultado = robjects.r(rcode)

In [None]:
print(resultado)

In [None]:
type(resultado)

In [None]:
# Criando um vetor de strings R no Python
vec_str = robjects.StrVector(['Python', 'e', 'R', 'juntos', 'só', 'na', 
                              'Data Science Academy'])

In [None]:
print(vec_str.r_repr())

In [None]:
# Criando um vetor de inteiros R no Python
vec_int = robjects.IntVector([4, 5, 6])

In [None]:
print(vec_int.r_repr())

In [None]:
# Criando um vetor de floats R no Python
vec_flt = robjects.FloatVector([1.1, 2.2, 3.3])

In [None]:
print(vec_flt.r_repr())

In [None]:
# Matrizes R
vec = robjects.FloatVector([1.1, 2.2, 3.3, 4.4, 5.5, 6.6])
mat = robjects.r['matrix'](vec, nrow = 2)

In [None]:
print(mat)

In [None]:
# Chamando funções R
rsum = robjects.r['sum']

In [None]:
rsum(vec_int)[0]

In [None]:
type(rsum)

In [None]:
# Chamando funções R
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt
r_rnorm = robjects.r['rnorm']

In [None]:
r_rnorm(100)

In [None]:
plt.hist(r_rnorm(100))

In [None]:
# Importando pacotes R
from rpy2.robjects.packages import importr

In [None]:
utils = importr("utils")

In [None]:
help_doc = utils.help("help")

In [None]:
help_doc[0]

In [None]:
str(help_doc)

## Extensão R para o iPython - Função Mágica


In [None]:
# Carregando extensões R
%load_ext rpy2.ipython

In [None]:
# Instalação de pacotes R
%R install.packages("plyr")

In [None]:
%R data(mtcars)

In [None]:
%Rpull mtcars

In [None]:
%%R 
summary(mtcars)

In [None]:
mtcars.describe()

In [None]:
%R print(mean(mtcars$mpg))

### Dúvidas sobre instalação e configuração da linguagem R, consulte nosso treinamento <font color='blue'><a href="http://www.datascienceacademy.com.br/pages/curso-big-data-analytics-r-e-azure">Big Data Analytics com R e Azure</a>.</font>

In [None]:
%R vecx = c(1, 4, 5, 7); sd(vecx); mean(vecx)

In [None]:
%R vecy = c(2,4,3,9)

In [None]:
%R lm(formula = vecy ~ vecx)

In [None]:
%R plot(vecx, vecy)

In [None]:
# Código Python
import numpy as np
X = np.array([4.5,6.3,7.9])
X.mean()

In [None]:
# Código R
%Rpush X
%R mean(X)

In [None]:
# Convertendo um dataframe R para um dataframe Python
pd_df = mtcars

In [None]:
pd_df

In [None]:
type(pd_df)

## Plots

In [None]:
import rpy2.robjects as robjects

In [None]:
r = robjects.r

In [None]:
x = robjects.IntVector(range(10))

In [None]:
y = r.rnorm(10)

In [None]:
r.X11()

In [None]:
# Criando uma matriz a partir de um vetor 
r.layout(r.matrix(robjects.IntVector([1,2,3,2]), nrow = 2, ncol = 2))

In [None]:
# Gerando o gráfico
r.plot(r.runif(10), y, xlab = "Eixo x", ylab = "Eixo y", col = "red")

In [None]:
# Outro Exemplo - Principal Componente Analysis
from rpy2.robjects.packages import importr
graphics = importr('graphics')
grdevices = importr('grDevices')
base = importr('base')
stats = importr('stats')

import array

x = array.array('i', range(10))
y = stats.rnorm(10)

grdevices.X11()

graphics.par(mfrow = array.array('i', [2,2]))
graphics.plot(x, y, ylab = "Eixo y", col = "red")

kwargs = {'ylab':"Eixo y", 'type':"b", 'col':"blue", 'log':"x"}
graphics.plot(x, y, **kwargs)


m = base.matrix(stats.rnorm(100), ncol = 5)
pca = stats.princomp(m)
graphics.plot(pca, main = "Valores")
stats.biplot(pca, main = "biplot")

## ggplot

In [None]:
import numpy as np
import pandas as pd
import rpy2.robjects.packages as packages
import rpy2.robjects.lib.ggplot2 as ggplot2
import rpy2.robjects as ro

In [None]:
# Importando o dataset do R, o mtcars
R = ro.r
datasets = packages.importr('datasets')
mtcars = packages.data(datasets).fetch('mtcars')['mtcars']

In [None]:
# Gerando o gráfico com ggplot
gp = ggplot2.ggplot(mtcars)
pyplot = (gp 
      + ggplot2.aes_string(x = 'wt', y = 'mpg')
      + ggplot2.geom_point(ggplot2.aes_string(colour = 'qsec'))
      + ggplot2.scale_colour_gradient(low = "yellow", high = "red") 
      + ggplot2.geom_smooth(method = 'auto') 
      + ggplot2.labs(title = "mtcars", x = 'wt', y = 'mpg'))

pyplot.plot()

## Análise de Variância

In [None]:
import rpy2.robjects as robjects

r = robjects.r

controle = robjects.FloatVector([4.17,5.58,5.18,6.11,4.50,4.61,
                                 5.17,4.53,5.33,5.14])
tratamento = robjects.FloatVector([4.81,4.17,4.41,3.59,5.87,3.83,
                                   6.03,4.89,4.32,4.69])

grupo = r.gl(2, 10, 20, labels = ["Controle","Tratamento"])
peso = controle + tratamento

robjects.globalenv["peso"] = peso
robjects.globalenv["grupo"] = grupo
lm_r = r.lm("peso ~ grupo")

# Imprimindo a análise
print(r.anova(lm_r))


lm_r = r.lm("peso ~ grupo - 1")
print(r.summary(lm_r))

### Dúvidas sobre Análise de Variância na linguagem R, consulte nosso treinamento <font color='blue'><a href="http://www.datascienceacademy.com.br/pages/curso-big-data-analytics-r-e-azure">Big Data Analytics com R e Azure</a>.</font>

In [None]:
print(lm_r.names)

In [None]:
# Imprimindo apenas os coeficientes
print(lm_r.rx2('coefficients'))

# Fim

### Obrigado - Data Science Academy - <a href=http://facebook.com/dsacademy>facebook.com/dsacademybr</a>