# Programación Orientada a Objetos en R


Para cualquier sistema orientado a objetos,  dos conceptos centrales   son los de **clase** y **método**. Una clase define el comportamiento de los **objetos** mediante la descripción de sus **atributos** y su relación con otras clases.

Las clases  utilizan   **métodos**, funciones que se comportan de manera diferente  dependiendo de  la clase que los utiliza y se organizan normalmente en una jerarquía de **subclase** y **superclase**. Si un método no existe para una **subclase**, entonces el método de la **superclase** relacionada ocupa su  lugar; las subclases heredan el comportamiento de las superclases relacionadas.

Hay tres sistemas sobre la programación orientada a objetos en  R  que difieren en cómo se definen las clases y métodos:

1. **S3** implementa un estilo de programación orientado a objetos, que utiliza el concepto de ** función genérica**. Esta forma de implementación   es diferente de la mayoría de los lenguajes de programación, como Java, C ++  o C#, que implementan la programación orientada a objetos mediante  el **paso de mensajes (message-passing)**. Con este estilo, los mensajes (métodos) se envían a los objetos y es el objeto quien determina qué función llamar, en este contexto los objetos  tiene una aparición especial en la llamada al método: por lo general aparece antes del nombre del mensaje o método, como muestra  el siguiente ejemplo:  `canvas.drawRect ("red")`. En S3 esto es  diferente;  si bien las implementaciones todavía se llevan a cabo a través de métodos, un tipo especial de  función llamada **función genérica** decide qué método  llamar: `drawRect (canvas, "blue")`. S3 es un sistema que tiene ninguna definición formal de clases.
2. **S4** funciona de manera similar a S3, pero es más formal. Hay dos diferencias principales a S3: S4 tiene definiciones de clases formales, que describen la representación y la herencia para cada clase, y tiene funciones de ayuda especiales para la definición de los genéricos y métodos.  S4 a difererencia de S3 tiene múltiple **dispatch** que significa que las funciones genéricas pueden elegir los métodos basados en la clase de cualquier número de argumentos, no solamente  de uno.
3. **Clases de referencia**, llamadas **RC** para abreviar, son bastante diferentes de S3 y S4. RC implementa el  **paso de mensajes**, por lo que los métodos  pertenecen a clases y no a funciones. `$` se utiliza para separar objetos y métodos, por lo que las llamadas a métodos en este sistema  son de la forma `canvas$drawRect ("blue")` y  permiten resolver problemas que son difíciles  con S3 o S4.

También hay otro sistema que no es necesariamente de programación orientada a objetos , pero es importante mencionarlo:

 
- **Tipos de base**, son los tipos  internos  que subyacen a los otros sistemas mencionados. Estos tipos base son manipulados usando código C y  son importantes para saber acerca de como se proporcionan los bloques de construcción de otros sistemas orientado a objetos.


En general  la  Programación Orientada a Objetos en R, proporciona las siguientes propiedades:

1. Todo lo que hay  en R,  desde números, a cadenas de caracteres, matrices es un objeto.
2. R promueve la **encapsulación**, que se trata de 'empaquetar' los elementos de los datos  separados pero relacionados en una sola instancia de clase. La encapsulación ayuda a mantener un registro de las variables relacionadas, mejorando la claridad.
3. Las clases en R usan **polimorfismo**, lo que significa que la misma llamada de función lleva a diferentes operaciones para objetos de diferentes clases. Por ejemplo, una llamada a `print ()` en un objeto de cierta clase produce  una llamada a una función `print()` a la medida de esa clase. Polimorfismo promueve la reutilización.
4. R permite la **herencia**,  que permite extender una clase dada a una clase más especializada.



### Lecturas recomendadas:

- [Clases y Objetos en el sistema S3](http://abhishek-tiwari.com/hacking/class-and-objects-in-r-s3-style).
- [Notas de S4](http://www.bioconductor.org/help/course-materials/2010/AdvancedR/S4InBioconductor.pdf)
- [Respuestas a preguntas en S4 de Martin Morgan](http://stackoverflow.com/search?tab=votes&q=user%3a547331%20%5bs4%5d%20is%3aanswe)
- [Programación Orientada a Objetos](http://www.cyclismo.org/tutorial/R/objectOriented.html)
- [Proto Package](https://cran.r-project.org/web/packages/proto/index.html).


## Tipos Bases 

Detrás de cada objeto R hay una estructura de C (o struct) que describe cómo se almacena ese objeto en  memoria. La estructura incluye el contenido del objeto, la información necesaria para la gestión de la memoria, y un tipo. Este es el tipo  base de un objeto R. Los tipos  base no son realmente un sistema de objetos, ya que sólo el equipo principal de  R puede crear nuevos tipos. Como resultado, se añaden nuevos tipos base muy raramente: el cambio más reciente, en 2011, añadió dos tipos exóticos que nunca se ve en R, pero son útiles para diagnosticar problemas de memoria (NEWSXP y FREESXP). Antes de eso, el último tipo añadido era un tipo base especial para objetos S4 (S4SXP) en el año 2005.

Las estructuras de datos exponen  los tipos  bases más comunes (vectores y listas), pero los tipos  base también abarcan funciones, entornos y otros objetos (names y llamadas). Se puede determinar el tipo base de un objeto con `typeof()`. Desafortunadamente los nombres de los tipos  base no se utilizan consistentemente a través de R, y el tipo y la correspondiente  función **"is"** pueden utilizar diferentes nombres 

In [4]:
# El tipo de una funcion es "closure"

f <- function() {}
typeof(f)
is.function(f)

In [5]:
# El tipo de una funcion es 'builtin'

typeof(sum)
is.primitive(sum)

Es recomendable ignorar las funciones  `mode()` y `storage.mode()` porque son sólo los alias de los nombres devueltos por `typeof()`, y existen solamente para la compatibilidad con **S**. Funciones que se comportan de forma diferente para diferentes tipos  base están casi siempre escritas en C, donde el **dispatch** sucede con declaraciones `switch` (por ejemplo, `switch(TYPEOF (x)))`. 

Es importante entender los tipos  base porque todo lo demás se construye encima de ellos: los objetos S3 se pueden construir en la parte superior de cualquier tipo  base, los objetos S4 utilizan un tipo base especial, y objetos d RC son una combinación de S4 y de entornos (otro tipo  base). Para ver si un objeto es un tipo d base puro, es decir, que no tenga un comportamiento  S3, S4 o RC, compruebe que `is.object(x)` devuelva FALSE.

#Método Dispatch

Conceptos Importantes


Un **mensaje**  es un nombre que puede ser enviado desde un objeto a otro, posiblemente con objetos adicionales como argumentos. Por ejemplo, en

```
    python kivy:100
```

El mensaje es `kivy: 100` ( Sintaxis de Smalltalk) (En otros lenguajes se puede escribir ` python-kivy(100)`).  El objeto que recibe el mensaje, en este ejemplo `python`, se llama el receptor.

Un método es una implementacion  que puede ser invocada en respuesta a un mensaje.

Estas ideas se comparten entre una amplia variedad de lenguajes de programacion  orientada a objetos, a veces con nombres diferentes.

Por ejemplo, C ++ llama a un mensaje  una "función miembro virtual".

Ahora:

** Método Dispatch**  es el algoritmo utilizado para decidir qué método debe ser invocado en respuesta a un mensaje. Esto  varía  entre los lenguajes de programacíon.

Lenguajes como Smalltalk, que tienen clases y herencia simple, consulta la clase del receptor. Si el método es definido en la clase se invoca el método. De lo contrario, el algoritmo comprueba la única superclase, y así sucesivamente.

 En C ++ el método es aun  determinado por la clase del receptor, pero debido a que  una clase puede tener varias superclases, el problema de decidir qué método invocar es más complicado.

En los lenguajes orientados a objetos más avanzados, el método **dispatch**  examina no sólo el receptor, sino los argumentos que se pasan junto con el mensaje. Esta idea se refiere a veces como **multimétodo**.


## Método dispatch en R

Una herramienta útil cuando se trata de funciones en R es el dispatching a un método. Una cosa para recordar acerca de las funciones en R es que una función puede dar un resultado diferente, basado en el tipo de valor que se coloca en los  argumentos.

R tiene un sistema  llamado  sistema de función genérica, que te  permite llamar a diferentes funciones con el mismo nombre.

Piense en los data frame y las listas. Si se imprime una lista en la consola, se obtiene la salida  en filas. Por otro lado, un data frame es mostrado  en la consola dispuestos en columnas. Así, la función `print()` trata a las listas y los data frame de  manera diferente, pero las dos estructuras utiliza la misma función.

###Los  métodos detrás de la función

Es fácil saber si se ha utilizado la misma función en ambas ocasiones, sólo hay que  mirar dentro del código de la función `print()` escribiendo su nombre en la línea de comandos, así:

```
>print
function (x, ...) 
UseMethod("print")
<bytecode: 0x2b139f8>
<environment: namespace:base>

```
Puede ignorar las dos últimas líneas, ya que sólo se utilizan por los desarrolladores R. Pero echar un vistazo en el cuerpo de la función  es sólo una línea!

Funciones que no hacen mucho más que la transmisión de los objetos a la función  correcta se llaman `funciones genéricas`. En este ejemplo, `print()` es una función genérica. Las funciones que hacen el trabajo real se denominan `métodos`.




## UseMethod

¿Por qué que una línea de código en la función  `print()` puede  hacer tantas cosas complejas como la muestra de vectores, data frames, listas  todos de una manera diferente?

La respuesta está contenida en la función `UseMethod()`, que es la función central en el sistema de  funciones  genéricas de R.  `UseMethod()` le dice a R  moverse y buscar una función que puede dar con el tipo de objeto que se da como  argumento `x`.

R lo que hace es  mirar a través de una serie completa de funciones en busca de otra función que inicia con la `print ` seguido de un punto y luego el nombre del tipo de objeto.

Puede hacerlo también usando el  comando `apropos('print\\.')`. Entre las comillas,  puedes colocar una expresión regular como en la función `grep()`. De esta manera le decimos a  R que el punto realmente significa un punto, y que ha se a tenido  que preceder con dos barras invertidas. No te sorprenda cuando obtengas  más de 40 funciones `printf()` para todo tipo de objetos.

Suponga que tienes un data frame  que deseas mostrar. R buscará la función  `print.data.frame()` y utilizará esa función para mostrar el objeto que se ha pasado como argumento. También se puede llamar a esa función de esta manera:

In [6]:
s.1 <- data.frame(a = 1:2, b = 2:1)
print.data.frame(s.1)

  a b
1 1 2
2 2 1


## Usando métodos Default 

En el caso de una lista, estas tentado a  buscar una función `print.list()`. Pero no va a funcionar, porque la función `print.list()` no existe. Sin embargo eso no es un problema para R. R ignorará el tipo de objeto en ese caso y sólo tiene que buscar un método predeterminado, `print.default()`.

Para muchas funciones genéricas, hay un método por defecto que se utiliza si no hay un método específico. Si no hay uno, puedes reconocer el método predeterminado por la palabra `default` después del punto en el nombre de la función.
Por lo tanto, si desea imprimir el data frame  como una lista, utilice el método por defecto de esta manera:

In [7]:
print.default(s.1)

$a
[1] 1 2

$b
[1] 2 1

attr(,"class")
[1] "data.frame"


## La clase S3

S3 es  el primer y más simple sistema de programación orientado a objetos en  R. Es el único sistema utilizado en los paquetes estadísticos y los que conforman el sistema base de R, y es el sistema más utilizado en los paquetes [CRAN](https://cran.r-project.org/web/packages/available_packages_by_name.html).

### Reconociendo objetos, funciones genéricas y métodos

La mayoría de los objetos que encuentran en R son objetos S3. Pero, por desgracia no hay forma sencilla de comprobar si un objeto es un objeto S3 en R.  Una forma  fácil de resolver esto es usar `pryr::otype()`:

In [8]:
library(pryr)
df1 <- data.frame(x = 1:15, y = letters[1:15])
otype(df1)   
otype(df1$x)  
otype(df1$y)


Attaching package: ‘pryr’

The following object is masked _by_ ‘.GlobalEnv’:

    f



En S3, los métodos pertenecen a funciones, llamadas **funciones genéricas**, o **genéricos**, para abreviar. Los métodos de S3 no pertenecen a los objetos o clases. Esto es diferente de la mayoría de  lenguajes de programación, pero es un estilo orientado a objetos legítimo.

Para determinar si una función es un genérico S3, puedes inspeccionar su código fuente con una llamada a `UseMethod():` que  es la función que  da cuenta del  método correcto para llamar, al proceso de  **(dispatch)**. Similar a `otype()`, Pryr también proporciona `ftype()` que describe el sistema, si los hay, asociados con una función.

In [9]:
print
ftype(print)


Algunos funciones genéricas  S3, como **[**, **sum()** y **cbind ()**, no llaman **UseMethod()**, debido a que están  implementadas en C. En su lugar,  llaman a la funciones de C:  **DispatchGroup()** o **DispatchOrEval()**. Funciones que hacen el  **(dispatch)** en  C se llaman **funciones genéricas internas** y están documentados en `? "internal generic"`.

`ftype()` sabe acerca de estos casos especiales también.

Dada una clase, el trabajo de una función genérica S3 es llamar al método S3. Se puede reconocer métodos S3 por sus nombres, los cuales se ven como `generic.class()`. Por ejemplo, el método Date para la función genérica `mean()` se  llama `mean.Date()`, y el método  factor para  `print()' se llama 'print.factor()'.

Esta es la razón por la que la mayoría de las guías de estilo moderno desalientan el uso de **.** en los nombres de función: hace que se vean como métodos S3. Del mismo modo, el uso de **.** en nombres de clases también puede ser confuso: es `print.data.frame()` el método `print()` para data.frame, o el método `print.data()` para `frames `?.

`pryr::ftype()` sabe acerca de estas excepciones, así que se puede utilizar para averiguar si una función es un método S3 o una función genérica:

In [10]:
ftype(t.data.frame) # metodo para t()

ftype(t.test)   # funcion generica para los test t     

Se puede ver todos los métodos que pertenecen a una función genérica usando `methods()`

In [11]:
methods("mean")

[1] mean.Date     mean.default  mean.difftime mean.POSIXct  mean.POSIXlt 
see '?methods' for accessing help and source code

In [12]:
methods("t.test")

[1] t.test.default* t.test.formula*
see '?methods' for accessing help and source code

In [13]:
methods("print")

  [1] print.acf*                                   
  [2] print.AES*                                   
  [3] print.anova*                                 
  [4] print.aov*                                   
  [5] print.aovlist*                               
  [6] print.ar*                                    
  [7] print.Arima*                                 
  [8] print.arima0*                                
  [9] print.AsIs                                   
 [10] print.aspell*                                
 [11] print.aspell_inspect_context*                
 [12] print.bibentry*                              
 [13] print.Bibtex*                                
 [14] print.browseVignettes*                       
 [15] print.by                                     
 [16] print.bytes*                                 
 [17] print.changedFiles*                          
 [18] print.check_code_usage_in_package*           
 [19] print.check_compiled_code*                   
 [20] print.

Los asteriscos denotan funciones no visibles, es decir, que no están en el espacios de nombres. Se puede encontrar estas funciones a través `getAnywhere()` y luego  acceder  mediante el uso de un calificativo espacio de nombres.

La función **aspell()** es un corrector ortográfico de un archivo dado como argumento. Supongamos que tenemos el siguiente archivo llamado **file1**

```
Hhi everybody I learnning R.
```

La función **aspell()** retorna un objeto de clase "aspell", que tiene una función genérica `print` llamada `print.aspell()`, que es llamada después de la llamada a **aspell()** y retorna el valor mostrado. En ese momento, R llama a  `UseMethod()` en el objeto de la clase `"aspell"` . Pero si llamamos a este método directamente , R no lo reconocerá:

In [14]:
aspell("file1")
as<-aspell("file1")
print.aspell(as)

Unnamed: 0,Original,File,Line,Column,Suggestions
1,Hhi  file1:1:1,,,,
2,learnning  file1:1:17,,,,
3,everybody  file1:1:5,,,,


ERROR: Error in eval(expr, envir, enclos): no se pudo encontrar la función "print.aspell"


In [15]:
# Pero puede ser encontrado usando la funcion getAnywhere

getAnywhere(print.aspell)

A single object matching ‘print.aspell’ was found
It was found in the following places
  registered S3 method for print from namespace utils
  namespace:utils
with value

function (x, ...) 
{
    if (nrow(x)) 
        writeLines(paste(format(x, ...), collapse = "\n\n"))
    invisible(x)
}
<bytecode: 0x93f5040>
<environment: namespace:utils>

Así de la información anterior la función se encuentra en  el espacio de nombres y puede ser ejecutado agregando un calificativo

In [16]:
utils:::print.aspell(as)

everybody
  file1:1:5

Hhi
  file1:1:1

learnning
  file1:1:17


Se puede ver todos los métodos genéricos de la siguiente manera



In [17]:
methods(class="default")

  [1] add1            aggregate       AIC             all.equal      
  [5] ansari.test     anyDuplicated   aperm           ar.burg        
  [9] ar.yw           as.array        as.character    as.data.frame  
 [13] as.Date         as.dist         as.expression   as.function    
 [17] as.hclust       as.list         as.matrix       as.null        
 [21] as.person       as.personList   as.POSIXct      as.POSIXlt     
 [25] as.single       as.stepfun      as.table        as.ts          
 [29] Axis            barplot         bartlett.test   BIC            
 [33] biplot          boxplot         by              case.names     
 [37] cdplot          chol            coef            confint        
 [41] contour         cophenetic      cor.test        cut            
 [45] cycle           deltat          density         deriv3         
 [49] deriv           deviance        df.residual     diff           
 [53] diffinv         drop1           duplicated      edit           
 [57] end           

In [18]:
methods(class = "ts")

 [1] aggregate     as.data.frame cbind         coerce        cycle        
 [6] diffinv       diff          initialize    kernapply     lines        
[11] Math2         Math          monthplot     na.omit       Ops          
[16] plot          print         show          slotsFromS3   time         
[21] [<-           [             t             window<-      window       
see '?methods' for accessing help and source code

## Definiendo clases y creando objetos

Para hacer un objeto, una instancia de clase, solamente hay que tomar un existente objeto base y establecer 
el atributo de clase. Se puede hacer con ` structure()` o después con `class <-()`

In [19]:
f1 <- structure(list(), class = "f1")

f1 <-list()
class(f1)<- "f1"

Los objetos S3 se construyen generalmente en el top de las listas o vectores  con atributos. También se puede activar funciones en objetos S3. 

Se puede determinar la clase de cualquier objeto utilizando `class(x)` y ver si un objeto hereda de una clase específica utilizando `inherits(x, "classname")`.

In [20]:
class(f1)
inherits(f1, "f1")

La clase de un objeto S3 puede ser un vector, que describe el comportamiento de la información  de lo más  a menos específico. Por ejemplo, la clase del objeto `glm()` es  `c ("glm", "lm")` que indica que los modelos lineales generalizados heredan el comportamiento de los modelos lineales.  

Los nombres de las clases se escriben con letras minúsculas y se puede escribir `my_class` o `Myclas` para nombres de clases con múltiples palabras.


Muchas clases S3, proporcionan un constructor

```
f1 <- function(x) {
  if (!is.numeric(x)) stop("X debe ser numerico")
  structure(list(x), class = "f1")
}
```

Debes usar esto  si está disponible (como para `factor()` y `data.frame ()`). Esto asegura que va a crear la clase con los componentes correctos. Las funciones constructoras suelen tener el mismo nombre que la clase.

S3 no tiene controles de corrección. Esto significa que se puede cambiar la clase de objetos existentes:

In [21]:
# Construyamos un modelo lineal

ml <-lm(log(mpg) ~ log(disp), data = mtcars)
class(ml)
print(ml)
class(ml)<- "data.frame"
print(ml)
ml$coefficients


Call:
lm(formula = log(mpg) ~ log(disp), data = mtcars)

Coefficients:
(Intercept)    log(disp)  
     5.3810      -0.4586  

 [1] coefficients  residuals     effects       rank          fitted.values
 [6] assign        qr            df.residual   xlevels       call         
[11] terms         model        
<0 rows> (or 0-length row.names)


## Creando nuevos métodos y funciones genéricas

Para agregar un nuevo genérico, crea una función que llama `UseMethod()`. `UseMethod()` toma dos argumentos: el nombre de la función genérica, y el argumento que utiliza para el  **dispatch**. Si se omite el segundo argumento se enviará en el primer argumento de la función. No hay necesidad de pasar cualquiera de los argumentos de la función genérica a `UseMethod()`, ` UseMethod()` puede  encontrarlos por sí mismo.

In [22]:
f2 <- function(x) UseMethod("f2")

Una función genérica sin métodos no es muy útil, para agregar un método, solo hay que crear una función con
el nombre correcto `(generic.class)`.

In [23]:
f2.mili <- function(x) "Class mili"

mili <- structure(list(), class = "mili")
class(mili)
f2(mili)

Agregando un método a un existente genérico trabaja de la misma manera

In [24]:
mean.mili <- function(x) "mili"
    mean(mili)

Advertencia: Como se puede ver, no hay verificación que  asegura que el método devuelve la clase compatible con el genérico. Todo depende de que te  asegures de que tu  método no viole las expectativas de código existente.

## Método dispatch en S3

El método de **dispatch** es simple. `UseMethod()` crea un vector de nombres de funciones como `paste0("generic",".", c(class(x), "default"))` y y busca cada uno de ellos. La clase "default" permite configurar un método para una clase desconocida.

In [25]:
f2 <- function(x) UseMethod("f2")
f2.mili <- function(x) "Class mili"
f2.default <- function(x) " class desconocida"

f2(structure(list(), class = "mili"))
    
# No metodos para la clase R, por lo que utiliza el metodo de la clase
    
f2(structure(list(), class = c("R", "mili")))
    
# Ningún método para la clase cesr, por lo que cae de nuevo a default
    
f2(structure(list(), class = "cesar"))

```
?groupGeneric
```

El grupo de métodos genéricos suman un poco más de complejidad. Los grupos genéricos  hacen posible la aplicación de métodos para múltiples genéricos con una función. Los cuatro grupos genéricos y las funciones que se incluyen son:

```
- Math: abs, sign, sqrt, floor, cos, sin, log, exp, …
- Ops: +, -, *, /, ^, %%, %/%, &, |, !, ==, !=, <, <=, >=, >
- Summary: all, any, sum, prod, min, max, range
- complex: Arg, Conj, Im, Mod, Re
```

y son una técnica relativamente avanzada  y lo más importante a tener en cuenta es  `Math`, `Ops`, `Summary` y `complex` no son funciones reales, sino representan grupos de funciones. Una observación importantes, de esto es que dentro de una función de un grupo genérico, existe una variable especial `.Generic` que proporciona la llamada a la función genérica.

 

```
?NextMethod
```

Si se tiene jerarquías de clases complejas a veces es útil  llamar al método "parent". Es un poco difícil de definir exactamente lo que esto significa, pero es básicamente el método que se habría llamado si no existiera el método actual. Ver la documentación `?NextMethod` que se muestra en bloque anterior

Debido a que los métodos son funciones de R, puede llamar directamente:

In [26]:
# No recomendable

c <- structure(list(), class = "c")

# Llamado al metodo correcto:

f2.default(c)

# Fuerza a R a llamar el metodo equivocado:

f2.mili(c)

También puede llamar a un  genérico S3 con un objeto no S3. Los genéricos no internos S3 (dispatch) se  enviarán a la **clase implícita** de tipo base. (Genéricos internos no hacen eso por razones de rendimiento.) Las reglas para determinar la clase implícita de un tipo base es algo complejo, pero se muestran en la función a continuación:

In [27]:
iclass <- function(x) {
  if (is.object(x)) {
    stop("x no es un tipo primitivo", call. = FALSE)
  }

  c(
    if (is.matrix(x)) "matrix",
    if (is.array(x) && !is.matrix(x)) "array",
    if (is.double(x)) "double",
    if (is.integer(x)) "integer",
    mode(x)
  )
}
iclass(matrix(1:5))
iclass(array(1.5))

## Escribamos una clase S3 como ejemplo



In [28]:
j <-list(name = "R", ranking = 5, easy = T)
class(j) <- "lenguaje"
attributes(j)
j

# Ahora escribamos nuestro propio metodo

print.lenguaje <-function(len) {
  cat(len$name, "\n")
  cat("ranking", len$ranking, "\n")
  cat("Facilidad", len$easy, "\n")
}

# Verificamos nuestro código y usamos un ejemplo de herencia, creando
# una clase k

methods(, "lenguaje")
j
# Usemos herencia

k<- list(name ="ggplot2", ranking = 3, easy = T, depende = 4)
class(k)<-c("paquete", "lenguaje" )
k

$name
[1] "R"

$ranking
[1] 5

$easy
[1] TRUE

attr(,"class")
[1] "lenguaje"

[1] print
see '?methods' for accessing help and source code

R 
ranking 5 
Facilidad TRUE 

ggplot2 
ranking 3 
Facilidad TRUE 

# S4

S4 funciona de una manera similar a S3, pero añade formalidad y rigor. Los métodos todavía pertenecen a las funciones, y no a las  clases, pero:

- Las clases tienen definiciones formales que describen sus campos y estructuras de herencia (clases  padres).

- El método dispatch  puede basarse en múltiples argumentos a una función genérica, no sólo a uno.

- Hay un operador especial, @, para la extracción de campos de un objeto S4.

Todo el código relacionado S4 se almacena en el paquete `methods`.  Este paquete está siempre disponible cuando se está ejecutando R de manera interactiva, pero puede que no estén disponibles cuando se ejecuta R en [modo batch](http://blog.revolutionanalytics.com/2009/06/batch-mode-in-r-a-primer.html).

Por esta razón, es una buena idea incluir `library(methods)` siempre que estés usando S4.

## Reconociendo objetos, funciones genéricas y métodos

Reconocer objetos S4, genéricos y métodos es simple. Puedes identificar un objeto S4 debido a que `str()` lo describe como una clase "formal", `isS4()` devuelve TRUE, y `pryr::otype()` devuelve "S4".
Las funciones genéricas y los métodos S4 también son fáciles de identificar porque son objetos S4 con clases bien definidas.

No hay clases S4 en los paquetes básicos de uso común (estadísticas, gráficos, utilidades, base), por lo que para  empezar por la creación de un objeto S4 de la incorporada en el paquete `stats4`, que proporciona algunas clases S4 y métodos asociados con la estimación de máxima verosimilitud:

In [29]:
library(stats4)

y <- c(26, 17, 13, 12, 20, 5, 9, 8, 5, 4, 8)
nLL <- function(lambda) - sum(dpois(y, lambda, log = TRUE))
fit <- mle(nLL, start = list(lambda = 5), nobs = length(y))

# Un objeto S4 
    
isS4(fit)
otype(fit)


# Una funcion generica S4
    
isS4(nobs)
ftype(nobs)

# Recupera  un metodos S4, descrito despues
    
mle_nobs <- method_from_call(nobs(fit))
isS4(mle_nobs)
ftype(mle_nobs)


Importante: Usa `is()` con un argumento para enumerar todas las clases que un objeto hereda. Usa `is()` con dos argumentos para probar si un objeto hereda de una clase específica.

In [30]:
is(fit)
is(fit, "mle")

Toda la lista de funciones  genéricas S4 se pueden hallar con `getGenerics()`, y una lista de todas las clases S4 con `getClasses()`.  Se pueden enumerar todos los métodos S4 con `showMethods()`, opcionalmente restringiendo  la selección ya sea  por `generic` o por `class` (o ambos). También es una buena idea escribir `where=search()` para restringir la búsqueda a métodos disponibles en el entorno global.

## Definiendo clases y creando objetos.

S4 se debe define la representación de una clase con `setClass ()`  y se crea un nuevo objeto con `new()`. Se puede encontrar la documentación para una clase con una sintaxis especial: `clase?className`, por ejemplo, `class?mle`.



```
class?mle

```

Una clase S4 tiene tres propiedades fundamentales:

- Un nombre (name): un identificador  alfanumérico. Por convención, los nombres de las clase S4 utilizan `UpperCamelCase`.
 
- Una lista con nombre **slots**(campos), que definen los  nombres de las campos y clases permitidas. Por ejemplo, una clase de persona puede ser representado por un nombre y una edad numérica: `list(name = "character", edad = "numéric")`.

- Una cadena que la clase hereda o, en términos de S4, **contain**. Puedes proporcionar múltiples clases de herencia múltiple, pero esto es una técnica avanzada que añade mucha complejidad.

En `slots` y `contien` se puede  utilizar las clases S4, las clases S3 están registradas en `setOldClass()`, o la clase implícita de un tipo base. En `slots` también se puede utilizar la clase especial `ANY` que no restringe la entrada.

Las clases S4 tienen otras propiedades opcionales como un método `validity` que pone a prueba si un objeto es válido, y un objeto `prototype` que define los valores de los **slots** por defecto. 



```
?setClass
```

## Ejemplo

El ejemplo siguiente crea una clase `Persona` con campos  `nombre` y `edad`, y una clase de `Empleados` que hereda de `Persona`. La clase `Empleados` hereda las slots y los métodos de  `Persona`, y añade un slot adicional, `jefe`. 
Para crear objetos q llamamos `new()` con el nombre de la clase, y los pares de nombre y valor de los valores del slots.

In [31]:
setClass("Persona",
  slots = list(nombre = "character", edad = "numeric"))
setClass("Empleados",
  slots = list(jefe = "Persona"),
  contains = "Persona")

mili <- new("Persona", nombre = "Mili", edad= 27)
cesar <- new("Empleados", nombre = "Cesar", edad = 31, jefe = mili)

La mayoría de las clases S4 también vienen con un constructor con el mismo nombre que la clase: si este existe, se utiliza en lugar de llamar a `new()`.

Para acceder a los slots de un  objeto S4 usamos `@` o `slot()`:

!!! `@` es equivalente a `$` y `slot()` a `[[`.

In [32]:
mili@edad
slot(cesar, "jefe")

An object of class "Persona"
Slot "nombre":
[1] "Mili"

Slot "edad":
[1] 27


Si un objeto S4 contiene (hereda de) una clase S3 o un tipo base, tendrá un slot especial `.Data` que contiene el tipo base subyacente o el objeto S3:

In [33]:
setClass("RangedNumeric",
  contains = "numeric",
  slots = list(min = "numeric", max = "numeric"))
rn <- new("RangedNumeric", 1:10, min = 1, max = 10)
rn@min
rn@.Data

Puesto que R es un lenguaje de programación interactiva, es posible crear nuevas clases o redefinir las clases existentes en cualquier momento. Esto puede ser un problema cuando se quiera experimentar con S4. Si modifica una clase, asegúrate de que también vuelve a crear objetos de esa clase, de lo contrario va a terminar con objetos no válidos.

## Creando nuevos métodos y funciones genéricas

S4 ofrece funciones especiales para la creación de nuevas funciones genéricas y métodos. `setGeneric()` crea un nuevo genérico o convierte una función existente en un genérico.
`setMethod()` toma el nombre del genérico, la clases que deben estar asociadas al método  y una función que implementa el método. Por ejemplo, podríamos tomar `unión()`, que por lo general sólo funciona en vectores, y hacer que funcione con data frames :

In [34]:
setGeneric("union")
setMethod("union",
  c(x = "data.frame", y = "data.frame"),
  function(x, y) {
    unique(rbind(x, y))
  }
)

Si crea una nueva función genérica a partir de cero, es necesario suministrar una función que llama a `standardGeneric()`, que es la versión S4 de `UseMethod`.

In [35]:
setGeneric("fg", function(x) {
  standardGeneric("fg")
})

## Método dispatch

Si un genéricos S4 envia en una sola clase con una sola superclase, entonces el método de envio S4 es el mismo de S3 . La principal diferencia es la forma de configurar los valores predeterminados: S4 utiliza la clase especial `ANY` para adaptarse a cualquier clase y objetos "missing" para que coincidan con  argumentos faltantes.
Como S3, S4 también tiene grupos genéricos, documentados en `?S4groupGeneric` y una manera de llamar a otros métodos, `callNextMethod()`.

El método dispaych es  mucho más complicado si se envia en varios argumentos, o si sus clases utiliza herencia múltiple. Las reglas se describen en `?Methods` , pero son complicadas y es difícil predecir qué método será llamado. Por esta razón, se recomienda  evitar la herencia múltiple y dispatches múltiples a menos que sea absolutamente necesario.

Por último, hay dos métodos que encuentran el método que se llama dada la especificación de una llamada genérica:

```
# Desde methods: toma nombres de clase y nombre de genericos
selectMethod("nobs", list("mle"))

# Desde pryr: toma una llamada de funcion no evaluada
method_from_call(nobs(fit))
```

# RC

Clases de referencia (o RC para abreviar) son el sistema más nuevo de Programación Orientado a Objetos  en R.  Ellos son fundamentalmente diferentes a S3 y S4 porque:

- Los métodos RC pertenecen a los  objetos, no funciones.

- Los objetos RC son mutables.

Estas propiedades hacen que los objetos de RC se comportan más como objetos de otros lenguajes de programación, como Python, Ruby, Java y C#. Las clases de referencia se implementan utilizando código R y  son una clase S4 especial que hace un wraps alrededor de un entorno.

## Definiendo clases y creando objetos

Puesto que no hay ninguna clase de referencia dado por los paquetes base de R, vamos a empezar por crear uno. Las clases RC son las más utilizadas para describir objetos con estado, objetos que cambian con el tiempo, así que vamos a crear una clase simple para modelar una cuenta bancaria.

La creación de una nueva clase RC es similar a la creación de una nueva clase S4, pero se utilice `setRefClass()` en lugar de `setClass()`. La primera, sólo requiere un argumento uno alfanumérico **name**.
Si bien se puede utilizar `new()` para crear nuevos objetos de RC, es un buen estilo  usar el objeto devuelto por `setRefClass()` para generar nuevos objetos. (También se  puede hacer eso con clases S4, pero es menos común).

```
?setRefClass
```

In [36]:
Cuenta <- setRefClass("Cuenta")
Cuenta$new()

Reference class object of class "Cuenta"

In [37]:
# Adicionalmente setRefClass acepta una lista de clases-nombres definido en la clase fields

Cuenta <- setRefClass("Cuenta",
                      fields= list(balance = "numeric"))

a <- Cuenta$new(balance = 100)
a$balance

a$balance <- 200
a$balance


# Los objetos RC son mutables: ellos tienen referencias semanticas

b <- a
b$balance
a$balance <- 0
b$balance


# Es por eso que los objetos RC vienen con un metodo copy() que te permite hacer una copia
# del objeto

c <- a$copy()
c$balance
a$balance <- 100
c$balance

Un objeto no es muy útil sin algún comportamiento definido por **métodos**. Los métodos RC están asociados con una clase y puede modificar sus campos en su lugar. En el siguiente ejemplo,  se accede al valor de los campos con su nombre, y son modificadod con `<< -`.

In [38]:
Cuenta <- setRefClass("Cuenta",
  fields = list(balance = "numeric"),
  methods = list(
    retiro = function(x) {
      balance <<- balance - x
    },
    deposito = function(x) {
      balance <<- balance + x
    }
  )
)

Se puede llamar a un método RC de la misma manera como tu accedias a un campo

In [39]:
a <- Cuenta$new(balance = 100)
a$deposito(100)
a$balance

El argumento importante  a `setRefClass()` es `contains`.  El siguiente ejemplo crea un nuevo tipo de cuenta bancaria que devuelve un error que impide el balance  de ir por debajo de 0.

In [40]:
NoGiro <- setRefClass("NoGiro",
  contains = "Cuenta",
  methods = list(
    retiro = function(x) {
      if (balance < x) stop("No hay dinero")
      balance <<- balance - x
    }
  )
)
cuentaCesar <- NoGiro$new(balance = 100)
cuentaCesar$deposito(50)
cuentaCesar$balance
cuentaCesar$retiro(200)

ERROR: Error in cuentaCesar$retiro(200): No hay dinero


Todas las clases de referencia heredan de `envRefClass` que proporciona métodos útiles, como `copy()`, `callSuper()`, `field()` (para obtener el valor de un campo dado su nombre), `export()` (equivalente a `as()`) y `show()` ( para controlar la impresión).

## Reconociendo Objetos y métodos

Se puede reconocer objetos RC porque son objetos S4 `(isS4(x))` que heredan de `"refClass" (is(x, "refClass")).pryr::otype()` que  devolverá `"RC"`. Los  métodos RC son también objetos S4, con clase `refMethodDef`.

## Método dispatch

El método dispatch es muy simple en RC porque los métodos están asociados con clases y  no  con funciones. Cuando tu  llames  `x$f()`, R buscará un método f en la clase de x, entonces en su padre, entonces en el padre de su padre, y así sucesivamente. Desde dentro de un método, se puede llamar al método padre directamente con `callSuper(...)`.

## Manejando tus objetos

### Listando tus objetos con `ls()`

El comando `ls()` te permite listar todos los actuales objetos. Un argumento útil es `pattern` que nos permite encontrar nombres de una cadena ingresa como valor en el argumento.

```
help(ls)
ls()
```

In [41]:
ls(pattern ="mili")

### Guardando una colección de objetos con `save()` y recuperarlos con `load()` 

```
help(save)
help(load)
```

In [42]:


rm(list = ls())              # Removemos todo del espacio de trabajo
ls()                         
a <- 1:10                    
save(a, file="miData.Rdata") 
ls()                         

rm(a)                        # Removemos  a  del espacio de trabajo
ls()                         

load("miData.Rdata")         # Cargamos  el archivo "miData.Rdata" 
ls()                         
# [1] "a"
str(a)                       
a2 <- load("miData.Rdata")   
ls()                        
str(a2)   

 int [1:10] 1 2 3 4 5 6 7 8 9 10


 chr "a"


##Ejemplos

In [43]:
ls()

In [44]:
source("stadistic.R")

[1] 0.545 0.325 0.110 0.015 0.005
[1] 0.61
[1] 0.6109548
     k     p           f
[1,] 0 0.545 0.543350869
[2,] 1 0.325 0.331444030
[3,] 2 0.110 0.101090429
[4,] 3 0.015 0.020555054
[5,] 4 0.005 0.003134646


In [45]:
ls()

In [46]:
rm("v")
ls()

In [47]:
remove(list=c("f", "r"))
ls()

In [48]:
rm(list = ls())