<h1><center>Curso de RStudio con aplicaciones en regresión lineal y pruebas no paramétricas</center></h1>
<a href="https://www.r-project.org/">
  <img style="float: right;" src="../images/r.png" width="180"/>
</a>
<h2><center>Un breve repaso de la historia del entorno de programación estadístico R</center></h2>

<h3 align="center">¿Qué es R?</h3>

La respuesta es bastante simple. Básicamente, **R** es un dialecto de **S**.

<img style="float: left;" src="../images/slogo.png" width="280">

<h3 align="center">¿Qué es S?</h3>

**S** es un lenguaje que fue desarrollado por [John Chambers](https://statweb.stanford.edu/~jmc4/) en los [Laboratorios Bells](https://www.bell-labs.com/). Su desarrollo fue iniciado en 1976 como un entorno del análisis estadístico para uso interno. Inicialmente se implementó como una serie de librerías en [FORTRAN](http://www.fortran.com/) para implementar rutinas que eran tediosas de realizar una y otra vez. Por esta razón había librerías de FORTRAN para repetir estas rutinas estadísticas. 

<img style="float: right;" src="../images/chambers.png" width="380">

Las primeras versiones del lenguaje no contenían funciones para modelado estadístico. Eso no fue incluído sino hasta aproximadamente la tercera versión del lenguaje. Así, en 1988 el sistema fue reescrito en C para mejorar la portabilidad entre sistemas y fue cuando comenzó a parecerse al sistema que tenemos hoy en día. Eso fue en la tercera versión. Hubo un libro original llamado [_Modelos estadísticos en S_](http://libgen.io/book/index.php?md5=73D876F59ACDA31B2A1367F7F10576EE) escrito por John Chambers y Trevor Hastie, a veces conocido como el [_libro blanco_](https://link.springer.com/chapter/10.1007/978-3-642-50096-1_48), en el que se documenta toda la funcionalidad de análisis estadístico que se incluyó en esa versión del lenguaje. La versión cuatro del lenguaje S se lanzó en 1998. Y esa es más o menos la versión que usamos hoy en día. 

El libro [_Programming with Data_](http://libgen.io/book/index.php?md5=2AF39CBD5151477DF7E192327DFF4352) fue escrito por John Chambers, y en ocasiones es llamado el [_libro verde_](https://www.springer.com/la/book/9780387985039). Ese libro documenta la cuarta versión del lenguaje S. De esta manera, R es una implementación del lenguaje S. 

Un poco más de historia, en 1993 los Laboratorios Bell dieron a una corporación llamada StatSci - la que más adelante se convirtió en Insightful Corporation - una licencia exclusiva para desarrollar y vender el lenguaje S. En el 2004, Insightful compró todos los derechos del lenguaje S a [Lucent - Bell Labs](https://www.technologyreview.com/s/403672/how-lucent-lost-it/) se había convertido en Lucent Technologies - por 2 millones de dólares. En el 2006, Alcatel compró Lucent Technologies, llamándose Alcatel-Lucent hasta que en el año 2015, Nokia adquirió la compañía.

Insightful desarrolló un producto que era una implementación del lenguaje S, bajo el nombre [**S-PLUS**](https://docs.tibco.com/products/tibco-spotfire-s-8-2-0). Y le incorporaron una serie de características avanzadas, como por ejemplo una interfaz gráfica y toda clase de herramientas útiles. De ahí es de donde viene el _PLUS_ de S-PLUS. En el 2008, Insightful Corporation fue adquirida por una compañía llamada TIBCO por 25 millones de dólares. [TIBCO](https://www.tibco.com/) aún desarrolla S-PLUS, aunque en forma de una variedad de productos para análisis enfocados a diferentes tipos de negocio. Y así sigue hasta el día de hoy. Como puedes ver, la historia del lenguaje es un poco tortuosa debido a las múltiples adquisiciones corporativas, pero aún así sobrevive hasta el día de hoy. Los fundamentos básicos del lenguaje S realmente no han cambiado desde 1998, y el lenguaje que hubo en esa época se parece mucho a lo que usamos hoy, al menos superficialmente. Además, vale la pena destacar que en 1998 el lenguaje S ganó el [premio de sistemas de software](https://awards.acm.org/award_winners/chambers_6640862) de la [Association for Computing Machinery (ACM)](https://www.acm.org/), el cual es un honor muy prestigioso.

En un documento llamado [_Las etapas y la evolución de S_](https://statweb.stanford.edu/~jmc4/papers/96.7.ps), John Chambers, el desarrollador y creador original del lenguaje S, explicó sus principales consideraciones acerca del diseño del lenguaje S. Es importante ver que, básicamente, lo que se pretendía era crear un entorno interactivo donde el usuario no pensara en sí mismo en términos de estar programando. Sostenía que, a medida que las necesidades fueron haciéndose más claras y el grado de sofisticación empezara a aumentar, los usuarios serían capaces de involucrarse gradualmente en la programación en el momento en el que los aspectos del lenguaje y el sistema se hiciesen más importantes. Así que la idea básica detrás del lenguaje S y el posterior lenguaje R es que la gente entrase en el lenguaje a través de un entorno interactivo donde se pudiese utilizar el lenguaje sin necesidad de tener conocimientos de programación o conocer aspectos detallados del lenguaje. Así se podría usar el entorno para estudiar los datos y realizar análisis básicos. Y cuando sus necesidades superasen la capacidad del entorno, pudiesen involucrarse en la programación del mismo. Podrían involucrase en aprender los aspectos del lenguaje y en aprender a desarrollar sus propias herramientas, de forma que _el lenguaje promoviera la transición de usuario a programador_. Y esta es básicamente la filosofía del lenguaje S.

Ya he hablado suficiente acerca de S. Ahora volvamos a R. ¿De qué se trata R? Básicamente, R es un desarrollo relativamente reciente. Fue creado en 1991 en Nueva Zelanda por dos caballeros llamados **[Ross Ihaka](https://www.stat.auckland.ac.nz/~ihaka/)** y **[Robert Gentleman](https://www.genealogy.math.ndsu.nodak.edu/id.php?id=26386)**.

<img style="float: left;" src="../images/ihaka.png" width="350">

En un [artículo científico](https://www.stat.auckland.ac.nz/~ihaka/downloads/R-paper.pdf) publicado en 1996 en el [_Journal of Computation and Graphical Statistics_](http://amstat.tandfonline.com/loi/jcgs), estos dos caballeros contaron su experiencia durante el desarrollo de R. En 1993 se hizo público el primer anuncio de R. En 1995, Martin Michler convenció a Ross y a Robert de poner R bajo una [Licencia GNU-GPL](https://www.gnu.org/licenses/gpl-faq.es.html). Ese hecho convirtió R  en lo que llamamos _software libre_. En 1996 se crearon un par de listas de correo, una llamada R-help, que es una lista general para preguntas y otra llamada R-devel, que es una lista de correo más específica para gente que participa en trabajos de desarrollo para R.

En 1997 se formó el grupo llamado _R core group_, que contenía a mucha de la misma gente que desarrolló [S-PLUS](https://docs.tibco.com/products/tibco-spotfire-s-8-2-0). El _core group_ controla el [código fuente](wikipedia) de R. Este código de R solo puede ser modificado por miembros del _R core group_. Sin embargo, algunas personas que no forman parte del _core group_ han sugerido cambios en R que han sido posteriormente aceptados por el _core group_.

Bueno, algunas características de R: La primera, que era importante antes, cuando la gente aún usaba S-PLUS, es que la sintaxis es muy similar a S, lo que facilita la migración de los usuarios de S-PLUS. Esta característica no es muy importante hoy en día, dado que la mayoría de la gente va a R directamente.

La semántica es superficialmente similar a S, en el sentido de que parece que es S, pero en realidad hay bastantes diferencias. Uno de los principales beneficios de R es que funciona en cualquier plataforma o sistema operativo estándar: macOS, Windows, GNU/Linux, etc. Incluso lo puedes correr en un [PlayStation 3](https://unix.stackexchange.com/questions/59186/how-to-run-linux-on-ps3).

<img style="float: right;" src="../images/gentleman.png" width="430">

El núcleo del software de R es en realidad muy ligero. Su funcionalidad se divide en paquetes modulares, de forma que no es necesario descargar e instalar un software de gran tamaño. Es posible descargar tan solo un pequeño núcleo fundamental, con algunas funciones, y luego añadir otras cosas según vayan siendo necesarias. 

Sus capacidades gráficas son muy sofisticadas, y dan al usuario un gran control sobre cómo se crean los gráficos. Y fundamentalmente, para un lenguaje así, hay una comunidad de usuarios muy activa y vibrante. Las listas de correo R-help y R-devel son muy activas, con muchos mensajes al día, y también hay una sección en la web [StackOverflow](https://stackoverflow.com) donde pueden hacerse preguntas. De esta manera, la comunidad de usuarios es uno de los aspectos más interesantes de R. Es de donde provienen todos los paquetes de R, y donde se crean bastantes características interesantes.

Por supuesto, una de las características más importantes de R es que es libre y gratis. Es libre como en _libertad de expresión_ y también es gratis por lo que _no hay que pagar por él_, de manera que se puede descargar el software completo desde la web. Y también es software libre. Voy a desviarme un poco en este momento para poder poder hablar de software libre. Con el software libre hay cuatro principios básicos. Hay cuatro libertades básicas que se tienen:

<a href="https://www.youtube.com/watch?v=Ag1AKIl_2GM">
  <img style="float: right;" src="http://img.youtube.com/vi/Ag1AKIl_2GM/maxresdefault.jpg" width="380" />
</a>

* La libertad de ejecutar el programa como se desea, con cualquier propósito (Libertad 0).
* La libertad de estudiar cómo funciona el programa, y adaptarlo a nuestras necesidades.  (Libertad 1).
* La libertad de de distribuir copias, para ayudar al prójimo, de forma que se pueden dar copias a otra gente. (Libertad 2).
* La libertad de mejorar el programa y lanzar tus mejoras al público, para que toda la comunidad se beneficie de ellas. (Libertad 3). 

Un programa es **software libre** si otorga a los usuarios todas estas libertades de manera adecuada. De lo contrario no es libre. Si deseas conocer más, puedes ver el vídeo de la derecha.

<h3><center>¿Por qué RStudio?</center></h3>

La gente de todo el mundo recurre a R, un lenguaje estadístico de código abierto, para dar sentido a los datos. Inspirado por las innovaciones de los usuarios de R en ciencias, educación e industria, RStudio desarrolla herramientas gratuitas y abiertas para R y productos profesionales listos para la empresa para que los equipos escalen y compartan el trabajo. Nuestro objetivo es capacitar a los usuarios para que sean productivos con R. ¡Permítenos saber en qué te podemos ayudar!

<h3><center>Nuestra inspiración</center></h3>

Los [creadores de R](https://www.r-project.org/contributors.html) proporcionaron una base flexible y poderosa para la informática estadística; luego lo hizo libre y abierto para que pueda ser mejorado en colaboración y sus beneficios puedan ser compartidos por la audiencia más amplia posible. Es mejor para todos si las herramientas utilizadas para la investigación y la ciencia son gratuitas y abiertas. El software libre en la ciencia tiene muchos beneficios: reproducibilidad mejorada, mayor intercambio de conocimientos y técnicas, y eliminación de barreras de costos para crear un campo de juego más nivelado, por nombrar solo algunos. Los usuarios R están haciendo algunos de los trabajos más innovadores e importantes en ciencia, educación e industria. Es una inspiración y un desafío diario mantenerse al día con la comunidad y todo lo que está logrando.


<h3><center>Misión de RStudio</center></h3>

Es construir un negocio sostenible de código abierto que cree software para ciencia de datos y computación estadística. Es posible que ya haya oído hablar de algunos de nuestros trabajos, como el [Entorno de Desarrollo Integrado RStudio](https://www.rstudio.com/products/rstudio/), [Rmarkdown](http://rmarkdown.rstudio.com/), [shiny](http://shiny.rstudio.com/) y muchos paquetes en el [tidyverse](http://www.tidyverse.org/).

Nuestros proyectos de código abierto cuentan con el respaldo de nuestros productos comerciales que [ayudan a los equipos de usuarios R](https://www.rstudio.com/products/rstudio-server-pro/) a trabajar juntos de manera efectiva, compartir recursos informáticos y [publicar sus resultados](https://www.rstudio.com/products/connect/) a los responsables de la toma de decisiones dentro de la organización. También creamos [productos alojados](https://www.shinyapps.io/) para eliminar el dolor de administrar R y RStudio usted mismo y permitir que cualquiera use R y RStudio incluso sin recursos informáticos serios.

<h3><center>Trabajando en RStudio</center></h3>

RStudio ofrece una oportunidad única para unirse a un equipo de alto calibre en un negocio exitoso que está impactando activamente la práctica de la ciencia de datos. Estamos buscando personas inteligentes, reflexivas y trabajadoras que también sean amables y empáticas. Somos una organización que valora el talento, la humildad y el trabajo duro sobre la jerarquía. Entendemos cómo puede ser agotador el trabajo creativo, y también nos aseguramos de que pasas el tiempo fuera del trabajo recargándote con tu familia y amigos.

Principalmente somos una compañía remota con pequeñas oficinas en Redmond y Boston. Los empleados de RStudio viven en todo Estados Unidos, y algunos de nosotros en Canadá, Bélgica, Portugal y el Reino Unido. Valoramos el tiempo ininterrumpido que nos permite hacer un trabajo profundo, mientras colaboramos cuando sea necesario a través de videoconferencia y Slack. Toda la compañía se reúne en persona dos veces al año, lo que brinda una oportunidad valiosa para la colaboración en persona, la planificación a largo plazo y la diversión.

Las personas que prosperan en RStudio son generalmente relativamente técnicas para su línea de trabajo. El uso de R está creciendo fuera de sus dominios científicos tradicionales, y queremos que se emocione al saber cómo R puede ayudarlo en su trabajo.

RStudio es un empleador que ofrece igualdad de oportunidades. Valoramos diversos puntos de vista, y alentamos a las personas con diversos antecedentes y experiencias para aplicar. RStudio se preocupa por usted y su familia, y ofrece un excelente seguro médico / dental / de visión, seguro de discapacidad a largo plazo y adecuación 401 (k).

<h3><center>Beneficios y ventajas</center></h3>

- 100% remoto (o ingrese a una oficina en Boston o Redmond).
- Cobertura médica, dental y de visión totalmente pagada para los empleados y sus familias.
- Tiempo libre flexible.
- Programa de participación en los beneficios.
- Una reunión en persona dos veces al año de toda la compañía.
- Programa de jubilación 401 (k) con un programa de contribuciones a juego.

<h1><center>Clases programadas</center></h1>

|Fecha de clase|Paquetes empleados|Temas principales|
|:---:|:------:|:--:|
|[03/02/2018]()|[MASS](https://cran.r-project.org/web/packages/MASS/index.html)|Instalación, objetos I|
|[10/02/2018]()|[XLConnect](https://cran.r-project.org/web/packages/XLConnect/index.html)|Objetos II, hojas de cálculo|
|[17/02/2018]()|[roxygen2](https://cran.r-project.org/web/packages/roxygen2/)|Base de datos, funciones, sentencias if, else, repeat, for, while|
|[03/03/2018]()|[]()||
|[10/03/2018]()|[]()||
|[24/03/2018]()|[]()||

## Referencias

- [Traducción de la página web de RStudio](https://www.rstudio.com/about/)
- [Coursera R- programming](https://www.coursera.org/learn/r-programming/lecture/QiIJx/writing-code-setting-your-working-directory-mac)
- [Software for data analysis: Programming with R -- John Chambers](http://libgen.io/book/index.php?md5=FD985C69272EF1D23A9AB3F19C918252)
- [History of S and R -- John M. Chambers's slides](https://www.r-project.org/conferences/useR-2006/Slides/Chambers.pdf)
- [Extending R -- John M. Chambers](http://libgen.io/book/index.php?md5=8A1AC520454F7D3D0535A0FF723F09B1)
- [El sistema operativo GNU](https://www.gnu.org/gnu/gnu.html)
- [CRAN now has 10,000 R packages. Here's how to find the ones you need.](http://blog.revolutionanalytics.com/2017/01/cran-10000.html)
- [Is S-PLUS dead? [on hold] StackOverFlow](https://stackoverflow.com/questions/29057411/is-s-plus-dead)
- [R-statistics blog](https://www.r-statistics.com/)
- [R Interview](https://ropensci.org/blog/2017/06/23/community/)