Horarios de Laboratorios: 10:00 -12:00 AM Viernes
Laboratorio 2 CTIC-UNI
##Esquema del Curso
- Vectores, Matrices y Arrays.
- Listas, Data Frames, Factores y Tablas.
- Estructuras de Programación en R.
- Programación Orientada a Objetos.
- Gráficos.
- Manipulación de datos con R.
- Base de datos relacionales y no relacionales con R.
- R y otros Lenguajes.
- [Opcional] Programación en Paralelo con R.
##Software
Git es un sistema de control de versiones de gran potencia y versatilidad en el manejo de un gran número de archivos de código fuente a a través del desarrollo no lineal, es decir vía la gestión rápida de ramas y mezclado de diferentes versiones.
Para poder revisar y aprender los comandos necesarios de Git, puedes darle una ojeada al excelente tutorial de CodeSchool o a la guía de Roger Dudle para aprender Git.
Github es una plataforma de desarrollo colaborativo de software utilizado para alojar proyectos (muchos proyectos importantes como paquetes de R, Django, el Kernel de Linux, se encuentran alojados ahí) utilizando Git y el framework Ruby on Rails.
Podemos instalar Git en Ubuntu utilizando el administrador de paquetes Apt
:
c-lara@Lara:~$sudo apt-get update
c-lara@Lara:~$sudo apt-get install git
Anaconda es una distribución completa libre de Python incluye paquetes de Python .
Anaconda incluye los instaladores de Python 2.7 y 3.5. La instalación en Linux, se encuentra en la página de Anaconda y es más o menos así
1 . Descargar el instalador de Anaconda para Linux.
2 . Después de descargar el instalar, en el terminal, ejecuta para 3.5
c-lara@Lara:~$ bash Anaconda3-2.4.1-Linux-x86_64.sh
Es recomendable leer, alguna de las característica de Anaconda en el siguiente material conda 30-minutes test drive.
El proyecto Anaconda ha creado R Essentials, que incluye el IRKernel y alrededor de 80 paquetes para análisis de datos, incluyendo dplyr
, shiny
, ggplot2
,caret
, etc. Para instalar R Essentials en un entorno de trabajo, hacemos
c-lara@Lara:~$ conda install -c r r-essentials
R y RStudio . RStudio es un IDE para R. Es software libre con licencia GPLv3 y se puede ejecutar sobre distintas plataformas o incluso desde la web usando RStudio Server.
c-lara@Lara:~$ wget https://download1.rstudio.org/rstudio-0.99.893-amd64.deb
c-lara@Lara:~$sudo dpkg -i *.deb
c-lara@Lara:~$rm *.deb
MongoDB es una sistema de base de datos NoSQL de código abierto utilizado en aplicaciones web modernas, escrito en C++ le confiere cierta cercanía a los recursos del hardware, de modo que es bastante rápido a la hora de ejecutar sus tareas. MongoDB es una base de datos orientada a documentos, es decir guarda los datos en documentos que son almacenados en un representación binaria de JSON, llamado BSON.
Genbeta:dev tiene una lista de artículos para empezar en el mundo de las bases de datos NoSQL y MongoDB. Es interesantes ver los videos colgados en Youtube sobre MongoDB.
Para poder instalar en Ubuntu, es preferible revisar la documentación desde la página de MongoDB.
###Evaluación Se tomaran, 4 pruebas de Laboratorio, de acuerdo al avance del curso.
###Libros de texto
1 .ggplot2 Essentials, Donato Teutonico, Packt open source, 2015.
2 .R for Data science, Dan Toomey, Packt open source, 2014.
3 .The Art of Programming: A Tour Of Statistical Software Design Norman Matloff, no starch press, 2011.
4 .R by Example Jim Albert, Maria Rizzo, Springer, 2012.
5 .Using R for Numerical Analysis in Science and Engineering, Victor A. Bloomfield, CRC Press, 2014.
6 .Statistical Computing in C++ and R, Randall L. Eubank and Ana Kupresanin, CRC Press, 2011.
7 .R for Programmers: Mastering the Tools, Dan Zhang, CRC Press, 2016.
8 .[Opcional] Introducción a la Computación, J. Glenn Brookshear, Pearson, 2012.
1 .El pequeño Libro de Inferencia Estadística. https://leanpub.com/LittleInferenceBook/read.
2 .Fuentes para aprender R UCLA http://www.ats.ucla.edu/stat/r/.
3 .Curso de Programación en R e Inferencia Estadística, https://www.coursera.org/jhu.
4 .Documentación de R, ordenada por Temas, http://www.rdocumentation.org/.
5 .El mundo de R, en este blog: http://www.r-bloggers.com/.
6 .Libro de Programación de R de Hadley Wickham: http://adv-r.had.co.nz/
7 .Step by Step Guide to Learn Data Science on R: http://www.analyticsvidhya.com/learning-paths-data-science-business-analytics-business-intelligence-big-data/learning-path-r-data-science/.
8 .Intermediate R: https://www.datacamp.com/courses/intermediate-r.
- Introducción a ggplot().
- Una comparación interesante: Estadística y Machine Learning.
- Cómo configurar R en Ubuntu 14.04.
- Paquete pryr().
- Guia de estilo de R de Google.
- Herramientas de depuración en R.
- Notas de Sql, Python, S, etc.
- Magnifico editor de Expresiones Regulares.
- Sql VS Nosql, lo que necesitas saber.
- Vectorización en R.
- dplyr.
- El paquete Knitr.
- Velocidad en R.
- Manual de Expresiones regulares.
- 10 videos sobre BigData.
- Usando Stackoverflow y R.
- Depuración con RStudio.Un video sobre la Depuración en R con Rstudio.
- No necesitas enterder punteros para programar en R
- R-fiddle: un entorno para escribir, correr código R, en el navegador.
- Manual interactivo de SQL.
- Usando dplyr en la manipulación de datos
- Puede reemplazar Python a R, en el desarrollo de modelos predictivos.
- Expresiones regulares con Perl
- Por que deberias aprender R, para ciencia de datos.
- Haciendo ciencia de datos en 5 minutos.
- Usando el GIT.
- Libro que enseña 7 bases de datos open source.
- Machine Learning en R.
- Data Mining, Analytics, BigData y Ciencia de Datos.
- Manual de MapReduce.
- Notas de SQL, desde Postgresql.
- R y C++.
- Introducción al Lenguaje Perl.
- Introducción a Paralelo MCMC para inferencia, usando C,MPI, GSL y SPRNG.
- Unas notas de MongoDb.
- Expresiones regulares: Como son utilizadas en R.
- Un tutorial acerca de make.
- El paquete htmlwidgets
- Escribiendo paquetes de R, desde 0.
- Data wrangling with R and RStudio.
- R y MongoDb.
- R, BigData, NoSql.
- Una guia completa para la exploración de datos .
- Libro acerca de Series de Tiempo.
- Series de tiempo en R.
- RMarkdown con RStudio.
- Tutorial completo acerca de ciencia de datos en R .
- ¿Por qué R es dificil de aprender?.