Skip to content

Este repositorio contiene material de referencia y código fuente del curso Accelerando Algoritmos de Deep learning usando GPUs

Notifications You must be signed in to change notification settings

ulises1229/GPUs_Deeplearning_IIMAS

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

33 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Posgrado en Ciencia e Ingeniería de la Computación

Semestre: 2021-II

alt text

Profesores

Dr. Ulises Olivares Pinto

Dr. David Oswaldo Pérez Martínez

Objetivo del curso

Presentar al estudiante el modelo de programación paralela empleando Unidades de Procesamiento Gráfico (GPUs). Se utilizarán los GPUs como dispositivo de propósito general para la resolución de problemas inherentemente paralelos con aplicaciones en el área de aprendizaje profundo.

Prerequisitos

Deseables

  • Dominio de los lenguajes de programación C y C++
  • Conicimiento básico de estructuras de datos y algoritmos

Hardware

Se deberá contar con una computadora con GPU de la marca NVIDIA

Software

Se deberá contar con el siguiente software instalado

Cuentas

Se deberán crear cuentas en las siguientes plataformas:

  • Crear una cuenta en GitHub
  • Google Classroom

Contenido del curso

No. Tema Conceptos Código Material complementario
1. Introducción a la programación con GPUs Introducción a CUDA, modelo de programación paralelo, consulta de dispositivo Capítulo 1 - (D.Kirk et al., 2017)
2. Organización de bloque e Hilos Bloques, hilos, indexación y rendimiento Capítulos 2 y 3 - (D.Kirk et al., 2017)
3. Organización de hilos y jerarquía de memoria Localidad de datos, memoria compartida, local y global Capítulo 6 - (D.Kirk et al., 2017)
4. Multiplicación de matrices Memoria global Capítulos 4 y 5 - (D.Kirk et al., 2017)
5. Multiplicación de matrices Memoria compartida, tiling Capítulo 6 - (D.Kirk et al., 2017)
6. Patrón de acceso paralelo: Convolución Memoria compartida, tiling, memoria constante Capítulo 7 - (D.Kirk et al., 2017)
7. Patrón de acceso paralelo: Suma prefijo Memoria compartida, tiling
Capítulo 8 - (D.Kirk et al., 2017)
8. Patrón de acceso paralelo: Histogramas Operaciones atómicas Capítulo 9 - (D.Kirk et al., 2017)

Última actualización: 06 de abril de 2021

About

Este repositorio contiene material de referencia y código fuente del curso Accelerando Algoritmos de Deep learning usando GPUs

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published