Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Actualizacion tets Curso de Manipulación y Transformación de Datos con Pandas y NumPy #103

Open
wants to merge 7 commits into
base: master
Choose a base branch
from
5 changes: 4 additions & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -17,7 +17,7 @@ LISTA DE CURSOS
- [Curso de Computación Básica](computacion_basica.md)
- [Curso Logica de Programación](curso_logica_de_programacion.md)
- [Curso de Introducción a la Web: Historia y Funcionamiento de Internet](curso_de_introduccion_a_la_web.md)
- [Curso de Programación Orientada a Objetos: POO](poo.md)
- [Curso de Programación Orientada a Objetos: POO](curso_de_programacion_orientada_a_objetos_poo.md)
- [Curso Profesional de Git y GitHub](git.md)
- [Fundamentos de Ingeniería de Software](fundamentos.md)
- [Curso Básico de Algoritmos y Pensamiento Lógico](curso_basico_de_algoritmos_y_pensamiento_logico.md)
Expand Down Expand Up @@ -81,12 +81,14 @@ LISTA DE CURSOS
- [Curso de Entorno de Trabajo para Ciencia de Datos con Jupyter Notebooks y Anaconda](entorno_de_trabajo_para_ciencia_de_datos_con_jupyter_notebooks_y_anaconda.md)
- [Curso de Configuración Profesional de Entorno de Trabajo para Ciencia de Datos](curso_de_configuración_profesional_de_entorno_de_trabajo_para_ciencia_de_datos.md)
- [Curso Básico de Python](curso_basico_de_python.md)
- [Curso de Python: PIP y Entornos Virtuales](curso_de_python-pip_y_entornos_virtuales.md)
- [Curso de Excel Básico](curso_de_excel_basico.md)
- [Curso de Introducción a Excel](int_excel.md)
- [Curso de Excel Intermedio: Análisis de Información y Creación de Dashboards](excel_intermedio_inf_analisis_dashboards.md)
- [Curso de Ética y Manejo de Datos para Data Science e Inteligencia Artificial](etica_manejo_datos_data_science_ia.md)
- [Curso Básico de Visualización de Datos con Matplotlib y Seaborn](basic_dataviz_matplotlib_seaborn.md)
- [Curso Básico de Manipulación y Transformación de Datos con Pandas y NumPy](basic_data_transform_pandas&numpy.md)
- [Curso de Funciones Matemáticas para Data Science e Inteligencia Artificial](funciones_matematicas_para_ds_ia.md)

**Criptomonedas**

Expand Down Expand Up @@ -114,6 +116,7 @@ LISTA DE CURSOS
- [Curso Práctico de Análisis Técnico de Mercados Financieros](analisis_mercados.md)
- [Curso para Empezar a Vender por Internet](curso_para_empezar_a_vender_por_internet.md)
- [Curso de Business Intelligence: Utilidad y Áreas de Oportunidad](business_intelligence_utilidad_oportunidad.md)
- [Curso de Principios de Visualización de Datos para Business Intelligence](curso_de_principios_de_visualizacion_de_datos_para_business_intelligence.md)
- [Curso Profesional de Scrum](curso_profesional_de_scrum.md)

- ### CONTENIDO DIGITAL
Expand Down
109 changes: 47 additions & 62 deletions basic_data_transform_pandas&numpy.md
Original file line number Diff line number Diff line change
@@ -1,98 +1,83 @@
# Curso Básico de Manipulación y Transformación de Datos con Pandas y NumPy

1. ¿Cuál es el método para definir un array en Numpy?
### 1. ¿Podemos considerar el array como el objeto principal de NumPy?
Verdadero

```python
np.array([1,2,3])
```

2. ¿Cuál es el resultado de esta operación en NumPy es np.array(['hola','2','4','5'],dtype='float64')

Error en la conversión de los datos.

3. ¿Con qué propiedad de NumPy puede saber la cantidad de dimensiones en un arreglo?

ndim

4. ¿np.arange(0,10) con cuántos elementos creará un array?
### 2. ¿Cuál es el resultado de esta operación en NumPy es np.array(['hola','2','4','5'],dtype='float64')
Error en la conversión de los datos.

10
### 3. ¿Para qué sirve el comando expand_dims de Numpy?
Sumar una dimensión al array.

5. ¿Cuál es el comando de NumPy para crear un array de n elementos con valores de cero (0)?
### 4. ¿np.arange(0,10) con cuántos elementos creará un array?
10

```python
### 5. ¿Cuál es el comando de NumPy para crear un array de n elementos con valores de cero (0)?
```python:
np.zeros()
```

6. ¿Qué genera np.linspace(0,10,100)?
### 6. ¿Qué genera np.linspace(0,10,100)?
100 elementos de cero a 10.

100 elementos de cero a 10.

7. ¿Qué forma (shape) tiene el siguente array de NumPy?
[[7 8]
### 7. ¿Qué forma (shape) tiene el siguente array de NumPy?
[[7 8]
[2 1]
[2 4]]

(3,2)

9. ¿Qué retorna la propiedad std() en un array de NumPy?

La desviación estándar
(3,2)

10. ¿Cuál es el resultado del comando np.sort(arr) siendo arr = np.array([13, 6, 3, 5, 10])?
### 8. ¿Cuál es el resultado del comando np.max(arr) siendo arr = np.array([13, 6, 3, 5, 10])?
13

```python
array([3, 5, 6, 10, 13])
```

11. El comando copia_arr = arr.copy() crea una copia en memoria independiente de arr en un objeto llamado copia_arr. Esto es:
### 9. ¿Cuál es el resultado del comando np.argmax(arr) siendo arr = np.array([13, 6, 3, 5, 10])?
0

Verdadero
### 10. ¿Qué retorna la propiedad std() en un array de NumPy?
La desviación estándar

12. ¿Con cuál opción de NumPy se puede filtrar un array de tipo arr = np.array([13, 6, 3, 5, 10]) para solo retornar números superariores a 7?
### 11. El comando copia_arr = arr.copy() crea una copia en memoria independiente de arr en un objeto llamado copia_arr. Esto es:
Verdadero

```python
### 12. ¿Con cuál opción de NumPy se puede filtrar un array de tipo arr = np.array([13, 6, 3, 5, 10]) para solo retornar números superariores a 7?
```python:
arr[arr>7]
```

13. ¿Cuál es la estructura base para leer un archivo csv llamado file.csv con Pandas?

```python
### 13. ¿Cuál es la estructura base para leer un archivo csv llamado file.csv con Pandas?
```python:
pd.read_csv(‘file.csv’)
```

14. ¿En qué se basa el filtrado por iloc a diferencia de loc?
### 14. ¿Qué se obtiene de comando tipo df_books.loc[0:10, ['Name', 'Author']]?
Retorna las 11 primeras filas del dataset, pero solo de las columnas Name y Author.

Index
### 15. ¿Qué permite el comando de Pandas df.fillna('missing')?
Reemplazar los valores nulos con la palabra missing.

15. ¿Qué se obtiene de comando tipo df_books.loc[0:10, ['Name', 'Author']]?

Retorna las 11 primeras filas del dataset, pero solo de las columnas Name y Author.

16. ¿Qué indica que el comando df.isnull() en Pandas si retorna True en una posición?

Que ese valor es nulo.

17. ¿Qué permite el comando de Pandas df.fillna('missing')?

Reemplazar los valores nulos con la palabra missing.

18. ¿Qué comando de Pandas retorna las n filas del final de un DataFrame?
### 16. ¿Cuál es el comando de Pandas que retorna count, mean,std, min, max y otras variables para todas las columnas numéricas en un DataFrame?
```python:
describe
```

```python
### 17. ¿Qué comando de Pandas retorna las n filas del final de un DataFrame?
```python:
tail
```

19. Es el comando de Pandas que elimina los duplicados de un DataFrame:

```python
### 18. Es el comando de Pandas que elimina los duplicados de un DataFrame:
```python:
drop_duplicates
```

20. En Pandas es posible aplicar más de una función de grupo por sentencia groupby a una columna en especifico. Esto es:

Verdadero
### 19. En Pandas es posible aplicar más de una función de grupo por sentencia groupby a una columna en especifico. Esto es:
Verdadero

21. ¿En una sentencia de Apply de Pandas a un dataset es necesario enviarle una función definida previamente?
### 20. ¿Qué debería ir en el parámetro how de la sentencia merge en Pandas para que muestre solo los match en ambos DataFrames?
```python:
inner
```

### 21. ¿En una sentencia de Apply de Pandas a un dataset es necesario enviarle una función definida previamente?
Falso

Original file line number Diff line number Diff line change
@@ -0,0 +1,79 @@
# Curso de Principios de Visualización de Datos para Business Intelligence

## 1. ¿Qué gráfica debo utilizar para representar una correlación entre variables?
Gráfica de dispersión

## 2. ¿Qué es la carga cognitiva?
El esfuerzo que debemos realizar para entender y retener la información.

## 3. Es la herramienta de visualización de datos que cuenta con una comunidad enorme y organiza eventos como el Iron Viz:
Tableau

## 4. No es una buena práctica de los Data Viz:
Cherry Picking.

## 5. En una gráfica de barras, la frecuencia de los datos se representa por:
La altura.

## 6. En una gráfica de pastel, la frecuencia de los datos se representa por:
El área que ocupa en una circunferencia.

## 7. En una gráfica de dispersión, la frecuencia de los datos se representa por:
Puntos ubicados en un plano cartesiano.

## 8. ¿Qué no debemos hacer en una gráfica de burbujas?
Utilizar elementos 3D.

## 9. Al usar gráficas de tablas se recomienda:
Acompañarlas con otro data viz para brindar mayor claridad a los datos.

## 10. El departamento de Business Intelligence generalmente presenta reportes a:
Personal de dirección y gerencia.

## 11. Ventajas del Business Intelligence
Todas las respuestas son correctas.

## 12. ¿Cómo agregamos valor a nuestro trabajo utilizando el Business Intelligence?
Analizando información y tomando decisiones.

## 13. ¿Qué es Business Intelligence?
Se refiere a los datos transformados en información de negocio relevante para la toma decisiones.

## 14. ¿Cuál es el primer paso del flujo de trabajo del Business Intelligence?
Recolección de datos.

## 15. ¿Porqué es importante contar historias?
Los datos sin historias son solo números y texto.

## 16. ¿Para qué nos sirven los reportes?
Para concentrar nuestros resultados.

## 17. ¿Qué es un KPI?
Key Performance Indicator

## 18. ¿Para qué nos sirve un KPI?
Todas las respuestas son correctas.

## 19. Se pueden implementar el uso de KPI en los reportes
Verdadero

## 20. La manera en que podemos encontrar la información para su recolección:
Estructurada / No estructurada

## 21. Las distintas bases de datos por el tipo de información que contienen pueden ser:
Públicas / Privadas

## 22. ¿La visualización de datos es un tema exclusivamente digital?
Falso

## 23. Herramienta de visualización de datos utilizada en ámbito corporativo y generalmente considerada como siguiente paso de transición después del uso de Excel:
Power BI

## 24. Herramienta de visualización de datos conocida por la facilidad de creación de Storytelling:
Tableau

## 25. Herramientas de visualización de datos generalmente utilizada en los ámbitos de mercadotecnia:
Google Analytics / Google Data Studio

## 26. ¿Cómo utiliza Target el Big Data?
Segmentación de clientes.
3 changes: 3 additions & 0 deletions poo.md → ...e_programacion_orientada_a_objetos_poo.md
Original file line number Diff line number Diff line change
Expand Up @@ -89,6 +89,9 @@

Verdadero

## En un sistema de ventas de autos ¿cuál de estas opciones describe mejor los objetos involucrados?
Auto, Vendedor, Cliente

------

Este proyecto sigue la especificación de [todos los contribuyentes](https://github.com/all-contributors/all-contributors) . ¡Contribuciones de cualquier tipo son bienvenidas!
37 changes: 37 additions & 0 deletions curso_de_python-pip_y_entornos_virtuales.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,37 @@
# Curso de Python: PIP y Entornos Virtuales

## 1. ¿Qué es un entorno virtual?
La herramienta de Python para aislar o encapsular proyectos con sus propios paqutes y versiones sin afectar a otros proyectos y entornos virtuales.

## 2. ¿Qué herramienta nos permite trabajar con entornos virtuales en Python 3?
venv

## 3. ¿Qué herramienta nos permite instalar paquetes de Python como dependencias en nuestros proyectos?
pip

## 4. ¿Con qué comando activamos entornos virtuales en Python 3?
source [ruta del entorno virtual]/bin/activate

## 5. ¿Qué herramienta nos permite aislar y encapsular nuestros proyectos y los paquetes de terceros que este utilice, aunque la versión de Python y el sistema operativo sigan siendo los mismos para todos los proyectos?
venv

## 6. ¿Qué herramienta nos permite aislar y encapsular TODO: archivos del proyecto, paquetes y sus versions, Python e incluso el sistema operativo?
Docker

## 7. ¿Con qué comando guardamos el nombre y versión de todos los paquetes de terceros en nuestro proyecto dentro de un archivo de texto?
pip3 freeze > requirements.txt

## 8. ¿Con qué comando instalamos el paquete requests en su versión 2.27.1?
pip install requests==2.27.1

## 9. ¿Con qué comando instalamos el paquete FastAPI en su última versión estable (sin importar la fecha en que se ejecute ni las viejas o nuevas versiones que se desarrollen de FastAPI).
pip install fastapi

## 10. Git y GitHub son herramientas indispensables para trabajar en equipo cuando usamos Python.
Verdadero

## 11. En tu proyecto A necesitas matplotlib en su versión 3.5, pero tu proyecto B necesita el mismo paquete en su versión 3.6. ¿Cuál es la mejor forma de trabajar para no generar conflictos entre ambos paquetes?
Aislando cada proyecto en su propio ambiente virtual para instalar la versión correcta del paquete en cada uno sin afectar al otro.

## 12. Estás desarrollando un proyecto en Python que utiliza diferentes paquetes de terceros en versiones muy especificas. ¿Cuál es la mejor forma de trabajar con el resto de mi equipo para que siempre instalen esos paquetes en esas versiones cuando clonen el proyecto?
Creando un requirements.txt con todos los paquetes y sus versiones e indicando en el README que instalen las dependencias leyendo ese archivo con pip.
47 changes: 47 additions & 0 deletions funciones_matematicas_para_ds_ia.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,47 @@
# **Curso de Funciones Matemáticas para Data Science e Inteligencia Artificial**

### 1. ¿Cuál es la definición correcta de una función?
> Es una regla de asignación que a cada elemento de un conjunto A se le asigna un elemento de un conjunto B

### 2. ¿Cómo podemos representar una función?
> Todas son formas de representar una función.

### 3. Las variables discretas tienen un número infinito de elementos dentro del conjunto que representan.
> Falso

### 4. El conjunto de valores que puede tomar la variable independiente y están definidos en la función es el ___________. El conjunto de valores que nos otorga una función se le conoce como ______________.
> Dominio y rango

### 5. ¿Qué símbolo que nos sirve para representar una sucesión de sumas?
> $\sum$

### 6. ¿Cuál de estos es ejemplo de una función lineal?
> $ax+b$

### 7. ¿Cuál de estos es ejemplo de una función polinómica?
> $x^3+4x^2+1$

### 8. ¿Cuál de estos es ejemplo de una función trascendente?
> $sin(x)$

### 9. Las funciones trascendentes pueden ser representadas con polinomios.
> Falso

### 10. Si queremos lograr que una función se desplace a la izquierda ¿Cuál es la expresión correcta?
> $y=f(x+c)$

### 11. El perceptrón simula el comportamiento de manera artificial el comportamiento de una neurona.
> Verdadero

### 12. Los pesos sinápticos dentro del modelo del perceptrón nos sirven para:
> Dar importancia a las señales de entrada otorgándoles una ponderación.

### 13. ¿Qué función de activación es usada para problemas relacionados con probabilidad?
> Función sigmoide

### 14. La regresión lineal simple nos permite:
> Aproximar la relación entre dos variables. Se utiliza mucho para predecir un comportamiento de naturaleza lineal.

### 15. Este concepto nos ayuda a medir que tan equivocada es la relación entre dos resultados.
> Varianza ***Errada***