# Antes de empezar
- Revisar la configuración del ambiente de trabajo: Anaconda + VS Code
- Para VS Code, se lo baja directamente desde Microsoft: https://code.visualstudio.com/download
- Para Python, se lo puede descargar de la distribución Anaconda: https://anaconda.com
- Para descargar información de Kaggle, generar una cuenta en: https://kaggle.com
- Obtener el archivo netflix_titles.csv del centro de descargas. Es una base de datos de películas de Netflix que contiene información relevante como su ID, el tipo de película, su título y director, la fecha en la que se subió a la plataforma, su duración, rating y una descripción. Este archivo se lo bajó desde Kaggle.com. Referencia: https://www.kaggle.com/datasets/shivamb/netflix-shows

# Módulos y paquetes
- Instalación de Módulos y paquetes
- Uso de librerías estadísticas básicas
- Primeras gráficas: histograma

## Introducción
- Cualquier archivo Python es un módulo. Contiene muchas funciones Python dentro de su código.
- Cuando se importa un módulo o un paquete, el objeto que se genera en Python es siempre del tipo módulo.

- Un paquete es un conjunto de módulos de Python, en forma de una colección que sirve para inicializar el código.
- El paquete es un directorio que tiene colecciones de módulos. El directorio contiene módulos Python (archivos .py) así como archivos init.py
- Los paquetes pueden tener cualquier número de niveles.
- Esto quiere decir que la diferencia entre módulos y paquetes es nada más a nivel de sistema operativo.

- La diferencia principal: los paquetes trabajan en cada librería, definiendo los códigos como una sola unidad, de cualquier función.
- Mientras que los módulos son librerías separadas cada uno, con funciones incluidas. La reusabilidad de los paquetes los hace preferidos vs. los módulos.

In [1]:
# Ejemplo de un módulo
import math
from math import pow
pow(2, 8)

256.0

In [2]:
# Ejemplo de un paquete
import math

In [3]:
# Ejemplo simple
import datetime
date.today()

NameError: name 'date' is not defined

In [4]:
# El ejemplo 2 funciona porque el submódulo 'date' se importó, lo que permite ejecutarlo directamente
from datetime import date
date.today()

datetime.date(2024, 5, 5)

In [5]:
# Importar la función completa 'csv' para tratamiento de archivos
import csv

# Importar la función 'os' para leer el directorio actual
import os

# Get the current working directory
cwd = os.getcwd()

# Print the current working directory
print("Current working directory: {0}".format(cwd))

Current working directory: /Users/memobarbosa/Análisis de datos/Parte 2/M12


In [6]:
# Cambiar el directorio actual con chdir
os.chdir('/users/memobarbosa/análisis de datos/parte 2/M12')

# Print the current working directory
print('Current working directory: {0}'.format(cwd))

Current working directory: /Users/memobarbosa/Análisis de datos/Parte 2/M12


In [7]:
# Abre el archivo de lectura
file = open(r'./netflix_titles.csv')

# Lee el archivo en el objeto csvreader
csvreader = csv.reader(file)

In [8]:
type(csvreader)

_csv.reader

In [9]:
# Obtiene los encabezados del archivo (header)
header = []
header = next(csvreader)
header

['show_id',
 'type',
 'title',
 'director',
 'cast',
 'country',
 'date_added',
 'release_year',
 'rating',
 'duration',
 'listed_in',
 'description']

In [10]:
# Extrae los datos a una lista
rows = []
for row in csvreader: rows.append(row)
print(rows[:2])

[['s1', 'Movie', 'Dick Johnson Is Dead', 'Kirsten Johnson', '', 'United States', 'September 25, 2021', '2020', 'PG-13', '90 min', 'Documentaries', 'As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.'], ['s2', 'TV Show', 'Blood & Water', '', 'Ama Qamata, Khosi Ngema, Gail Mabalane, Thabang Molaba, Dillon Windvogel, Natasha Thahane, Arno Greeff, Xolile Tshabalala, Getmore Sithole, Cindy Mahlangu, Ryle De Morny, Greteli Fincham, Sello Maake Ka-Ncube, Odwa Gwanya, Mekaila Mathys, Sandi Schultz, Duane Williams, Shamilla Miller, Patrick Mofokeng', 'South Africa', 'September 24, 2021', '2021', 'TV-MA', '2 Seasons', 'International TV Shows, TV Dramas, TV Mysteries', 'After crossing paths at a party, a Cape Town teen sets out to prove whether a private-school swimming star is her sister who was abducted at birth.']]


In [11]:
rows[0:2]

[['s1',
  'Movie',
  'Dick Johnson Is Dead',
  'Kirsten Johnson',
  '',
  'United States',
  'September 25, 2021',
  '2020',
  'PG-13',
  '90 min',
  'Documentaries',
  'As her father nears the end of his life, filmmaker Kirsten Johnson stages his death in inventive and comical ways to help them both face the inevitable.'],
 ['s2',
  'TV Show',
  'Blood & Water',
  '',
  'Ama Qamata, Khosi Ngema, Gail Mabalane, Thabang Molaba, Dillon Windvogel, Natasha Thahane, Arno Greeff, Xolile Tshabalala, Getmore Sithole, Cindy Mahlangu, Ryle De Morny, Greteli Fincham, Sello Maake Ka-Ncube, Odwa Gwanya, Mekaila Mathys, Sandi Schultz, Duane Williams, Shamilla Miller, Patrick Mofokeng',
  'South Africa',
  'September 24, 2021',
  '2021',
  'TV-MA',
  '2 Seasons',
  'International TV Shows, TV Dramas, TV Mysteries',
  'After crossing paths at a party, a Cape Town teen sets out to prove whether a private-school swimming star is her sister who was abducted at birth.']]