Entrega 2 Impar Apartado 2.3 : Normalizacion de datos #215

isinahum · 2021-10-15T05:09:05Z

Hola!

En la normalización de datos y al crear nuestros archivos .csv "utiles", ¿podemos mezclar información de dos tablas distintas para crear otra? Ej. Hacer un peliculas.csv que mezcle la info que esta en multimedia (filtrando lo de series) y agregando los subgéneros? ¿O al "normalizar" los datos solo podemos eliminar columnas y filas?

arpincheira · 2021-10-15T10:16:37Z

Hola, en respuesta a tu comentario(y a modo de pista) quiero saber lo siguiente: quieres guardar la temporada como tal en películas o hacer una referencia a estas?

El primer caso probablemente no sería normalizar la información, mientras el segundo probablemente si.

Ahora, con respecto a la última pregunta, normalizar se entiende en este contexto como redistribuir la información con el objetivo de crear nuevas tablas con la información relevante de la misma, esto no implica en ningún caso la eliminación de columnas como tal(pues eso llevaría a pérdida de información).

isinahum · 2021-10-15T12:50:50Z

Hola!

Pucha no entendi tu ejemplo porque las peliculas no tienen temporadas entonces no tiene sentido considerarlo asi. Mi pregunta va mas en si sería valido hacer un .csv de peliculas en base a multimedia.csv y genero_subgenero.csv. Entonces cada fila sería una pelicula con sus generos separados por ';' en la parte de generos, y sus subgeneros tambien separados por ';' en la columna de subgeneros.

Al decir 'eliminar columnas' me referia a separar la info, por ejemplo en la de multimedia separar peliculas con series, no es que se pierdan las columnas que elimino sino que van a formar otra tabla.

arpincheira · 2021-10-15T12:56:55Z

Hola, si, fue error mío, em... no entiendo muy bien a lo que te refieres pero si haces referencia a hacer algo como:

atributos_película; género1; género2

Entonces no te recomiendo hacerlo así (no te puedo decir como hacerlo).

Con respecto a lo último, sí, la idea efectivamente es crear nuevas tablas a partir de las tablas entregadas, solo quería dejar claro aquello de "eliminar columnas" pues puede generar confusiones y por ende perjudicar a alguien que lea la issue sin saber exactamente a lo que te referías.

isinahum · 2021-10-15T13:01:15Z

Claro, pero me refiero a hacer:

pid, titulo, claisificacion ..... , Drama;Suspenso;Comedia, Apocaliptico;Cyberpunk;,Biopunk

Estaría bien tener una tabla en los archivos .csv así? Como haber manipulado los datos de esa forma?

arpincheira · 2021-10-15T15:25:34Z

Hola, no te puedo contestar eso pero te tengo unas preguntas que te puede guiar un poco:

¿Qué pasaría si el día de mañana quisieras añadir un nuevo género?
¿Qué pasaría si quieres añadir un género a una de las películas?
¿Qué pasaría si te dicen que un género posee información adicional(como una descripción o algo por el estilo)?

Si la respuesta a estas preguntas requiere meterse en cada dato y modificarlo entonces probablemente existe un error de diseño no menor. Lo mismo ocurre en el caso de que quieras almacenar esta nueva información por cada película que posee dicho género.

isinahum added Entrega2 Duda relacionada a la Entrega 2 del ramo Impar Duda relacionada a un problema específica de un grupo Impar Proyecto Duda relacionada al proyecto del curso labels Oct 15, 2021

isinahum changed the title ~~Entrega 2 Impar Apartado X : Normalizacion de datos~~ Entrega 2 Impar Apartado 2.3 : Normalizacion de datos Oct 15, 2021

arpincheira self-assigned this Oct 28, 2021

arpincheira closed this as completed Nov 4, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Entrega 2 Impar Apartado 2.3 : Normalizacion de datos #215

Entrega 2 Impar Apartado 2.3 : Normalizacion de datos #215

isinahum commented Oct 15, 2021

arpincheira commented Oct 15, 2021

isinahum commented Oct 15, 2021

arpincheira commented Oct 15, 2021

isinahum commented Oct 15, 2021

arpincheira commented Oct 15, 2021

Entrega 2 Impar Apartado 2.3 : Normalizacion de datos #215

Entrega 2 Impar Apartado 2.3 : Normalizacion de datos #215

Comments

isinahum commented Oct 15, 2021

arpincheira commented Oct 15, 2021

isinahum commented Oct 15, 2021

arpincheira commented Oct 15, 2021

isinahum commented Oct 15, 2021

arpincheira commented Oct 15, 2021