Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Entrega 2 Impar Apartado 2.3 : Normalizacion de datos #215

Closed
isinahum opened this issue Oct 15, 2021 · 5 comments
Closed

Entrega 2 Impar Apartado 2.3 : Normalizacion de datos #215

isinahum opened this issue Oct 15, 2021 · 5 comments
Assignees
Labels
Entrega2 Duda relacionada a la Entrega 2 del ramo Impar Duda relacionada a un problema específica de un grupo Impar Proyecto Duda relacionada al proyecto del curso

Comments

@isinahum
Copy link

Hola!

En la normalización de datos y al crear nuestros archivos .csv "utiles", ¿podemos mezclar información de dos tablas distintas para crear otra? Ej. Hacer un peliculas.csv que mezcle la info que esta en multimedia (filtrando lo de series) y agregando los subgéneros? ¿O al "normalizar" los datos solo podemos eliminar columnas y filas?

@isinahum isinahum added Entrega2 Duda relacionada a la Entrega 2 del ramo Impar Duda relacionada a un problema específica de un grupo Impar Proyecto Duda relacionada al proyecto del curso labels Oct 15, 2021
@isinahum isinahum changed the title Entrega 2 Impar Apartado X : Normalizacion de datos Entrega 2 Impar Apartado 2.3 : Normalizacion de datos Oct 15, 2021
@arpincheira
Copy link
Contributor

Hola, en respuesta a tu comentario(y a modo de pista) quiero saber lo siguiente: quieres guardar la temporada como tal en películas o hacer una referencia a estas?

El primer caso probablemente no sería normalizar la información, mientras el segundo probablemente si.

Ahora, con respecto a la última pregunta, normalizar se entiende en este contexto como redistribuir la información con el objetivo de crear nuevas tablas con la información relevante de la misma, esto no implica en ningún caso la eliminación de columnas como tal(pues eso llevaría a pérdida de información).

@isinahum
Copy link
Author

Hola!

Pucha no entendi tu ejemplo porque las peliculas no tienen temporadas entonces no tiene sentido considerarlo asi. Mi pregunta va mas en si sería valido hacer un .csv de peliculas en base a multimedia.csv y genero_subgenero.csv. Entonces cada fila sería una pelicula con sus generos separados por ';' en la parte de generos, y sus subgeneros tambien separados por ';' en la columna de subgeneros.

Al decir 'eliminar columnas' me referia a separar la info, por ejemplo en la de multimedia separar peliculas con series, no es que se pierdan las columnas que elimino sino que van a formar otra tabla.

@arpincheira
Copy link
Contributor

Hola, si, fue error mío, em... no entiendo muy bien a lo que te refieres pero si haces referencia a hacer algo como:

atributos_película; género1; género2

Entonces no te recomiendo hacerlo así (no te puedo decir como hacerlo).

Con respecto a lo último, sí, la idea efectivamente es crear nuevas tablas a partir de las tablas entregadas, solo quería dejar claro aquello de "eliminar columnas" pues puede generar confusiones y por ende perjudicar a alguien que lea la issue sin saber exactamente a lo que te referías.

@isinahum
Copy link
Author

Claro, pero me refiero a hacer:

pid, titulo, claisificacion ..... , Drama;Suspenso;Comedia, Apocaliptico;Cyberpunk;,Biopunk

Estaría bien tener una tabla en los archivos .csv así? Como haber manipulado los datos de esa forma?

@arpincheira
Copy link
Contributor

Hola, no te puedo contestar eso pero te tengo unas preguntas que te puede guiar un poco:

¿Qué pasaría si el día de mañana quisieras añadir un nuevo género?
¿Qué pasaría si quieres añadir un género a una de las películas?
¿Qué pasaría si te dicen que un género posee información adicional(como una descripción o algo por el estilo)?

Si la respuesta a estas preguntas requiere meterse en cada dato y modificarlo entonces probablemente existe un error de diseño no menor. Lo mismo ocurre en el caso de que quieras almacenar esta nueva información por cada película que posee dicho género.

@arpincheira arpincheira self-assigned this Oct 28, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Entrega2 Duda relacionada a la Entrega 2 del ramo Impar Duda relacionada a un problema específica de un grupo Impar Proyecto Duda relacionada al proyecto del curso
Projects
None yet
Development

No branches or pull requests

2 participants