Skip to content

Latest commit

 

History

History
157 lines (111 loc) · 17 KB

examen.md

File metadata and controls

157 lines (111 loc) · 17 KB

Examen Periodismo de datos

María Rodríguez Lafalla, Periodismo y Humanidades, Grupo 61

  1. ¿Qué es el periodismo de datos? Aporta tus impresiones sobre el debate. El periodismo de datos periodismo es una disciplina periodística que se basa en el análisis de datos mediante software especializado. El objetivo es facilitar la información para periodistas y el público a través de las visualizaciones de los datos en forma de infografías, gráficos, artículos…

Para explicar los antecedentes debemos remontarnos a la década de los 50 en EE.UU donde el CAR (Computer Assisted Reporting), suponiendo su antecedente. A finales de la década de los 60 Philip Meyer pondrá el nombre de periodismo de precisión. En este momento el periodismo y los datos van de la mano, y el trabajo de investigación del periodista es esencial el tratamiento de datos. La evolución de los nombres lo llamaron de distintas maneras como periodismo guiado por datos, Data Driven Journalism, News Nerdery, Hacks and Hackers… A pesar de los nombres el objetivo es el mismo y todos se refieren a lo mismo.

El periodismo de datos moderno, el mismo que nos llega en la actualidad tiene sus inicios en el 2006-2008 debido a la combinación de factores: abundancia de software de código abierto, HTML5 y Open Data. Y sus tres áreas principales son el periodismo, los datos y la visualización.

  1. ¿Qué es la visualización de datos? Aporta tus impresiones sobre el debate. La visualización de datos se traduce en la representación gráfica y visual de la información y los datos. Utiliza elementos como los gráficos, mapas o infografías que ayudan a la comprensión de los mismos. El objetivo de las visualización es facilitar el tratamiento de los datos y la lectura de los mismos.

  2. Qué lenguajes informáticos conoces. Razona la respuesta. Los lenguajes informáticos son aquellos que pueden ser leídos por el ordenador (a través de software). Están los lenguajes estructurados, cuya función principal es estructurar documentos como es el caso de HTML o Markdown (visto en clase). Por otro lados están los de programación, que sirven para programar acciones que haga el ordenador. Entre ellos destaca el Java, JavaScript, R, Python, C, C#…

  3. ¿Qué fue determinante para el nacimiento del periodismo de datos moderno? El periodismo de datos que nos llega en la actualidad, el moderno, tiene sus inicios en el 2006-2008. El aspecto más determinante se debe a la combinación de 3 factores: abundancia de software de código abierto, HTML5 y Open Data.

  4. Cuál es la diferencia entre Internet y la Web. Razona la respuesta. La web es un sistema que comunica información que se comparte globalmente, una base de servidores. Internet podríamos definirlo como red de redes. Cabe destacar que a nivel técnico, la Web e Internet son dos servicios distintos. Internet funciona gracias a los protocolos TCP/IP. La Web es parte de Internet, es decir, Internet es una inmensa red de conectada entre las distintas computadoras y la Web (la World Wide Web) es una gran colección de páginas que se asienta sobre esa red de computadoras. La Web necesita de Internet para funcionar.

  5. Qué saberes están implicados en periodismo de datos. Razona la respuesta. Las tres áreas implicadas en el periodismo de datos son:

  • El periodismo, y solo hay periodismo si hay investigación.
  • Los datos: registros electrónicos tratados por el ordenador.
  • La visualización de datos: referida a todo el proceso, no solamente a la parte final. Desde la Web hasta el papel pasando por la estadística, las distintas visualizaciones o la infografía.
  1. Cuál es la materia del periodismo de datos. Razona la respuesta. La materia principal del periodismo de datos son los propios datos, los registros electrónicos que deben ser tratados por el ordenador. Estos datos son parte esencial de la información que resulta imprescindible en el trabajo de investigación del periodista. El periodista analiza y relaciona estas cantidades de datos ayudados por herramientas de software especializado para facilitar la comprensión y visualización de la información.

  2. Qué tipos de interfaces de datos hay Existen tres tipos de interfaces:

  • CLI de Command Line Interfaces o interfaces de línea de comandos. Permite dar instrucciones a algún programa informático (como la Shell) por medio de una línea de texto simple.
  • GUI de Graphical User Interfaces o interfaces gráficas de usuario. Referida al contenido gráfico mediante el cual se visualiza información del equipo en una pantalla.
  • Las de los móviles, capacitivas. (no las hemos visto)
  1. Elige una URL de una noticia de un medio de comunicación y explícala tal como hicimos en clase. URL noticia El País: https://elpais.com/educacion/2022-01-19/los-protocolos-contra-el-suicidio-entran-en-la-escuela-los-padres-no-saben-lo-que-pasa-en-el-cuerpo-de-sus-hijos.html
  • https://, que indica el protocolo usado
  • El dominio elpais.com, es decir, lo que va entre :// y la primera /. La separación entre protocolo y dominio se realiza con ://.
  • La estructura de carpetas del servidor web, todo lo que hay a la derecha de la barra inclinada después de .com, es decir, /educacion/2022-01-19/los-protocolos-contra-el-suicidio-entran-en-la-escuela-los-padres-no-saben-lo-que-pasa-en-el-cuerpo-de-sus-hijos.html
  1. ¿Qué significa el funcionamiento “cliente-servidor”? Se refiere al modelo de diseño de software en el que las tareas se reparten entre proveedores (de recursos o servicios), que son los servidores servidores, y los demandantes, llamados clientes. El cliente demanda esos recursos o servicios a el servidor, y este le da respuesta. Aplicaciones como el correo electrónico o la World Wide Web tiene este modelo cliente-servidor.


  2. Cuál fue el comienzo del CAR (Computer Assisted Reporting)? El comienzo se sitúa en la década de los 50 en EE.UU. En 1952 la cadena de televisión CBS usó un ordenador UNIVAC I para analizar los resultados electorales de EEUU. Otro momento reside en los disturbios en Detroit de 1967. Es entonces cuando Philip Meyer, utilizó una computadora para analizar el comportamiento y las razones del estallido. Desde la década de los 50, el CAR se ha desarrollado en gran medida y ya en los 80 las bases de datos eran la base del trabajo de los periodistas.

  3. ¿Qué tipos de formatos de datos hay? ¿Que similitudes y diferencias tienen? La diferencia principal radica en la complejidad de los mismos. En primer lugar tenemos los *SV o valores separados por cualquier valor. Son llamados usualmente csv aunque no utilicen comas para separar los valores. Son los más sencillos y los menos estandarizados. También están los JSON o JavaScript Object Notation, notación de objetos JS. Utilizan la sintaxis de JS, son más complejos y difíciles de leer que los *SV. Y por último los XML, lenguaje de marcas extensible. Son todavía más complicados de leer y trabajar con ellos, no los hemos visto en clase.

  4. ¿Qué tipos de archivos de documentos de texto conoces? Los archivos son la información almacenada en el ordenador. Están formados por el nombre, un punto y una extensión (ejemplo examen.md). En esta caso md se refiere al tipo de archivo y a sus propiedades asociadas (en este caso estaría en formato Markdown). Los archivos se dividen en ejecutables y los no ejecutables. Los ejecutables funcionan por sí mismos y los no ejecutables almacenan la información pero necesitan de otro programa.

  5. ¿Qué es nano? Nano es un editor en línea de comandos, muy útil para modificar archivos en la terminal, crear lanzadores. Algunas de sus funcionalidades de esta herramienta son la realización de operaciones de búsqueda, hacer y deshacer acciones, auto sangrado, coloreado de la sintaxis…

  6. ¿Qué son git y Github? Git es un sistema de control de versiones distribuido de código abierto desarrollado por Linus Torvalds, el creador de Linux. Github es un repositorio online gratuito que permite gestionar proyectos y controlar versiones de código.

  7. Si quisieras ver la web theguardian.com, ¿cómo lo harías desde la línea de comandos? Pondríamos lo siguiente: lynx y la URL, es decir: lynx https://theguardian.com Otra opción para que aparezca en la terminal de manera textual y comprobar si esta bien hecha y escrita sería con: lynx -source https://theguardian.com

  8. Cuál es el primer comando que deberías usar en la terminal. Explica tu respuesta.
    El primer comando que pondría sería pwd (print working directory) este comando nos indica dónde estamos. Por lo tanto veo muy útil saber dónde nos encontramos lo primero de todo antes de realizar acciones que conlleven listar documentos, visualizarlos o editarlos.

  9. ¿Qué se puede hacer para ver el contenido de un archivo de texto? Hay dos opciones la primera de ellas y que no utilizamos es type, esta opción permite visualizar el contenido de los archivos, ej: type examen.txt) La otra es el editor que hemos utilizado durante todo el curso, nano, cuyo comando abre los archivos y permite editarlos, ej: nano examen.txt.

  10. ¿Cómo creamos un directorio? ¿Y dos directorios? Razona tu respuesta Para crear un directorio utilizamos el comando mkdir y añadimos el nombre del directorio o carpeta, es decir mkdir carpeta1. Para crear varias a la vez se hace de la misma manera poniendo el nombre de las carpetas de manera consecutiva: con mkdir carpeta1 carpeta2 carpeta3, crea automáticamente esas 3 carpetas, es muy útil.

  11. ¿En qué se diferencian las rutas absolutas de las relativas? Pon ejemplos de ambas. Las rutas absolutas contienen la ruta del archivo completa, incluyendo el directorio raíz. Ejemplo de ello es: C:/ examen/teoria/archivo1.doc. En las relativas en cambia se indica la ruta desde donde estés en el momento, sin incluir el directorio raíz. Si estamos en C:/ examen y queremos ir a archivo1 que está en la carpeta de teoría, deberíamos hacer teoria/archivo1.doc. Se usan dos puntos seguidos (..) para ir al directorio padre.

  12. ¿Qué función tiene la almohadilla en Markdown y en un programa de la shell? Razona tu respuesta. En Markdown la almohadilla cumple la función de titulación, se utiliza en los títulos y subtítulos, y cuanto más almohadillas hay más pequeño es el tamaño de letra. Tiene la misma función que el h1 (header 1 en el HTML, funciona como encabezado). En el caso de la shell la # es un comentario, que no será leído por la aplicación.

  13. ¿Cómo ves todos los dialectos de la shell disponibles? Para ver los dialectos posibles simplemente tienes que escribir en la terminal: cat /etc/shells. Te devuelve siete resultados, aparecen: /bin/bash, /bin/csh, /bin/dash, /bin/ksh, /bin/sh, /bin/tcsh, /bin/zsh.

  14. Pon un par de ejemplos de Google Dorks u "operadores de búsqueda” Los operadores de búsqueda tienen la función de facilitar la búsqueda de ciertas palabras o elementos a través de la red. Son varios los operadores que ayudan en esta tarea. Dos de ellos son “or” y “and”.

  • “Or” también puede utilizarse (|): busca X o Y, un elemento u otro. Esto quiere decir que aparecerán resultados relacionados con X ó Y, o ambos.
  • “And” busca X y Y. Apareciendo resultados relacionados con esos dos elementos. Es muy útil cuando se combina con otros operadores.

  1. Para qué usas cd y cómo. El comando cd sirve para abrir los archivos, simplemente se escribe cd y el nombre del archivo (examen.md, por ejemplo). Su función es la de abrir y desplazarse por los distintos archivos y carpetas del ordenador desde la terminal.

  2. Para qué usas cp y cómo. Este comando sirve para copiar archivos y directorios.Su comportamiento es cp ruta/s-origen ruta-destino. Es decir, admite copiar una cosa o varias a un destino final.

  3. Para qué usas mv y cómo. Dicho comando lo usamos para mover archivos y directorios. Su comportamiento es el siguiente: mv ruta/s-origen ruta-destino. Permite mover una o varias cosas a un destino final. Se puede usar también para renombrar archivos o carpetas. Ej: mv datos.tx examen.tx moverá el archivo datos al llamado examen, es decir borrará el primero y crea examen.tx, y si existe le cambiaría el nombre.

  4. Para qué usas mkdir y cómo Para crear un directorio utilizamos el comando mkdir y añadimos el nombre del directorio o carpeta, es decir mkdir carpeta1, y así se crea. También pueden crearse directorios simultáneos: con mkdir carpeta1 carpeta2 carpeta3. O crear carpetas dentro de otras:mkdir -vp carpeta1/carpeta2/carpeta3 se creará carpeta1, dentro de ella carpeta2, y dentro de la segunda estará carpeta3.

  5. ¿Qué es una API. Una API significa interfaz de programación de aplicaciones, es un conjunto de definiciones y protocolos que se usa para diseñar e integrar el software de las aplicaciones. Serían los códigos para comunicarse con una web, y la API más conocida y universal es la HTTP (protocolo de control de la transmisión). Cada recurso puede tener la propia, ejemplo de ello es Twitter.

  6. Qué similitudes y diferencias tiene Markdown con respecto a HTML. Ambos son lenguajes informáticos estructurados y su función es estructurar los documentos. Se diferencian en la complejidad de las mismas. La Web funciona con HTML, actualmente HTML5. Pero Dan Gruber inventó otra herramienta debido a que leer el código en HTML es muy complejo. Esta es la razón de Markdown, siendo una sintaxis más sencilla. Los elementos y la estructuras también cambian, la sintaxis. HTML es un lenguaje de marcados de hipertextos que funciona con los elementos escritos en las marcas (<>) y sus principales caracteres son p de párrafo o h1 de header 1 (encabezado). Siendo por tanto un leguaje más sofisticado y complejo. Markdown es más sencillo de leer y utiliza elementos como la almohadilla # en la titulación. Los astericos para el cambio del letra (con dos en cada lado es negrita y con un cursiva). Además de elementos de organización como los guiones o los números.

  7. Explica la URL https://github.com/pontedatos/uc3m-periodismo-datos

  • https://, que indica el protocolo usado
  • El dominio github.com, es decir, lo que va entre :// y la primera /. La separación entre protocolo y dominio se realiza con ://. Se lee de derecha a izquierda en orden de importancia. .com es el TLD, Top Level Domain o dominio de primer nivel. La última www es un subdominio de theguardian.com.
  • La estructura de carpetas del servidor web, todo lo que hay a la derecha de la barra inclinada después de .com, es decir, /pontedatos/uc3m-periodismo-datos
  1. Apunta tres comandos que hayas utilizado y para qué.
  • pwd es un comando que nos dice dónde estamos, es muy importante para el inicio de la terminal y se te deja conocer dónde estás en ese momento. Pones simplemente pwd en la terminal.
  • cd sirve para moverte y abrir las carpetas y archivos. Pones cd y el nombre del archivo.
  • ls sirve para listar los archivos, te permite visualizar el contenido que hay dentro de las carpetas y es muy útil para saber si se ha creado el documento que acabas de hacer por ejemplo. Esos tres comandos son esenciales para cualquier trabajo y movimiento que implique la terminal.
  1. ¿Qué harías si al ejecutar un comando te salta el aviso "command not found”? Miraría si he escrito bien el comando, ya que ese aviso puede indicar que la escritura no está bien y el programa no lo ha leído. O ver si el comando está descargado, ya que si le pides un comando que no tienes descargado es lo que aparece, si no te aparece hay que descargarlo para utilizarlo.

  2. ¿Cómo harías para que OpenRefine interpretara correctamente los tipos de datos? Los datos que mejor son comprendidos por dichas herramienta son los que están en formato CSV (valores separados por comas). Por lo que es importante que a la hora de subir un archivo para realizar un trabajo en la aplicación este en este formato para una mejor lectura y comprensión.

  3. ¿Quién es Philip Meyer? Es el precedente del periodismo de datos, un periodista cuya labora de investigación fue esencial para llegar al periodismo de datos moderno tal y como lo conocemos hoy en día. Su actividad comienza a finales de los 50 en el medio The Miami Herald. La labor que realizó fue esencial para conocer la importancia y la utilidad que tienen los datos en el periodismo. Ejemplo de ello el estudio realizado sobre los altos coste de los seguros escolares contra incendios y huracanes. O el análisis tras los disturbios de Detroit en 1967. Nombro a esta disciplina bajo el nombre de periodismo de precisión, título también de su libro de 1973. Fue el antecedente y la unión entre periodismo y datos, disciplina que evoluciona de la mano desde entonces.

  4. ¿Quién fue Florence Nightingale? Florence Nightingale vivió durante finales del siglo XIX y principios del XX. Fue enfermera, escritora y estadística. Considerada pionera de la enfermería moderna y creadora del primer modelo conceptual de enfermería.
En lo que a visualización de datos se refiere se considera pionera en la representación gráfica de datos estadísticos y se le atribuye además el desarrollo de una forma de gráfico circular hoy conocida como diagrama de área polar.