Skip to content

Latest commit

 

History

History
197 lines (137 loc) · 23.5 KB

examen.md

File metadata and controls

197 lines (137 loc) · 23.5 KB

1¿Qué es el periodismo de datos? Aporta tus impresiones sobre el debate.

El periodismo de datos es una disciplina relativamente nueva. El periodismo de datos moderno, del que bebemos actualmente, nace como consecuencia de la abundancia de software en código abierto, del HTML5 y del Open Data.

Así bien, el periodismo de datos, al ser una nueva disciplina,es considerada una disciplina contenedor. Ahora bien, existen 3 áreas especialmente implicadas en el periodismo de datos. Por un lado, el periodismo. Para hablar de periodismo es necesario que haya investigación. En segundo lugar los datos, que son los registros electrónicos con los que trabaja el ordenador. Y por último la visualización de datos.

El debate que suscita el periodismo de datos gira en torno al nombre de la propia disciplina. Por un lado se habla de periodismo asistido por ordenadores, (CAR), a la hora de hablar de esta disciplina. Sin embargo, considero que el periodismo de datos es mucho más que la asistencia del ordenador. No obstante, este término se sigue utilizando a día de hoy. Por otro lado, también habría que considerar la labor del catedrático José Luis Dader, que una vez hubo estudiado la disciplina del periodismo de precisión en Estados Unidos, quiso traerla a España. Sin embargo Dader se preguntó si “Periodismo de precisión” era la terminología adecuada. Valoró otras opciones tales como periodismo científico, periodismo matemático o periodismo tecnológico. Sin embargo, con buen criterio entendió que estos términos podrían ser malentendidos. Por lo que acabó optando por llamar a esta disciplina periodismo de precisión. Lo cual no se alejó de las polémicas. Ya que todo periodismo debe ser preciso. Y esto es algo que es necesario tener presente. Pero hemos de entender que había que alejar a este tipo de periodismo del periodismo literario de Truman Capate.

Por último, Sandra Crucianelli sigue hablando de "periodismo de bases de datos", y considero que no le falta razón. Ya que para trabajar con los datos, alguna "base de datos" has de tener, aunque el concepto de base de datos también ha evolucionado.

Ahora bien, el periodismo de datos es una disciplina con un enorme potencial. Por lo que es imposible recoger todas sus funcionalidades en un solo nombre.

  1. ¿Qué medio de comunicación inglés es fundamental en el periodismo y la visualización de datos? El periódico The Guardian, un medio pionero en el periodismo de datos. Así bien, el periódico The Guardian siempre ha estado a la vanguardia en materia tecnológica. Una de las principales apuestas de este periódico fue la incorporación de la verificación a su medio, el llamado Reality Check. Que acercó el sistema de verificación a los lectores Destaca también la herramienta Swarzime, creada desde la necesidad de mejorar la recogida de datos así como su análisis posterior.

  2. Qué lenguajes informáticos conoces. Razona la respuesta. Por lenguajes informáticos entendemos aquellos que el ordenador es capaz de entender. En este sentido, diferenciamos 2 tipos de lenguajes informáticos: El lenguaje estructurado: Aquellos que sirven para estructurar los documentos. Un ejemplo de ellos es el HTML El lenguaje de programación: Aquellos que sirven para programar las acciones del ordenador. Algunos ejemplos son: Java, C, C#, Python o R. En la web se utiliza mucho JavaScript, es el que aporta la interactividad.

  3. Cuál es la diferencia entre Internet y la Web. Razona la respuesta.

En líneas generales, la web a nivel técnico es un servicio más que se presta en la red de redes que es internet. En este sentido, la web es un sistema que comunica información que se comparte globalmente. Es por tanto un espacio virtual de compartimentos interrelacionados que podría definirse como una base de servidores. Así bien, las webs también pueden llegar a ser una webapps

Por su parte, Internet, como ya se ha mencionado, es una red de redes que funciona gracias a los protocolos TCP e IP

  1. Qué tipos de datos hay Numéricos: Aquellos en los que aparecen cifras y que además permiten al usuario realizar operaciones matemáticas con ellas. Dentro de los datos numéricos hay diferentes tipos: -integer: números enteros, sin decimales. El separador del inglés es diferente en inglés (coma), que en castellano (punto Decimal: números con pocos decimales Float or double:: números con decimales pero que pueden tener muchos decimales y/o variable en su longitud Date or date time: la forma más estándar suele ser la que sigue el esquema YYYY-MM-DD, donde Y significa Year, y al ser cuatro tienen que ponerse cuatro cifras; M significa Month, y al ser dos tienen que ponerse dos cifras; y D significa Day y al ser dos tienen que ponerse dos cifras. period: Algunas veces (duration data type de XML Schema) se utiliza también el tipo de dato de tiempo periódico que obedece al periodo de la muestra del dato, por ejemplo P al inicio indica que se trata de un dato periódico y nY indica el número de años.

Strings: cadena de caracteres, el texto normal. Booleanos: Representan dos valores de una lógica binaria “Verdadero falso”

  1. ¿Qué significa el funcionamiento "cliente-servidor"?

La arquitectura cliente-servidor es un modelo de diseño de software en el que las tareas se reparten entre los proveedores de recursos o servicios, llamados servidores, y los demandantes, llamados clientes. Un cliente realiza peticiones a otro programa, el servidor, quien le da respuesta. El correo electrónico es un ejemplo de aplicación que funciona utilizando el modelo cliente-servidor.

  1. ¿Qué relación tiene el formato CSV con Excel?

Tanto excel con su formato como el formato CSV almacenan datos en formato tabulado. Es decir, en filas y columnas.

En este sentido, CSV es un formato para guardar información tabulada en un archivo de texto delimitado con extensión CSV, mientras que Excel es una hoja de cálculo que mantiene los archivos en su propio formato patentado, XLS o XLSX. CSV es un formato de texto sin formato con una serie de valores separados por comas, mientras que Excel es un archivo binario que contiene información sobre todas las hojas de trabajo en un libro. El archivo CSV no puede realizar operaciones en los datos, mientras que Excel sí puede realizar operaciones. Los archivos CSV son más rápidos y también consumen menos memoria. Comparando CSV con Excel, los archivos CSV se pueden abrir con cualquier editor de texto en Windows, mientras que los archivos de Excel no se pueden abrir con editores de texto, necesitan de alguna versión de Excel.

  1. Qué saberes están implicados en periodismo de datos. Razona la respuesta.

Como se ha indicado en la primera pregunta, en el periodismo de datos están implicados saberes muy diversos, ya que deja de ser una disciplina contenedor. pero destacan las siguientes áreas

  1. El periodismo: Solo puede haber periodismo si hay investigación. Trabajamos con datos pero lo principal es siempre el periodismo.

  2. Los datos, es decir, registros electrónicos que han de ser tratados por ordenador. Es con lo que operamos, con lo que trabajamos y lo que nos permite sacar conclusiones

  3. La visualización de datos: desde la Web hasta el papel pasando por la estadística, las distintas visualizaciones o la infografía. Estos tres saberes son muy importantes. Ahora bien, tenemos que ser conscientes de que la visualización va más allá de la visualización como producto final. En la etapa de visualizar también realizamos análisis, aplicamos técnicas estadísticas, programas informáticos que hagan que de un gran volumen de datos seamos capaces de sacar hipótesis o conclusiones.

  4. Qué tipos de interfaces de datos hay

Diferenciamos 3 tipos de interfaces de datos: 1.CLI de Command Line Interfaces o interfaces de línea de comandos: permite a los usuarios dar instrucciones a algún programa informático o al sistema operativo por medio de una línea de texto simple. 2. GUI de Graphical User Interfaces o interfaces gráficas de usuario: es un programa informático que actúa de interfaz de usuario, utilizando un conjunto de imágenes y objetos gráficos para representar la información y acciones disponibles en la interfaz. 3. Las de los móviles, capacitivas: son la interfaces táctiles 17. ¿Qué tipos de archivos de documentos de texto conoces? Los documentos nos permiten almacenar la información en nuestro ordenador. La extensión del documento determina las propiedades del mismo. Por tanto, las últimas letras del nombre del documento determinan el tipo de archivo que es. Algunos ejemplos de tipo de archivo son xml, java html, text… etc. Ahora bien, podemos dividir los archivos en dos grandes grupos. Éstos son los ejecutables y los no ejecutables o archivos de datos. La diferencia fundamental entre ellos es que los primeros están creados para funcionar por sí mismos y los segundos almacenan información que tendrá que ser utilizada con ayuda de algún programa.

  1. ¿Qué es nano? Es un editor en línea de comandos útil para modificar archivos de configuración en la terminal, crear lanzadores, e incluso para escribir código. Entre otras muchas cosas nano permite: realizar operaciones de búsqueda y reemplazo interactivas, hacer y deshacer acciones, colorear la sintaxis, poner autosangrado, desplazarse suavemente por las distintas líneas, ir directamente a una línea concreta, bloquear archivos y autoguardar archivos.

LLEVAS 11

  1. ¿Qué son git y Github? Git es un sistema de control de versiones distribuido de código abierto. Git se utiliza en proyectos de software. De esta forma, es un programa para el trabajo colaborativo y distribuido. Es muy útil para proyectos de periodismo y visualización de datos. Git fue creado por Linus Torvalds para el desarrollo del kernel. Por otro lado, Github es un repositorio online gratuito que permite gestionar proyectos y controlar versiones de código. Es muy utilizado por desarrolladores para almacenar sus trabajos. Github brinda la oportunidad a millones de personas de todo el mundo de cooperar en distintos proyectos. En definitiva, GitHub aloja tu repositorio de código y te ofrece herramientas muy útiles para el trabajo en equipo, dentro de un proyecto.

  2. Cuál es el primer comando que deberías usar en la terminal. Explica tu respuesta. Escribiría el comando pwd para saber donde estoy. Una vez sepa en qué lugar me encuentro podré comenzar a operar en la terminal.

  3. ¿Qué 3 tipos de formatos de datos hemos visto? ¿Qué similitudes y diferencias tienen? Destacamos 3 tipos de datos ficheros: SV o valores separados por cualquier valor. Normalmente serán llamados CSV incluso aunque no utilicen comas para separar los valores. Son los más sencillos, pero también los menos estandarizados. Los valores separados por comas se visualizan como una tabla simple con filas y columnas. La mayoría de los recursos disponibles en los catálogos de Datos Abiertos se encuentran en formato CSV. Los archivos CSV sirven para manejar una gran cantidad de datos en formato tabla, sin que ello conlleve un sobrecoste computacional. Los archivos CSV tan solo admiten datos "en crudo", es decir, no podremos seleccionar colores ni formatos de tabla que queramos visualizar una vez lo abramos. JSON o JavaScript Object Notation, notación de objetos JS. Son los ficheros que mejor funcionan con aplicaciones web. Utilizan la sintaxis de JS. Permiten más complejidad que los *SV, por eso son más complejos de leer. El formato JSON es un formato abierto utilizado como alternativa al XML para la transferencia de datos estructurados entre un servidor de Web y una aplicación Web. Su lógica de organización tiene puntos de semejanza con el XML, pero posee una notación diferente. Por otro lado, los archivos JSON trabajan con pares de atributos y valores, y en vez de marcadores, como en el XML, utilizan delimitadores en cadenas: {}, []; y "". XML: Es decir, lenguaje de marca extensible. Son complicados de leer y es difícil trabajar con ellos.Se utiliza para el intercambio de datos estructurados. Más que un formato de archivos rígido, XML es un lenguaje que define los formatos aceptados que pueden utilizar los grupos para intercambiar información.

  4. Si quieres clonar un repositorio git, ¿qué pasos tendrías que dar? ¿Cómo comprobarías que ha funcionado? Copio el enlace de la página web que quiero clonar Voy a la carpeta de mi elección con el comando cd y, una vez allí escribo “git clone y el enlace que quiero descargar” Esto creará una carpeta por debajo de donde me encuentro. Esa carpeta es un repositorio git en nuestro ordenador, en localhost, que tiene el mismo contenido que el de la dirección desde donde me lo he clonado Por tanto, si quiero comprobar que está bien lo compruebo en mi localhost.

  5. ¿Cómo creamos un directorio? ¿Y dos directorios? Razona tu respuesta mkdir sirve para crear directorios. Por tanto, para crear un directorio realizaré el siguiente procedimiento: Abro la terminal y escribo cd para llegar a donde quiero crear el nuevo directorio una vez ubicados escribo mkdir y el nombre del directorio que quiero crear Para comprobar que se ha creado listo los archivos con ls Si quiero crear más de un directorio a la vez escribiré: mkdir archivo archivo 2... y así sucesivamente

  6. Qué son las entidades HTML y cómo se representan. Por un ejemplo Las entidades HTML son aquellas que utilizamos para representar los caracteres que no están cubiertos por el sistema de codificación ASCII. En este sentido, las entidades HTML son cadenas de caracteres que comienzan con un ampersand (&) y termina con un punto y coma (;). Por ejemplo, el carácter á se escribe á y el carácter é se escribe é

  7. Pon un ejemplo de uso de "wildcards" Los wildcard o comodines a la hora de listar, copiar, mover y hacer algunas otras operaciones. Un buen ejemplo del uso de comodines sería el de ordenar los archivos de nuestro escritorio.

Nosotros tenemos en nuestro escritorio una carpeta de nombre data y dentro de ella varios archivos de distintos formatos tales como csv, json y xls. Para organizarlos haremos lo siguiente: Creamos unas carpetas que se llamarán csv, json y xls dentro de data. Nos situamos en el directorio data con el comando cd: cd ~/Escritorio/data. Creamos las carpetas con mkdir: mkdir csv json xls. Movemos los archivos con mv: mv *.json json/, y luego con los otros dos tipos de archivos.

  1. ¿Qué función tiene la almohadilla en Markdown y en un programa de la shell? Razona tu respuesta. Los comentarios son muy útiles a la hora de elaborar los proyectos. Por este motivo, en los archivos de configuración de la Shell, la almohadilla que aparece al principio de línea hace referencia a un comentario, es decir, el programa no va a leer la línea. Este es un ejemplo más de como escribir en scripts de bash es una forma de escribir en código limpio y fácil de entender.

Por otro lado, Markdown fue diseñado para hacer la lectura lo más legible posible. En este sentido, la almohadilla en markdown es el equivalente del elemento h1 de HTML o "encabezamiento de primer nivel". Es decir, en markdown la almohadilla sirve para destacar tipográficamente el título.

  1. Para qué usas cd y cómo. Para ir a un directorio o carpeta. Lo utilizo para moverme. Su funcionamiento es escribir cd y seguidor el espacio en el que me quiero situar

  2. Para qué usas cp y cómo El comando cp lo utilizo para copiar. Puedo utilizarlo para copiar una o varias cosas a un destino final. Su comportamiento es cp ruta/s-origen ruta-destino.

  3. Para qué usas mv y cómo. El comando mv lo utilizo para mover archivos, es decir, para cortar y pegar una o varias cosas en un destino determinado. Su comportamiento es mv ruta/s-origen ruta-destino.

  4. Para qué usas mkdir y cómo para crear un nuevo subdirectorio o carpeta del sistema de archivos. Su funcionamiento es sencillo, simplemente hay que escribir mkdir y seguido el nombre del directorio que quiero crear

  5. ¿Por qué es importante la visualización en el análisis de datos? La visualización de datos es una herramienta básica para el analista o científico de datos ya que le permite transformar y componer un modelo lógico de los datos. En este sentido, apoyándose en la visualización el analista va a descubrir todo lo que hay más allá de los datos.

Entre otras cosas, la visualización de datos permite: descartar aquellos datos poco representativos o erróneos, identificar aquellas variables que dependen unas de otras y por lo tanto contienen información redundante realizar cortes a los datos para poder observarlos desde diferentes perspectivas y, finalmente, comprobar que aquellos modelos, tendencias, predicciones y agrupaciones que hemos aplicado sobre los datos, nos devuelven el resultado esperado.

  1. ¿Qué es una API? Pon algún ejemplo. Es una interfaz de programación de acceso. Algo así como los códigos para comunicarse con una web. Una de las APIs más sencillas y conocidas es HTTP. Esta API cuenta con 4 acciones posibles : POST, publicar o crear. Es cuando se crea un documento nuevo. GET, obtener o bajarse. Es lo que hacemos cuando vemos una página web, solicitamos una copia de la web al servidor. DELETE, borrar el documento. PUT, actualiza un documento ya existente.

  2. Pon un ejemplo de "operadores" que hemos utilizado o bien en la terminal o en buscadores de la Web. Los operadores sirven para restringir las búsquedas. Un ejemplo es el operador OR. Este operador busca X o Y y devolverá resultados relacionados con X ó Y, o ambos. Nota. Por otro lado, el operador de barra vertical (|) puede también ser utilizado en lugar de “OR”.

  3. Nombra tres figuras destacadas del periodismo y la visualización de datos y comenta quiénes son, qué hacen, sus proyectos.

Florence Nightingale: Enfermera, escritora y estadística. Considerada pionera de la enfermería moderna. Creadora del primer modelo conceptual de enfermería. John Snow: Fue un brillante médico inglés. Los sucesivos brotes de cólera que afectaron a la ciudad de Londres, lo motivaron a estudiar esta enfermedad desde un punto de vista poblacional, relacionando la incidencia de casos al consumo de aguas contaminadas por una "materia mórbida", responsable de la diarrea aguda con deshidratación que la caracteriza.Fue pionero en el uso de metodologías de investigación epidemiológica moderna, por ejemplo, la implementación de encuestas y la epidemiología espacial. Con justa razón, hoy en día es considerado por la comunidad científica como el padre de la epidemiología moderna. Philip Meyer. El gran referente del periodismo de precisión. En 1967, Meyer, siendo periodista en el Detroit Free Press utilizó un ordenador central para demostrar que las personas que habían cursado estudios universitarios tenían las mismas posibilidades de haber asistido y provocado los disturbios que aquellos sin título de secundaria.

  1. ¿Qué es Bootstrap? Bootstrap es una biblioteca multiplataforma o conjunto de herramientas de código abierto para diseño de sitios web y aplicaciones web. Contiene plantillas de diseño con tipografía, formularios, botones, cuadros, menús de navegación y otros elementos de diseño basado en HTML y CSS, así como extensiones de JavaScript adicionales. Fue en esta plataforma donde descargamos las plantillas para el diseño de nuestro HTML.

  2. ¿Cuál fue el comienzo del CAR (Computer Assisted Reporting)?

Varios investigadores han argumentado que la aparición de los CAR comenzó en 1952, cuando la televisión CBS usó la computadora UNIVAC I para analizar los resultados de las elecciones presidenciales de EE. UU . Por otro lado, uno de los primeros ejemplos claros de CAR se produjo en 1967, después de los disturbios en Detroit. Fue entonces cuando Philip Meyer de Detroit Free Press usó una computadora central para mostrar que las personas que habían asistido a la universidad tenían la misma probabilidad de haber participado en los disturbios que los que habían abandonado la escuela secundaria. Así bien, el CAR se ha desarrollado enormemente desde la década de 1950. De esta forma, las bases de datos se convirtieron en el centro del trabajo del periodista en la década de 1980. Philip Meyer argumentó que un periodista debe hacer uso de bases de datos y encuestas, y ambas deben ser asistidas por computadora. En el año 2002, Meyer fue más allá y afirmó que “un periodista tiene que ser gestor de bases de datos”.

Los CAR ahora son omnipresentes

  1. Explica la diferencia entre filas y columnas Las filas son un grupo de celdas dispuestas horizontalmente para proporcionar uniformidad. En cambio, las columnas son un grupo de celdas alineadas verticalmente y van de arriba a abajo.

  2. ¿Qué ha sido determinante para el nacimiento del periodismo de datos moderno? La abundancia de software de código abierto, HTML5 y Open Data.

  3. Apunta tres comandos que hayas utilizado y para qué.

lynx ( y url) para ver una web. lynx -source (y url):para descargar una web whoami :para saber el nombre de mi usuario

  1. ¿Qué significa TSV? Son las siglas del inglés de tab separed values. Su traducción al castellano es valores separados por tabulaciones. Los ficheros TSV son un tipo de documento sencillo para representar datos en forma de tabla, en los que las columnas se separan por tabulaciones y las filas por saltos de línea.

  2. Cuál es la diferencia entre XLS y XLSX. Explica la respuesta

Por un lado, XLS toma la información en disposición binaria mientras que XLSX toma la información en un registro de tela de material textual usando XML. Por otro lado, XLS es legible con variantes de Microsoft Excel, mientras que XLSX es legible por modelo 2007 de Microsoft Excel y adelante. Además, XLSX tiene la capacidad de educar la información en XLS, pero viceversa, tal vez no debería ser prospectivo. Por último, XLS está a punto de contener todos los relojes que contienen macros o incluso nunca, mientras que XLSX no debería tener éxito para ayudar mucho a las macros.

  1. ¿Quién es Philip Meyer?

Meyer es un periodista, profesor y escritor estadounidense. El estadounidense trabajó como columnista durante 26 años.

En 1968 ganó el Premio Pulitzer en periodismo local y noticias de última hora por informar sobre las causas de los disturbios negros de Detroit de 1967. Meyer utilizó una computadora central para mostrar que las personas que habían cursado estudios universitarios tenían las mismas posibilidades de haber asistido y provocado los disturbios que aquellos sin título de secundaria.

En 1968-1969 obtuvo la beca Nieman y se tomó un año sabático para estudiar Sociología, Estadística y métodos de investigación psicosociológica en la Universidad de Harvard. Al final de esa experiencia publicó el libro: periodismo de precisión. Ese libro fue un precursor del uso de computadoras y análisis de datos para la práctica de la información periodística 101. ¿Quién fue Florence Nightingale?

Una enfermera, escritora y estadística británica. El mayor reconocimiento a Florence Nightingale vino por su labor en la Guerra de Crimea. Florence, como responsable de un grupo de 38 enfermeras, fue enviada al campo de batalla para atender a los heridos

Nightingales es considerada pionera de la enfermería moderna y creadora del primer modelo conceptual de enfermería. En este sentido, utilizó la representación visual de la información. Es preciso destacar el diagrama de Nightingale, donde se mostraron las causas de la mortalidad del ejército inglés y reflejó toda la información que recopiló durante su estancia en Crimea. Florence fue la primera mujer nombrada miembro de la Royal Statistical Society y también formó parte de la American Statistical Association.