Skip to content

Latest commit

 

History

History
121 lines (93 loc) · 17.5 KB

examen.md

File metadata and controls

121 lines (93 loc) · 17.5 KB

Examen teórico Periodismo de Datos

1. 100. ¿Quién es Philip Meyer?

Philip Meyer fue un periodista del Detroit Free Press que en 1967, tras los disturbios de Detroit, utilizó una computadora central para demostrar que las personas que habían cursado estudios universitarios tenían las mismas posibilidades de haber asistido y provocado los disturbios que aquellos sin título de secundaria. Para esto,realiza una encuenta con la que pretende encontrar las causas de la revuelta. Meyer se une con un equipo de dospsicólogos, una programadora informática y 50 entrevistadores y concluye la encuesta en tan solo tres semanas. El periodista sigue el método que la Universidad de Los Ángeles había utilizado en 1965 para hacer un informe sobre las revueltas en Watts.

2. 101. ¿Quién fue Florence Nightingale?

Florence Nightingale fue una enfermera, escritora y estadística. Es considerada como una pionera de la enfermería moderna y como creadora del primer modelo conceptual de enfermería. Nightingale y nombres como Charles Minard y John Snow son muy relevantes en el ámbitode la visualización de datos puesto que sus proyectos se consideran los antecedentes de esta disciplina esencial en el periodismo de datos.

3. 85. ¿Qué significa TSV?

TSV son las siglas de Tab Separated Values o valores separados por tabuladores. Los TSV son los predecesores de los CSV (Comma Separated Values o valores separados por comas).

4. 80. ¿Qué es Markdown?

Markdown es un lenguaje estructurado al igual que HTML no obstante, a veces resulta complicado leer el texto de un código HTML. Por eso Dan Gruber inventó Markdown, que tiene una sintaxis simple y además, la convierte en HTML. En Github se escribe con Markdown pero se muestra como HTML. Este examen que estoy escribiendo en la terminal a través de nano, un editor de texto, también lo estoy escribiendo en Markdown y por eso se llama examen.md.

5. 79. ¿Qué es una API? Pon algún ejemplo

Una API es una interfaz de programación de acceso o Access Programming Interface. Puede explicarse como los códigos para comunicarse con una web. HTTP (HyperText Transmission Protocol), por ejemplo, es una API universal pero cada recurso puede tener la suya propia. Twitter tiene una propia.

6. 71. Para qué usas cd y cómo

Se utiliza cd para cambiar de directorio. Por ejemplo, para situarte desde la terminal en tu directorio de Github, previamente clonado gracias al comando git clone, tiene que escribir cd seguido del nombre de tu repositorio. Una vez estés dentro de él, puedes utilizarlo para "entrar" en otras carpetas dentro del mismo. Este comando también sirve para "salir" de los directorios y para ello hay que escribir lo siguiente en la terminal:cd .. .

7. 72. Para qué usas cp y cómo

El comando cp se emplea para copiar. Su comportamiento es: cp ruta/s-origen ruta-destino. Con él se puede copiar uno o varios archivos a la vez a un destino final. Hay que tener en cuenta que cuando ponemos el nombre de los archivos o las carpetas en realidad estamos poniendo su ruta en el sistema de ficheros. Además, si copias una carperta o directorio que tiene archivos en su interior debemos copiar con la opción -r, es decir, debemos hacer una copia recursiva.

8. 73. Para qué usas mv y cómo

Este comando (mv) se utiliza para mover archivos o lo que es lo mismo, para cortar y pegar archivos en un fdestino concreto. Para ejecutarlo hay que escribir mv ruta/s-origen ruta-destino en la terminal. Al igual que el comando cp permite mover uno o varios archivos a un destino final. Se puede usar también para renombrar archivos o carpetas. Es decir, si hacemos mv hola.txt adios.txt lo que hacemos es mover el archivo hola.txt al archivo adios.txt, es decir, borrar hola.txt y crea adios.txt; y si existiera, lo sobreescribe, es decir, le cambia el nombre.

9. 74. Para qué usas mkdir y cómo

Este comando sirve para crear directorios, es decir, carpetas. Para ello, debemos escribrir mkdir "nombre del directorio" en la terminal. Este comando te permite crear más de un directorio a la vez: mkdir "carperta 1" "carpeta 2" y así sucesivamente...Con él también se puede crear una carpeta dentro de otra en una sola acción utilizando el parámetro parents (-vp). De esta forma, si escribimos mkdir -vp carpeta1/carpeta2/carpeta3 se creará carpeta1, dentro de este, carpeta2, y dentro de carpeta2, carpeta3.

10. 20. ¿Qué es nano?

Nano es un editor de texto en línea de comandos útil para modificar archivos de configuración en la terminal, crear lanzadores, e incluso para escribir código. Algunas de sus funcionalidades son las siguiente:

  • Operaciones de búsqueda y reemplazo interactivas
  • Permite las hacer y deshacer acciones
  • Coloreado de sintaxis
  • Auto sangrado
  • Desplazado suave por líneas en lugar de por pantalla
  • Permite ir directamente a un número de línea
  • Bloqueo de archivos
  • Autoguardado de archivos

11. 13. ¿Qué significa el funcionamiento "cliente-servidor"?

La arquitectura cliente-servidor es un modelo de diseño de software en el que las tareas se reparten entre los proveedores de recursos o servicios, llamados servidores, y los demandantes, llamados clientes. Un cliente realiza peticiones a otro programa, el servidor, quien le da respuesta. Algunos ejemplos de aplicaciones que usen el modelo cliente-servidor son el Correo electrónico, un Servidor de impresión y la World Wide Web. Nuestro localhost, es decir, nuestro ordenador también funciona con esta arquitectura. Nuestro ordenador se conoce a sí mismo como localhost. Localhost es el dominio y su dirección IP es 127.0.0.1 .

12. 15. ¿Cuál fue el comienzo del CAR (Computer Assited Reporting)?

La era del CAR comenzó en 1952 cuando la cadena de televisión CBS utilizó un ordenador UNIVAC I para analizar los datos electorales de EEUU. Ya en el año 67 Philip Meyer utilizó una computadora central para mostrar que la personas que habían cursado estudios universitarios tenían las mismas posibilidades de haber asistido y provocado los disturbios de Detroit de 1967 que aquellos sin título de secundaria. Posteriormente, en los años 80 las bases de datos asistidas por ordenador constituían la base del trabajo de los periodistas.

13. 8. ¿Qué saberes están implicados en periodismo de dartos. Razona la respuesta

Los tres saberes implicados en el periodismo de datos son el periodismo y solo puede haber periodismo si hay investigación; los datos, entendidos como registros electrónicos que han de ser tratados por ordenador, y la visualización de datos. Los tres son importantes pero la visualización de datos hay que entenderla no solo como producto final pues cuando se hable de visualizar también nos referimos a realizar análisis, aplicar técnicas estadísticas, programas que nos permitan sacar hipótesis y conclusiones a partir de grandes volúmenes de datos ...

14. 6. ¿Cuál es la diferencia entre Internet y la Web? Razona la respuesta

La web es un sistema que comunica información que se comparte globalmente, un espacio virtual de compartimentos que se relacionan entre sí y también podríamos definirla como una base de servidores. Un aspecto importante de la Web es que, a nivel técnico, es otro servicio de los que corren/se prestan en la red de redes que es Internet. En el caso de Internet, podríamos hablar de la clásica definición de una red de redes. Asimismo funciona gracias a los protocolos TCP/IP. TCP responde a Transmission Control Protocol o protocolo de control de la transmisión, e IP responde a Internet Protocol, resulta más familiar porque al estar conectado a una red como es una Intranet el router nos tiene que dar una dirección de la red local, una IP. En una red TCP/IP hay unos 65500 puertos de escucha o de comunicación posible. La Web utiliza uno de ellos al menos, el 80. Hay otros servicios como el correo electrónico o la mensajería instantánea que utilizan otros puertos. Es cierto que se puede acceder a servicios de correo electrónico y mensajería instantánea por la Web, eso es porque las webs también pueden ser webapps o aplicaciones web. Esas aplicaciones conectan con los servicios de correo electrónico o mensajería instantánea que operan en los otros puertos y nos los muestran en un entorno web. Actualmente funcionamos con la versión original del protocolo, la denominada IPv4, que permitía hasta 4.300 millones de direcciones. Como se vio que se iba a quedar corto se empezó a trabajar en laversión IPv6, la cual actualmente funciona también pero conviven ambas.

15. 7. ¿Qué fue determinante para el nacimiento del periodismo de datos moderno?

El periodismo de datos moderno, del que bebemos actualmente, nace en 2006-2008 gracias a la abundancia de software de código abierto, al HTML5 y al Open Data.

16. 4. ¿Qué medio de comunicación inglés es fundamental en el periodismo y la visualización de datos?

El The Guardian

17. 1. ¿Qué es el periodismo de datos? Aporta tus impresiones sobre el debate.

El periodismo de datos moderno, del que bebemos actualmente, nace en 2006-2008 con una combinación de factores: abundancia de software de código abierto, HTML5 y Open Data. Hay tres áreas implicadas en ella: el periodimo, los datos (registros electrónicos) y la visualización de datos. El debate viene por la denominación que debería tener esta disciplina. En sus inicios se conocía como periodismo guiado por datos, aunque también se conoce como periodismo de precisión, nombre conflictivo porque sugiere que las otras tipologías de periodismo no lo son; periodismo asistido por ordenador; News Nerdery; Journocoders y periodismo de bases de datos entre otros. Considero que el problema no reside en el nombre que se le de sino en que se entienda cuales son las característas que le diferencian de otros tipos de periodismos que puedan tener un nombre similar.

18. 5. ¿Qué lenguajes informáticos conoces? Razona tu rspuesta.

Los lenguajes informáticos son todos los que entiende o puede entender el ordenador (a través de software). Dentro de los lenguajes informáticos están los lenguajes estructurados, como puede ser HTML o Markdown, que sirven para estructurar documentos. Y también están los lenguajes de programación que sirven para programar acciones que haga el ordenador. Entre estos se encuentran Java, C, C#, Python o R. En la web se utiliza JavaScript que aporta interactividad.

19. 10. ¿Qué tipo de interfaces de datos hay?

Hay tres tipos de interfaces:

  • CLI de Command Line Interfaces o interfaces de línea de comandos.
  • GUI de Graphical User Interfaces o interfaces gráficas de usuario.
  • La interfaces capacitivas (las de los móviles).

20. 11. ¿Qué tipos de datos hay?

Podemos encontrar los siguientes tipos de datos:

  • Numéricos: decimales (problemas con la separación con . y ,)
  • Fecha Date: YYYY-MM-DD. Puede incluir también la hora añadiendo "Thh:mm"
  • Booleanos: 0-1; True-False; Si-No... Valores dicotómicos
  • Cadenas de caracteres o strings: Lenguaje natural (nombres, palabras...)

21. 14. ¿Qué relación tiene el formato CSV con Excel?

Tanto Excel, con su formato XLS o XLSX, como el formato CSV, se encargan de almacenar datos en formato tabulado, es decir, en columnas y filas. Diferencias entre ambos formatos: CSV es un formato para guardar información tabulada en un archivo de texto delimitado con extensión CSV, mientras que Excel es una hoja de cálculo que mantiene los archivos en su propio formato patentado, XLS o XLSX. CSV es un formato de texto sin formato con una serie de valores separados por comas, mientras que Excel es un archivo binario que contiene información sobre todas las hojas de trabajo en un libro. El archivo CSV no puede realizar operaciones en los datos, mientras que Excel sí puede realizar operaciones. Los archivos CSV son más rápidos y también consumen menos memoria. Comparando CSV con Excel, los archivos CSV se pueden abrir con cualquier editor de texto en Windows, mientras que los archivos de Excelno se pueden abrir con editores de texto, necesitan de alguna versión de Excel.

22. 3. Cuando hablamos de periodismo o visualización de datos, ¿a qué datos nos referimos? Razona la respuesta.

El periodismo de datos alude al uso de datos pero no hay que olvidar que dichos datos son registros electrónicos. El hecho de llamarlo "periodismo guiado por datos" o data driven journalism no debe menospreciar que lo importante es el periodismo. Pero hay que saber trabajar con datos como una parte más del trabajo periodístico. El Computer Assisted Reporting o periodismo asistido por ordenadores lleva funcionando en EE.UU. desde los 1950. Se habla de periodismo y visualización de datos porque entendemos que hay una línea argumental entre ambos conceptos. El periodismo de datos usa la visualización de datos tanto en la etapa de análisis como en la de presentación de resultados. A la vez son términos que no se han definido por completo.

23. 16. ¿Qué tipos de formatos de datos hay? ¿Qué similitudes y diferencias tienen?

En este caso no hablamos de las bases de datos y de SQL sino de los tres tipos de formatos de datos de ficheros que nos vamos a encontrar habitualmente:

  1. SV o valores separados por cualquier valor. Normalmente serán llamados con terminación csv incluso aunque no utilicen comas para separar los valores. Son los más sencillos, pero también los menos estandarizados. Los valores separados por comas se visualizan como una tabla simple con filas y columnas. La mayoría de los recursos disponibles en los catálogos de Datos Abiertos se encuentran en formato CSV.
  2. JSON o JavaScript Object Notation, notación de objetos JS. Son los ficheros que mejor funcionan con aplicaciones web. Utilizan la sintaxis de JS. Permiten más complejidad que los SV, por eso son más complejos de leer.
  3. XML o eXtensible Markup Language, lenguaje de marcas extensible. Son complicados de leer y es difícil trabajar con ellos.

24. 17. ¿Qué tipo de archivos de documnetos de texto conoces?

La información de un ordenador está almacenada en lo que se llaman archivos. Normalmente los archivos están formados por un nombre, un punto y una extensión. El nombre nos sirve para diferenciar unos archivos de otros y la extensión para atribuirle unas propiedades concretas. Estas propiedades asociadas o "tipo de archivo" vienen dadas por las letras que conforman la extensión. Los tipos de archivo de texto que conozco son los .txt, los .doc y los .docx.

25. 18. ¿Qué programas se pueden utilizar para usar la terminal en Windows?

Podemos utilizar Cygwin. Un emulador de la terminal POSIX en Windows, ofrece un conjunto de herramientas y programas que emulan una distribución Linux en Windows. Tiene desventajas conocidas: instalación, actualización, usabilidad de la instalación…

26. 19. ¿Qué programa sirve para gestionar programas en la terminal de OSX?

Podemos usar la terminal. Una aplicación que encontramos disponible en "Utilidades - Terminal" pero, de un tiempo a esta parte, está capada y no se puede utilizar con todo su potencial. Por ello, requiere activar Xcode.

27. 23. ¿Qué son git y Github?

Git es un sistema de control de versiones distribuido de código abierto desarrollado por Linus Torvalds, el creador de Linux. El control de versiones distribuido permite a los desarrolladores descargar un software, realizar cambios y subir la versión que han modificado. Github es un repositorio online gratuito que permite gestionar proyectos y controlar versiones de código. Es muy utilizado por desarrolladores para almacenar sus trabajos dando así la oportunidad a millones de personas de todo el mundo a cooperar en ellos. GitHub aloja tu repositorio de código y te brinda herramientas muy útiles para el trabajo en equipo, dentro de un proyecto. Además de eso, puedes contribuir a mejorar el software de los demás. Para poder alcanzar esta meta, GitHub provee de funcionalidades para hacer un fork y solicitar pulls.

28. 46. ¿Qué función tiene la almohadilla en Markdown y en un programa de la shell? Razona tu respuesta.

En los archivos de configuración de la Shell, la almohadilla que aparece al principio de línea hace referencia a un comentario, es decir, el programa no va a leer la línea. En Markdown el mismo carácter es el equivalente del elemento h1 de HTML o "encabezamiento de primer nivel", sirve para destacar tipográficamente el título.

29. 53. Pon un par de ejemplos de Google Dorls u "operadores de búsqueda"

Al igual que en la terminal se utilizan operadores, en los buscadores se ha convenido en utilizar algunas palabras clave de una forma especial para restringir la búsqueda.

  • “término de búsqueda” (las dobles comillas): fuerza una búsqueda de coincidencia exacta. Usa esto para refinar los resultados de las búsquedas ambiguas, o para excluir los sinónimos en la búsqueda de palabras sueltas.
  • OR: busca X o Y. Esto devolverá resultados relacionados con X ó Y, o ambos. Nota: El operador de barra vertical (|) puede también ser utilizado en lugar de “OR”.
  • AND: busca X y Y. Esto solo generará resultados relacionados con X y Y. Nota: En realidad no hay mucha diferencia con las búsquedas regulares, pues Google agrega por defecto el “Y” de todos modos. Pero es muy útil cuando se combina con otros operadores.
    • (asterisco): actúa como un comodín y coincidirá con cualquier palabra o frase.
  • define: es un diccionario integrado en Google, básicamente. Esto mostrará el significado de una palabra en un resultado similar a una tarjeta en las SERPs (resultados del buscador).
  • filetype: restringe los resultados a un determinado tipo de archivo. Por ejemplo, PDF, DOCX, TXT, PPT, etc.
  • site: limita los resultados a los de un sitio web específico.