Trucos para bibliotecas

Documentación para la solución de problemas que encontramos en la vida bibliotecaria.

Si quisieras contribuir escribe un correo a segutierrez (arroba) colmex.mx

Scripts en línea para ciertas tareas

Para editar textos: https://onlinetexttools.com/

Para editar CSVs https://onlinecsvtools.com/

Para PNGs https://onlinepngtools.com/

Scripts para la terminal de Windows

1) Crear una lista con los nombres de archivos en una carpeta

Abrir terminal (botón windows + escribir "terminal")
Se copia la ruta del archivo donde están tus archivos, por ejemplo: "C:\Users\xxx\Dropbox\A_Proyectos\Zapata\xxx" (que está en la barra superior de tu explorador de archivos)
En la terminal se escribe "cd" y luego botón derecho (eso hace que se pegue la ruta "C:...."). Por ejemplo:

cd C:\Users\xxx\Dropbox\A_Proyectos\Zapata\xxx

Una vez hecho esto se escribe:

dir /s > nombres_de_mis_archivos.txt

(donde dir significa "enlistar archivos"; /s significa enlistar subcarpetas; > significa "guardar en"; y después se escribe el nombre de archivo donde se va a guardar)

2) Crear una csv con los nombres de tus archivos (y sus rutas de carpeta)

Sigues los pasos 1, 2 y 3 de 1)

Una vez hecho esto se escribe:

dir /a /s /b > misarchivos.csv

(donde dir significa "enlistar archivos"; /a significa "muestra todos los archivos" (viene de "all" en inglés); /s significa "enlista las subcarpetas"; /b significa "muéstralos en formato simple" (viene de "bare" en inglés); > significa "guardar en"; y después se escribe el nombre de archivo donde se va a guardar)

Cambiar el tipo de archivo de un documento

Sigues los pasos 1, 2 y 3 de 1)

Una vez hecho esto se escribe:

ren *.tei *xml

(para cambiar todos los .tei a .xml

Quitar espacios y reemplazarlos por guiones bajos

cmd /e:on /v:on /c "for %f in ("* *.txt") do (set "n=%~nxf" & set "n=!n: =_!" & ren "%~ff" "!n!" )"

Convertir pdfs a texto

FORFILES /M *.pdf /C "cmd /c pdftotext @file"

Primero se tienen que descargar https://www.xpdfreader.com/download.html y establecer correctamente las variables de entorno. Para más detalles ver: https://prezi.com/bqmznyehjtul/extraccion-de-texto/

Scripts en R

Comparar dos colecciones y crear diagrama de Venn

Convertir calendario (.ics) a dataframe

Obtener número de vacíos por columna

Transformar YYYYMMDD a YYYY/MM/DD

Convertir carpeta con TXTs a un data frame

Scripts en python

Transformando los nombres de un archivo con acentos y eñes a ASCII

import os
import unidecode #para esto habrá que hacer pip install unidecode

src_dir = #aquí se pone la dirección de la carpeta
for file_name in os.listdir(src_dir): 
    normalized = unidecode.unidecode(file_name)
    #print(file_name, normalized)
    os.rename(os.path.join(src_dir,file_name), os.path.join(src_dir, normalized))

Agregando un prefijo a los nombres de archivo

os.chdir("")  #aquí se pone la dirección de la carpeta
os.getcwd()

from glob import glob
pre = "2011_" #<- aquí se agrega el prefijo que se quiera poner
[os.rename(f, "{}{}".format(pre, f)) for f in glob("*.pdf")]

Programas útiles

Text Mining

Orange

Instalar Anaconda para tu sistema operativo https://www.anaconda.com/download/
Instalar orange3-text: https://github.com/biolab/orange3-text

a) En el Anaconda Prompt primero añadir "add conda-forge" a tus canalees:

conda config --add channels conda-forge

b) Después se instala orange text

conda install orange3-text

c) Luego se abre el programa con:

python -m Orange.canvas

Bibliometrías

Citedby (API de Scielo con python)

Instalar con pip

pip install citedbyapi

Abrir en terminal python o abrir IDE con interpretador

from citedby import client

client.RestfulClient()

cl.citedby_doi("10.1016/j.jenvp.2005.08.002")

Bibliometrix (paquete de R)

Instalar paquete

install.packages("bibliometrix", dependencies= TRUE) ###instala el paquete bibliometrix y todas las dependencias

Leer archivo bib exportado desde Scopus

archivo <- readFiles("http://www.bibliometrix.org/datasets/savedrecs.bib")

Convertir archivo bib a df

df <- convert2df(archivo, dbsource = "scopus", format = "bibtex")

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Trucos para bibliotecas

Scripts en línea para ciertas tareas

Para editar textos: https://onlinetexttools.com/

Para editar CSVs https://onlinecsvtools.com/

Para PNGs https://onlinepngtools.com/

Scripts para la terminal de Windows

1) Crear una lista con los nombres de archivos en una carpeta

2) Crear una csv con los nombres de tus archivos (y sus rutas de carpeta)

Cambiar el tipo de archivo de un documento

Quitar espacios y reemplazarlos por guiones bajos

Convertir pdfs a texto

Scripts en R

Comparar dos colecciones y crear diagrama de Venn

Convertir calendario (.ics) a dataframe

Obtener número de vacíos por columna

Transformar YYYYMMDD a YYYY/MM/DD

Convertir carpeta con TXTs a un data frame

Scripts en python

Transformando los nombres de un archivo con acentos y eñes a ASCII

Agregando un prefijo a los nombres de archivo

Programas útiles

Text Mining

Orange

Bibliometrías

Citedby (API de Scielo con python)

Bibliometrix (paquete de R)

Files

README.md

Latest commit

History

README.md

File metadata and controls

Trucos para bibliotecas

Scripts en línea para ciertas tareas

Para editar textos: https://onlinetexttools.com/

Para editar CSVs https://onlinecsvtools.com/

Para PNGs https://onlinepngtools.com/

Scripts para la terminal de Windows

1) Crear una lista con los nombres de archivos en una carpeta

2) Crear una csv con los nombres de tus archivos (y sus rutas de carpeta)

Cambiar el tipo de archivo de un documento

Quitar espacios y reemplazarlos por guiones bajos

Convertir pdfs a texto

Scripts en R

Comparar dos colecciones y crear diagrama de Venn

Convertir calendario (.ics) a dataframe

Obtener número de vacíos por columna

Transformar YYYYMMDD a YYYY/MM/DD

Convertir carpeta con TXTs a un data frame

Scripts en python

Transformando los nombres de un archivo con acentos y eñes a ASCII

Agregando un prefijo a los nombres de archivo

Programas útiles

Text Mining

Orange

Bibliometrías

Citedby (API de Scielo con python)

Bibliometrix (paquete de R)