# Mapa de fuentes

Actualizar el mapa con los lugares donde se tomaron las muestras de trabajo de campo (https://dila-ling.github.io/pict-glotales/mapa/). Este mapa tiene la locaclización de fuentes de texto y de audio. Queremos actualizarlo con la localización de las tomas de los nuevos audios incorporados en ago-sep 2023.

- mapa:[../pict-glotales/mapa.md](../pict-glotales/mapa.md)
- datos viejos: [glotales_geoloc](https://docs.google.com/spreadsheets/d/1q_HUGbLVsyo6P6ue9J26GH4UBmwz1G8b/edit#gid=2078261815)
- datos nuevos: [palabras_en_comun_audios](https://docs.google.com/spreadsheets/d/1GtliM_yutOBnWaferOmQjVNLt_xOxz56rst6ZR9MkXc/edit#gid=1308046217), Lengua, Comunidad, Latitud, Longitud

También quiero que el mapa tome los datos de un json o de un geojson. Ver [places-by-chapter-map](../notebooks/Del-Barco-Centenera/places-by-chapter-map.ipynb) para construir un [json](https://github.com/hdlabconicet/argentina-y-conquista-del-rio-de-la-plata/blob/7825d3a9f90f4225c322964d5acf4ba067e63b61/assets/js/mapData.js) de datos var places = {'PLACENAME': 'NombreComunidad', 'SOURCES': ['Gerzenstein, 1985', 'Gerzenstein, 1994', 'Gerzenstein, 1999', 'Tacconi, 2015'], 'COLOR': '#4363d8'(según lengua), 'LAT': -25.91667, 'LNG': -57.15}, ...]. [Mapa correspondiente](https://github.com/hdlabconicet/argentina-y-conquista-del-rio-de-la-plata/blob/7825d3a9f90f4225c322964d5acf4ba067e63b61/index.html). [geojson](../argentina-y-conquista-del-rio-de-la-plata/assets/js/mapData.geo.js) y [mapa correspondiente](https://github.com/hdlabconicet/argentina-y-conquista-del-rio-de-la-plata/blob/main/index.html)

Y ver [build-source-map](../notebooks/PICT-20161038/build-source-map.ipynb) para construcción de mapa actual.

Hacer un mapa donde los colores de los marcadores indiquen la lengua. 
Colores para marcadores: https://github.com/pointhi/leaflet-color-markers

En el popup info de nombre de comunidad y fuente

In [1]:
import pandas as pd
from json import dump, load

## Datos de fuentes de audios

Acá están incluidos los datos de la tanda agosto/septiembre 2023 y los de 2019

In [2]:
sheet = "https://docs.google.com/spreadsheets/d/1GtliM_yutOBnWaferOmQjVNLt_xOxz56rst6ZR9MkXc/export?gid=1308046217&format=csv"
#sheet = "palabras_en_comun_audios.csv"

df = pd.read_csv(sheet)
df.sample(5)

Unnamed: 0,Palabra,Lengua,Español,Recorte,Archivo,Formato,Inicio (sg),Fin (sg),Código,Cita Audio,...,Cita Bibliográfica,Herramienta,Transcriptorx,Tanda,Revisorx,Fuente,Consultante,Comunidad,Latitud,Longitud
134,jɑse,nivacle,mi hija,20190723TeS025_mihija,20190723_TeS_AG_025,wav,,,Gu2019,"Gutiérrez, 2019",...,"Gutiérrez, Analía (2019) Trabajo de campo sobr...",Word,AG,2023-08,AG,DILA inv,Teo Servín,"Uj’e Lhavos, Filadelfia, Paraguay",-22.362072,-60.05007
38,ikitʲeɁ,chorote,tía,01A_tia,cinta01_A,wav,1293.655,1296.177,PP2005,"Pacor, 2005",...,"Pacor, Paola. (2005). Trabajo de campo lengua ...",Transcriber,GG-PP,2019-10,AG,DILA inv,Margarita López,"Misión Chorote 1, Tartagal, Salta",-22.522455,-63.821629
120,nuʔut,nivacle,tarde,20100831FR042_tarde,2010_08_31_FR_AG_042,wav,,,Gu2010,"Gutiérrez, 2010",...,"Gutiérrez, Analía (2010) Trabajo de campo sobr...",Word,AG,2023-08,AG,DILA inv,Félix Ramírez,"Uj’e Lhavos, Filadelfia, Paraguay",-22.362072,-60.05007
108,ofo,nivacle,paloma,20110718JR012_paloma,2011_07_18_JR_AG_012,wav,,,Gu2010,"Gutiérrez, 2010",...,"Gutiérrez, Analía (2010) Trabajo de campo sobr...",Word,AG,2023-08,AG,DILA inv,José Rojas,"Uj’e Lhavos, Filadelfia, Paraguay",-22.362072,-60.05007
18,inwoɁ,chorote,cuello,07B_cuello,cinta07_B_1,wav,710.577,713.622,PP2005,"Pacor, 2005",...,"Pacor, Paola. (2005). Trabajo de campo lengua ...",Transcriber,GG-PP,2019-10,AG,DILA inv,Enrique Díaz,"Misión Nueva Esperanza, Santa Victoria Este, S...",-22.27656,-62.71291


In [3]:
## Seleccionamos columnas
data_audios = df[['Cita Audio','Cita Bibliográfica','Lengua', 'Tanda','Comunidad', 'Latitud', 'Longitud']].drop_duplicates()
## Agregamos tipo de soporte
data_audios['Soporte'] = 'audio'
## Cambiamos nombre de columna y reordenamos para que coincida con el df de fuentes textuales
data_audios['Cita'] = data_audios['Cita Audio']
data_audios = data_audios[['Cita','Cita Bibliográfica','Lengua', 'Soporte','Comunidad', 'Latitud', 'Longitud']]
data_audios

Unnamed: 0,Cita,Cita Bibliográfica,Lengua,Soporte,Comunidad,Latitud,Longitud
0,"Bucca, 1969","Bucca, Salvador. “Elicitaciones en lenguas cho...",chorote,audio,"Misión La Paz, Santa Victoria Este, Salta",-22.368465,-62.561983
1,"Bucca, 1969","Bucca, Salvador. “Elicitaciones en lenguas cho...",nivacle,audio,"Misión La Paz, Santa Victoria Este, Salta",-22.368465,-62.561983
2,"Bucca, 1969","Bucca, Salvador. “Elicitaciones en lenguas cho...",wichi,audio,"Misión La Paz, Santa Victoria Este, Salta",-22.368465,-62.561983
3,"Gerzenstein, 1985","Gerzenstein, Ana. (1985). Elicitación. Texas, ...",maka,audio,"Asunción, Paraguay",-25.296674,-57.680663
10,"Pacor, 2005","Pacor, Paola. (2005). Trabajo de campo lengua ...",chorote,audio,"Misión Chorote 1, Tartagal, Salta",-22.522455,-63.821629
16,"Pacor, 2005","Pacor, Paola. (2005). Trabajo de campo lengua ...",chorote,audio,"Misión Nueva Esperanza, Santa Victoria Este, S...",-22.27656,-62.71291
27,"Pacor, 2005","Pacor, Paola. (2005). Trabajo de campo lengua ...",chorote,audio,"Misión Chorote 1, Tartagal, Salta",-22.522455,-63.821629
39,"Gerzenstein, 1968","Gerzenstein, Ana. (1968) ""Palabras en Chorote""...",chorote,audio,"Misión Chaqueña, Departamento General José de ...",-23.261923,-63.750051
41,"Gerzenstein,1968","Gerzenstein, Ana. (1968) ""Palabras en Chorote""...",chorote,audio,"Misión Chaqueña, Departamento General José de ...",-23.261923,-63.750051
46,"Gerzenstein, 1968","Gerzenstein, Ana. (1968) ""Palabras en Chorote""...",chorote,audio,sin datos,,


In [4]:
## Los nombres de comunidades tienen info redundante para el mapa (país y provincia)
## Los eliminamos
def normalizar_comunidad(s):
    return s.split(',')[0]

data_audios['Comunidad'] = data_audios['Comunidad'].map(normalizar_comunidad)
data_audios

Unnamed: 0,Cita,Cita Bibliográfica,Lengua,Soporte,Comunidad,Latitud,Longitud
0,"Bucca, 1969","Bucca, Salvador. “Elicitaciones en lenguas cho...",chorote,audio,Misión La Paz,-22.368465,-62.561983
1,"Bucca, 1969","Bucca, Salvador. “Elicitaciones en lenguas cho...",nivacle,audio,Misión La Paz,-22.368465,-62.561983
2,"Bucca, 1969","Bucca, Salvador. “Elicitaciones en lenguas cho...",wichi,audio,Misión La Paz,-22.368465,-62.561983
3,"Gerzenstein, 1985","Gerzenstein, Ana. (1985). Elicitación. Texas, ...",maka,audio,Asunción,-25.296674,-57.680663
10,"Pacor, 2005","Pacor, Paola. (2005). Trabajo de campo lengua ...",chorote,audio,Misión Chorote 1,-22.522455,-63.821629
16,"Pacor, 2005","Pacor, Paola. (2005). Trabajo de campo lengua ...",chorote,audio,Misión Nueva Esperanza,-22.27656,-62.71291
27,"Pacor, 2005","Pacor, Paola. (2005). Trabajo de campo lengua ...",chorote,audio,Misión Chorote 1,-22.522455,-63.821629
39,"Gerzenstein, 1968","Gerzenstein, Ana. (1968) ""Palabras en Chorote""...",chorote,audio,Misión Chaqueña,-23.261923,-63.750051
41,"Gerzenstein,1968","Gerzenstein, Ana. (1968) ""Palabras en Chorote""...",chorote,audio,Misión Chaqueña,-23.261923,-63.750051
46,"Gerzenstein, 1968","Gerzenstein, Ana. (1968) ""Palabras en Chorote""...",chorote,audio,sin datos,,


In [5]:
## Limpiamos 
data_audios = data_audios.dropna().drop_duplicates()
data_audios = data_audios.drop(41) # 39 y 41 son duplicados
data_audios

Unnamed: 0,Cita,Cita Bibliográfica,Lengua,Soporte,Comunidad,Latitud,Longitud
0,"Bucca, 1969","Bucca, Salvador. “Elicitaciones en lenguas cho...",chorote,audio,Misión La Paz,-22.368465,-62.561983
1,"Bucca, 1969","Bucca, Salvador. “Elicitaciones en lenguas cho...",nivacle,audio,Misión La Paz,-22.368465,-62.561983
2,"Bucca, 1969","Bucca, Salvador. “Elicitaciones en lenguas cho...",wichi,audio,Misión La Paz,-22.368465,-62.561983
3,"Gerzenstein, 1985","Gerzenstein, Ana. (1985). Elicitación. Texas, ...",maka,audio,Asunción,-25.296674,-57.680663
10,"Pacor, 2005","Pacor, Paola. (2005). Trabajo de campo lengua ...",chorote,audio,Misión Chorote 1,-22.522455,-63.821629
16,"Pacor, 2005","Pacor, Paola. (2005). Trabajo de campo lengua ...",chorote,audio,Misión Nueva Esperanza,-22.27656,-62.71291
39,"Gerzenstein, 1968","Gerzenstein, Ana. (1968) ""Palabras en Chorote""...",chorote,audio,Misión Chaqueña,-23.261923,-63.750051
48,"Gerzenstein, 1968","Gerzenstein, Ana. (1968) ""Palabras en Chorote""...",chorote,audio,Misión La Paz,-22.368465,-62.561983
88,"Gerzenstein, 1984","Gerzenstein, Ana. (1984). Elicitación. Texas, ...",maka,audio,Asunción,-25.296674,-57.680663
92,"Gutiérrez, 2010","Gutiérrez, Analía (2010) Trabajo de campo sobr...",nivacle,audio,Uj’e Lhavos,-22.362072,-60.05007


In [6]:
print(f'Tenemos {len(data_audios)} registros para fuentes de audio')

Tenemos 14 registros para fuentes de audio


## Datos de fuentes textuales

In [32]:
data_textos = pd.read_csv('../PICT-20161038/fuentes-geoloc.csv') # CAICYT

## Filtramos sólo los datos de fuentes textuales
data_textos = data_textos[ data_textos['Soporte'] == 'texto' ]

## Renombramos columnas para que coincida con el df de fuentes de audio
data_textos['Cita'] = data_textos['Cita'].str.replace('(', '').str.replace(')', '')
data_textos = data_textos.rename(columns={'Referencia':'Cita bibliográfica', 'Comunidad, locación':'Comunidad'})
data_textos

Unnamed: 0,Cita,Cita bibliográfica,Comunidad,Localización,Código,Soporte,Lengua
0,"Claesson, 2016","Claesson, Kenneth. (2016) Notas sobre el vocab...","Villamontes, Bolivia","-21.26, -63.45807",C2016,texto,wichí
1,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,Ing. Juárez Formosa,"-23.8988, -61.8546",Ne2014,texto,wichí
2,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,Laguna Yema Formosa,"-24.2539, -61.2423",Ne2014,texto,wichí
3,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,Pozo del Mortero Formosa,"-24.4031, -61.0321",Ne2014,texto,wichí
4,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,J.G.Bazán Formosa,"-24.5422, -60.8312",Ne2014,texto,wichí
5,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,Las Lomitas Formosa,"-24.7075, -60.5943",Ne2014,texto,wichí
6,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,Pozo del Tigre Formosa,"-24.8958, -60.3194",Ne2014,texto,wichí
7,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,Sauzalito Chaco,"-24.4236, -61.6842",Ne2014,texto,wichí
8,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,Nueva Pompeya Chaco,"-24.92974, -61.48659",Ne2014,texto,wichí
9,"Campbell y Grondona, 2007",Campbell & Grondona. (2007). Internal reconstr...,Misión La Paz,"-22.368464519011034, -62.56198333139355",C&G2007,texto,nivaclé


In [33]:
import re

## Normalizamos info de Comunidad
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace(' Formosa', '')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace(' Chaco', '')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace(', Bolivia', '')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace(', Paraguay', '')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace(', Asunción', '')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace('el algarrobal', 'El Algarrobal')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace('Misión la Paz', 'Misión La Paz')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace('La gracia', 'La Gracia')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace('colonia 22', 'Colonia 22')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace('Santa rosa', 'Santa Rosa')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace('La Estrella y la Bolsa', 'La Estrella y La Bolsa')
data_textos['Comunidad'] =  data_textos['Comunidad'].str.replace('Santa rosa', 'Santa Rosa')

def normalizar_comunidad(s):
    s = re.sub(r' \([^\)]+\)', '', s)
    return s

data_textos['Comunidad'] = data_textos['Comunidad'].map(normalizar_comunidad)

⚠️⚠️⚠️

PROBLEMA ASISTEMATICIDAD NOMBRES Y LOC DE COMUNIDADES

Misión Yacaré, Misión Pozo Yacaré, Misión Algarrobal, El Algarrobal, La Estrella y la Bolsa, La Bolsa

Misión chorote 1, Misión Chorote I parcela 42, Tartagal

Son la misma comunidad?

⚠️⚠️⚠️

In [35]:
## Separamos info de coordenadas en 'Latitud' y 'Longitud'
def get_lat(s):
    return float(s.split(',')[0].strip())

def get_lon(s):
    return float(s.split(',')[1].strip())

data_textos['Latitud'] = data_textos['Localización'].map(get_lat)
data_textos['Longitud'] = data_textos['Localización'].map(get_lon)

In [36]:
## Eliminamos columnas y reordenamos para que coincida con df de audios
data_textos = data_textos.drop(columns=['Localización', 'Código'])

data_textos = data_textos[['Cita', 'Cita bibliográfica', 'Lengua', 'Soporte', 'Comunidad', 'Latitud', 'Longitud']]

In [37]:
data_textos

Unnamed: 0,Cita,Cita bibliográfica,Lengua,Soporte,Comunidad,Latitud,Longitud
0,"Claesson, 2016","Claesson, Kenneth. (2016) Notas sobre el vocab...",wichí,texto,Villamontes,-21.26,-63.45807
1,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,wichí,texto,Ing. Juárez,-23.8988,-61.8546
2,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,wichí,texto,Laguna Yema,-24.2539,-61.2423
3,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,wichí,texto,Pozo del Mortero,-24.4031,-61.0321
4,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,wichí,texto,J.G.Bazán,-24.5422,-60.8312
5,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,wichí,texto,Las Lomitas,-24.7075,-60.5943
6,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,wichí,texto,Pozo del Tigre,-24.8958,-60.3194
7,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,wichí,texto,Sauzalito,-24.4236,-61.6842
8,"Nercesian, 2014",Wichi lhomtes. Estudio de la gramática y la in...,wichí,texto,Nueva Pompeya,-24.92974,-61.48659
9,"Campbell y Grondona, 2007",Campbell & Grondona. (2007). Internal reconstr...,nivaclé,texto,Misión La Paz,-22.368465,-62.561983


In [None]:
## Concatenamos df de audios con df de textos

loc_fuentes = pd.concat([data_textos, data_audios])

- agrupar fuentes por comunidad
- mapping de colores por lengua
- crear json para Leaflet