Genul probabil al numelor proprii românești 1
Verifică ultimul nume din coloana <name_col_name>
după o listă de excepții 2 (nume de fete care nu se termină în 'A' și nume băieți care se termină în 'A'), dacă nu e o excepție, decide după ultima literă - A/non-A
usage: python gender-assumer.py <path/to/input_file.csv> <name_col>
unde <name_col>
(int) e indexul coloanei cu nume proprii, din care se ghicește genul
output csv: <path/to>/gender-assumed/<input_file>+gen.csv
[1] Întru verificarea respectării regulii de reprezentare a ambelor sexe pe listele electorale (Legea 115/2015, Legea 208/2015)
Listele de candidați pentru alegerea consiliilor locale și a consiliilor județene / senatorilor şi deputaţilor trebuie întocmite astfel încât să asigure reprezentarea ambelor sexe, cu excepția acelora care conțin un singur candidat.
[2] sursă: BEC 2016
PS. Am remarcat ulterior că de fapt exista și lead-ratings/gender-guesser (internațional, incl RO), vezi gender-guesser.py - la o primă vedere pare mai puțin eficient. Vezi și namsor.app
Derivative works:
- Candidații la alegerile locale din iunie 2024
- Alegeri locale septembrie 2020 - prezenta femeilor pe listele partidelor si aliantelor politice (Tableau Dashboard)
- Analize EFOR: Alegeri cu liste de candidați la consiliul local care încalcă legea; Participarea femeilor la alegerile locale din 2020; Participarea femeilor la alegerile parlamentare din 2020
- Sexul candidaților (hartă Leaflet, WIP, buggy)