Hey Joshua,
you've done a great job, thank you!
I've added just a few small indicators:
Actors
const PERSINST_INDICATORS_DISALLOWED = [
"Unbekannt",
"unbekannt",
"Anonymus",
"Anonym",
"n.n.",
"N.N.",
"Künstler, unbekannt",
"Unbekannte Person",
"Unbekannter Maler",
"Unbekannter Künstler",
"nicht benannt",
"nomen nominandum",
"Nomen Nominandum",
"ismeretlen",
"Ismeretlen",
"ismeretlen.",
"Ismeretlen.",
"ism.",
"невизначена", // "Uncertain" (ukr)
"невизначений", // "Unspecified" (ukr)
"не встановлено", // "Not established" (ukr)
"невизначено", // "Not established" (ukr)
"Невідом", // Unknown
"невизн", // Unknown
"Не визначен", // Not determined
"Невідомий артист", // Unknown artist
];
const PERSINST_UNCERTAINTY_PREFIXES = [
"verm. ",
"Verm. ",
"vermtl. ",
"Vermtl. ",
"vermutl. ",
"Vermutl. ",
"vermutlich ",
"Vermutlich ",
"wahrscheinlich ",
"Wahrscheinlich ",
"wohl ",
"Wohl ",
"?",
];
const PERSINST_UNCERTAINTY_SUFFIXES = [
"(?)",
"?",
" [vermutlich]",
" [verm.]",
" [wahrscheinlich]",
];
Times
const TIME_INDICATORS_DISALLOWED = [
"Nachgewiesen",
"nachgewiesen",
"o.D.",
"O.D.",
"o.J.",
"O.J.",
"o. D.",
"O. D.",
"o. J.",
"O. J.",
"Ohne Datum",
"ohne Datum",
"Ohne Jahr",
"ohne Jahr",
"Unbekannt",
"unbekannt",
"ismeretlen",
"Ismeretlen",
"Neu",
"Neu hergestellt",
"zeitl. nicht faßbar",
"Без року", // Without a year
"Без дати", // Unknown date
"Не датовано", // Not dated
"Н.д.", // Not dated
"Без датування", // No dating
"б.р.", // No dating
"б.д.", // No dating
];
const TIME_UNCERTAINTY_PREFIXES = [
"c. ",
"ca ",
"ca. ",
"Ca ",
"Ca. ",
"za. ",
"~",
"circa ",
"gegen ",
"um ",
"Um ",
"verm. ",
"Verm. ",
"vermtl. ",
"Vermtl. ",
"vermutl. ",
"Vermutl. ",
"vermutlich ",
"Vermutlich ",
"vermutlich um ",
"Vermutlich um ",
"wohl ",
"wohl um ",
"Wohl ",
"Wohl um ",
"Приблизно", // UK: About / approximately
"близько", // UK: About
"около", // UK: About
"коло", // UK: About
"неточно", // UK: Inaccurate
"майже", // UK: Almost / nearly / about
"орієнтовно", // UK: approximately
"Прибл.", // UK: approximately
];
const TIME_UNCERTAINTY_SUFFIXES = [
"(?)",
"?",
" (ca.)",
" [ca.]",
" (circa)",
" [circa]",
" (verm.)",
" (vermutl.)",
" körül",
", um",
" (um)",
" (ок.)",
];
Places
/**
* Substrings used to express uncertainty about the validity of a place name.
*/
const PLACE_INDICATORS_DISALLOWED = [
"Unbekannt",
"unbekannt",
"Unknown",
"unknown",
"keine Angaben",
"Keine Angaben",
"nicht benannt",
"ohne Angabe",
"Ohne Angabe",
"Ohne Ort",
"ismeretlen",
"Ismeretlen",
"ism.",
"o.O",
"versch. O.",
"o. O.",
"Diverse O. u. o.O.",
"o.O.",
"Без місця", // No place
"не вказано", // No place
"не вказане", // No place
"невідоме", // No place
];
const PLACE_UNCERTAINTY_PREFIXES = [
"ca ",
"ca. ",
"circa ",
"evtl ",
"evtl. ",
"vlt. ",
"verm. ",
"vermut. ",
"vermtl. ",
"vermutl. ",
"Vermutl. ",
"vermutlich ",
"vermutlich: ",
"Vermutlich ",
"Vermutlich: ",
"wohl ",
"Wohl ",
"wahrsch. ",
"Wahrsch. ",
"wahrscheinlich ",
"Wahrscheinlich ",
"можливо",
"?",
];
const PLACE_UNCERTAINTY_SUFFIXES = [
"(?)",
"(vermutl.)",
"[vermutl.]",
"(vermutlich)",
"[vermutlich]",
"(wohl)",
"[wohl]",
"?",
];