mirror of
https://codeberg.org/comaps/comaps
synced 2025-12-19 13:03:36 +00:00
[search] Add multi-token synonyms
Signed-off-by: x7z4w <x7z4w@noreply.codeberg.org> Co-authored-by: patepelo <developing.anton@gmail.com>
This commit is contained in:
@@ -32,11 +32,97 @@ std::vector<UniString> const kAllowedMisprints = {
|
||||
MakeUniString("fh"), // "Hernández" <-> "Fernández"
|
||||
};
|
||||
|
||||
std::pair<UniString, UniString> const kPreprocessReplacements[] = {
|
||||
{MakeUniString("пр-т"), MakeUniString("проспект")},
|
||||
{MakeUniString("пр-д"), MakeUniString("проезд")},
|
||||
{MakeUniString("наб-я"), MakeUniString("набережная")},
|
||||
static std::pair<UniString, UniString> const kPreprocessReplacements[] = {
|
||||
{MakeUniString("a. d."), MakeUniString("an den")},
|
||||
{MakeUniString("arm. gen"), MakeUniString("armádneho generála")},
|
||||
{MakeUniString("atr'"), MakeUniString("ambohitr'")},
|
||||
{MakeUniString("a. v."), MakeUniString("asociación vecinal")},
|
||||
{MakeUniString("a. vv."), MakeUniString("asociación de vecinos")},
|
||||
{MakeUniString("b-dul"), MakeUniString("bulevardul")},
|
||||
{MakeUniString("b.dul"), MakeUniString("bulevardul")},
|
||||
{MakeUniString("b.º"), MakeUniString("barrio")},
|
||||
{MakeUniString("b.v."), MakeUniString("bombeiros voluntários")},
|
||||
{MakeUniString("c.c."), MakeUniString("centro comercial")},
|
||||
{MakeUniString("c. e. b."), MakeUniString("ciclo do ensino básico")},
|
||||
{MakeUniString("c.e.b."), MakeUniString("ciclo do ensino básico")},
|
||||
{MakeUniString("c. h"), MakeUniString("camino hondo")},
|
||||
{MakeUniString("c.le"), MakeUniString("calle")},
|
||||
{MakeUniString("c. m."), MakeUniString("câmara municipal")},
|
||||
{MakeUniString("c.m."), MakeUniString("câmara municipal")},
|
||||
{MakeUniString("c.na"), MakeUniString("cascina")},
|
||||
{MakeUniString("c. n."), MakeUniString("camino nuevo")},
|
||||
{MakeUniString("c.po"), MakeUniString("campo")},
|
||||
{MakeUniString("c.so"), MakeUniString("corso")},
|
||||
{MakeUniString("c.te"), MakeUniString("corte")},
|
||||
{MakeUniString("c. v."), MakeUniString("camino viejo")},
|
||||
{MakeUniString("d'"), MakeUniString("de")},
|
||||
{MakeUniString("e. b."), MakeUniString("escola básica")},
|
||||
{MakeUniString("e.b."), MakeUniString("escola básica")},
|
||||
{MakeUniString("e.p."), MakeUniString("empresa pública")},
|
||||
{MakeUniString("e.t.a.r."), MakeUniString("estação de tratamento de águas residuais")},
|
||||
{MakeUniString("f. c."), MakeUniString("ferrocarril")},
|
||||
{MakeUniString("f.c."), MakeUniString("futebol clube")},
|
||||
{MakeUniString("ff. cc."), MakeUniString("ferrocarrís")},
|
||||
{MakeUniString("f.ta"), MakeUniString("fondamenta")},
|
||||
{MakeUniString("g.n.r."), MakeUniString("guarda nacional republicana")},
|
||||
{MakeUniString("g. v."), MakeUniString("gran vía")},
|
||||
{MakeUniString("i.d."), MakeUniString("in der")},
|
||||
{MakeUniString("k/s"), MakeUniString("khách sạn")},
|
||||
{MakeUniString("l.go"), MakeUniString("largo")},
|
||||
{MakeUniString("m-te"), MakeUniString("muntele")},
|
||||
{MakeUniString("n.ª s.ª"), MakeUniString("nuestra señora")},
|
||||
{MakeUniString("nat'l"), MakeUniString("national")},
|
||||
{MakeUniString("n z"), MakeUniString("noordzijde")},
|
||||
{MakeUniString("n. z"), MakeUniString("noordzijde")},
|
||||
{MakeUniString("o.l.v"), MakeUniString("onze-lieve-vrouw")},
|
||||
{MakeUniString("o z"), MakeUniString("oostzijde")},
|
||||
{MakeUniString("o. z"), MakeUniString("oostzijde")},
|
||||
{MakeUniString("pg. ind."), MakeUniString("polígono industrial")},
|
||||
{MakeUniString("p.j."), MakeUniString("polícia judiciária")},
|
||||
{MakeUniString("p. k."), MakeUniString("punto kilométrico")},
|
||||
{MakeUniString("p.le"), MakeUniString("piazzale")},
|
||||
{MakeUniString("p.º"), MakeUniString("paseo")},
|
||||
{MakeUniString("p.º mar."), MakeUniString("paseo marítimo")},
|
||||
{MakeUniString("p.s.p."), MakeUniString("polícia de segurança pública")},
|
||||
{MakeUniString("p-ta"), MakeUniString("piața")},
|
||||
{MakeUniString("p-ţa"), MakeUniString("piața")},
|
||||
{MakeUniString("p-ța"), MakeUniString("piața")},
|
||||
{MakeUniString("p.ta"), MakeUniString("porta")},
|
||||
{MakeUniString("p.te"), MakeUniString("ponte")},
|
||||
{MakeUniString("p.za"), MakeUniString("piazza")},
|
||||
{MakeUniString("p.zza"), MakeUniString("piazza")},
|
||||
{MakeUniString("r/c"), MakeUniString("rés-do-chão")},
|
||||
{MakeUniString("s.a."), MakeUniString("sociedade anónima")},
|
||||
{MakeUniString("s/àt"), MakeUniString("sobreàtic")},
|
||||
{MakeUniString("s. c."), MakeUniString("sport clube")},
|
||||
{MakeUniString("s.c."), MakeUniString("sport clube")},
|
||||
{MakeUniString("s.da"), MakeUniString("salizada")},
|
||||
{MakeUniString("s.ra"), MakeUniString("senhora")},
|
||||
{MakeUniString("sr.ª"), MakeUniString("senhora")},
|
||||
{MakeUniString("ss.ma"), MakeUniString("santissima")},
|
||||
{MakeUniString("ss.me"), MakeUniString("santissime")},
|
||||
{MakeUniString("ss.mi"), MakeUniString("santissimi")},
|
||||
{MakeUniString("ss.mo"), MakeUniString("santissimo")},
|
||||
{MakeUniString("str-la"), MakeUniString("stradela")},
|
||||
{MakeUniString("v.co"), MakeUniString("vico")},
|
||||
{MakeUniString("v. d."), MakeUniString("van de")},
|
||||
{MakeUniString("v.d"), MakeUniString("von der")},
|
||||
{MakeUniString("v.lo"), MakeUniString("vicolo")},
|
||||
{MakeUniString("w z"), MakeUniString("westzijde")},
|
||||
{MakeUniString("w. z"), MakeUniString("westzijde")},
|
||||
{MakeUniString("z z"), MakeUniString("zuidzijde")},
|
||||
{MakeUniString("z. z"), MakeUniString("zuidzijde")},
|
||||
{MakeUniString("δημ. σχ"), MakeUniString("δημοτικό σχολείο")},
|
||||
{MakeUniString("θεσ/νίκης"), MakeUniString("θεσσαλονίκης")},
|
||||
{MakeUniString("ι.μ"), MakeUniString("ιερά μονή")},
|
||||
{MakeUniString("ι.ν"), MakeUniString("ιερός ναός")},
|
||||
{MakeUniString("κων/νου"), MakeUniString("κωνσταντίνου")},
|
||||
{MakeUniString("д-р"), MakeUniString("доктор")},
|
||||
{MakeUniString("ж.к"), MakeUniString("жилищен комплекс")},
|
||||
{MakeUniString("м-н"), MakeUniString("микрорайон")},
|
||||
{MakeUniString("наб-я"), MakeUniString("набережная")},
|
||||
{MakeUniString("пр-д"), MakeUniString("проезд")},
|
||||
{MakeUniString("пр-т"), MakeUniString("проспект")},
|
||||
};
|
||||
|
||||
void TransliterateHiraganaToKatakana(UniString & s)
|
||||
|
||||
@@ -1418,97 +1418,6 @@ unordered_map<string, vector<string>> const kSynonyms = {
|
||||
{"الاحد", {"الحد"}},
|
||||
{"التلات", {"الثلاثاء"}},
|
||||
{"الثلاثاء", {"التلات"}},
|
||||
|
||||
/*
|
||||
These synonyms are currently unreachable per https://codeberg.org/comaps/comaps/issues/1242
|
||||
{"arm. gen", {"armádneho generála"}},
|
||||
{"atr'", {"ambohitr'"}},
|
||||
{"a. v", {"asociación vecinal", "asociación veciñal"}},
|
||||
{"a. vv", {"asociación de vecinos", "asociación de veciños"}},
|
||||
{"b-dul", {"bulevardul"}},
|
||||
{"b.dul", {"bulevardul"}},
|
||||
{"b.º", {"barrio"}},
|
||||
{"b.v", {"bombeiros voluntários"}},
|
||||
{"c/", {"carrer", "calle"}},
|
||||
{"c.c", {"centro comercial"}},
|
||||
{"c. e. b", {"ciclo do ensino básico"}},
|
||||
{"c.e.b", {"ciclo do ensino básico"}},
|
||||
{"c. h", {"camino hondo"}},
|
||||
{"c.le", {"calle"}},
|
||||
{"c. m", {"câmara municipal"}},
|
||||
{"c.m", {"câmara municipal"}},
|
||||
{"c.na", {"cascina"}},
|
||||
{"c. n", {"camino nuevo"}},
|
||||
{"c.po", {"campo"}},
|
||||
{"c.so", {"corso"}},
|
||||
{"c.te", {"corte"}},
|
||||
{"c. v", {"camino viejo"}},
|
||||
{"d'", {"de"}},
|
||||
{"e. b", {"escola básica"}},
|
||||
{"e.b", {"escola básica"}},
|
||||
{"e.p", {"empresa pública"}},
|
||||
{"e.t.a.r", {"estação de tratamento de águas residuais"}},
|
||||
{"f. c", {"ferrocarril", "futebol clube"}},
|
||||
{"f.c", {"futebol clube"}},
|
||||
{"ff. cc", {"ferrocarrís", "ferrocarriles"}},
|
||||
{"f.ta", {"fondamenta"}},
|
||||
{"g.n.r", {"guarda nacional republicana"}},
|
||||
{"g. v", {"gran vía"}},
|
||||
{"i.d", {"in der"}},
|
||||
{"k/s", {"khách sạn"}},
|
||||
{"l.go", {"largo"}},
|
||||
{"m-te", {"muntele"}},
|
||||
{"nat'l", {"national"}},
|
||||
{"n.ª s.ª", {"nuestra señora"}},
|
||||
{"n z", {"noordzijde"}},
|
||||
{"n. z", {"noordzijde"}},
|
||||
{"o.l.v", {"onze-lieve-vrouw"}},
|
||||
{"o z", {"oostzijde"}},
|
||||
{"o. z", {"oostzijde"}},
|
||||
{"pg. ind", {"polígono industrial"}},
|
||||
{"p.j", {"polícia judiciária"}},
|
||||
{"p.le", {"piazzale"}},
|
||||
{"p. k", {"punto kilométrico"}},
|
||||
{"p.º mar", {"paseo marítimo"}},
|
||||
{"p.º", {"paseo"}},
|
||||
{"p.s.p", {"polícia de segurança pública"}},
|
||||
{"p-ta", {"piața"}},
|
||||
{"p-ţa", {"piața"}},
|
||||
{"p-ța", {"piața"}},
|
||||
{"p.ta", {"porta", "piazzetta"}},
|
||||
{"p.te", {"ponte"}},
|
||||
{"p.za", {"piazza"}},
|
||||
{"p.zza", {"piazza"}},
|
||||
{"r/c", {"rés-do-chão"}},
|
||||
{"s.a", {"sociedade anónima"}},
|
||||
{"s/àt", {"sobreàtic"}},
|
||||
{"s. c", {"sport clube"}},
|
||||
{"s.c", {"sport clube"}},
|
||||
{"s.da", {"salizada"}},
|
||||
{"s/n", {"sense número", "sem número"}},
|
||||
{"s.ra", {"senhora"}},
|
||||
{"sr.ª", {"senhora"}},
|
||||
{"ss.ma", {"santissima"}},
|
||||
{"ss.me", {"santissime"}},
|
||||
{"ss.mi", {"santissimi"}},
|
||||
{"ss.mo", {"santissimo"}},
|
||||
{"str-la", {"stradela"}},
|
||||
{"v.co", {"vico"}},
|
||||
{"v. d.", {"van de", "van den", "van der"}},
|
||||
{"v.d", {"von der", "vor der"}},
|
||||
{"v.lo", {"vicolo"}},
|
||||
{"w z", {"westzijde"}},
|
||||
{"w. z", {"westzijde"}},
|
||||
{"z z", {"zuidzijde"}},
|
||||
{"z. z", {"zuidzijde"}},
|
||||
{"ι.μ", {"ιερά μονή"}},
|
||||
{"ι.ν", {"ιερός ναός"}},
|
||||
{"θεσ/νίκης", {"θεσσαλονίκης"}},
|
||||
{"κων/νου", {"κωνσταντίνου"}},
|
||||
{"δημ. σχ", {"δημοτικό σχολείο"}},
|
||||
{"д-р", {"доктор"}},
|
||||
{"ж.к", {"жилищен комплекс"}},
|
||||
*/
|
||||
};
|
||||
} // namespace
|
||||
|
||||
|
||||
Reference in New Issue
Block a user