diff --git a/libs/indexer/search_string_utils.cpp b/libs/indexer/search_string_utils.cpp index 715500188..64d5bfabf 100644 --- a/libs/indexer/search_string_utils.cpp +++ b/libs/indexer/search_string_utils.cpp @@ -32,11 +32,97 @@ std::vector const kAllowedMisprints = { MakeUniString("fh"), // "Hernández" <-> "Fernández" }; -std::pair const kPreprocessReplacements[] = { - {MakeUniString("пр-т"), MakeUniString("проспект")}, - {MakeUniString("пр-д"), MakeUniString("проезд")}, - {MakeUniString("наб-я"), MakeUniString("набережная")}, +static std::pair const kPreprocessReplacements[] = { + {MakeUniString("a. d."), MakeUniString("an den")}, + {MakeUniString("arm. gen"), MakeUniString("armádneho generála")}, + {MakeUniString("atr'"), MakeUniString("ambohitr'")}, + {MakeUniString("a. v."), MakeUniString("asociación vecinal")}, + {MakeUniString("a. vv."), MakeUniString("asociación de vecinos")}, + {MakeUniString("b-dul"), MakeUniString("bulevardul")}, + {MakeUniString("b.dul"), MakeUniString("bulevardul")}, + {MakeUniString("b.º"), MakeUniString("barrio")}, + {MakeUniString("b.v."), MakeUniString("bombeiros voluntários")}, + {MakeUniString("c.c."), MakeUniString("centro comercial")}, + {MakeUniString("c. e. b."), MakeUniString("ciclo do ensino básico")}, + {MakeUniString("c.e.b."), MakeUniString("ciclo do ensino básico")}, + {MakeUniString("c. h"), MakeUniString("camino hondo")}, + {MakeUniString("c.le"), MakeUniString("calle")}, + {MakeUniString("c. m."), MakeUniString("câmara municipal")}, + {MakeUniString("c.m."), MakeUniString("câmara municipal")}, + {MakeUniString("c.na"), MakeUniString("cascina")}, + {MakeUniString("c. n."), MakeUniString("camino nuevo")}, + {MakeUniString("c.po"), MakeUniString("campo")}, + {MakeUniString("c.so"), MakeUniString("corso")}, + {MakeUniString("c.te"), MakeUniString("corte")}, + {MakeUniString("c. v."), MakeUniString("camino viejo")}, + {MakeUniString("d'"), MakeUniString("de")}, + {MakeUniString("e. b."), MakeUniString("escola básica")}, + {MakeUniString("e.b."), MakeUniString("escola básica")}, + {MakeUniString("e.p."), MakeUniString("empresa pública")}, + {MakeUniString("e.t.a.r."), MakeUniString("estação de tratamento de águas residuais")}, + {MakeUniString("f. c."), MakeUniString("ferrocarril")}, + {MakeUniString("f.c."), MakeUniString("futebol clube")}, + {MakeUniString("ff. cc."), MakeUniString("ferrocarrís")}, + {MakeUniString("f.ta"), MakeUniString("fondamenta")}, + {MakeUniString("g.n.r."), MakeUniString("guarda nacional republicana")}, + {MakeUniString("g. v."), MakeUniString("gran vía")}, + {MakeUniString("i.d."), MakeUniString("in der")}, + {MakeUniString("k/s"), MakeUniString("khách sạn")}, + {MakeUniString("l.go"), MakeUniString("largo")}, + {MakeUniString("m-te"), MakeUniString("muntele")}, + {MakeUniString("n.ª s.ª"), MakeUniString("nuestra señora")}, + {MakeUniString("nat'l"), MakeUniString("national")}, + {MakeUniString("n z"), MakeUniString("noordzijde")}, + {MakeUniString("n. z"), MakeUniString("noordzijde")}, + {MakeUniString("o.l.v"), MakeUniString("onze-lieve-vrouw")}, + {MakeUniString("o z"), MakeUniString("oostzijde")}, + {MakeUniString("o. z"), MakeUniString("oostzijde")}, + {MakeUniString("pg. ind."), MakeUniString("polígono industrial")}, + {MakeUniString("p.j."), MakeUniString("polícia judiciária")}, + {MakeUniString("p. k."), MakeUniString("punto kilométrico")}, + {MakeUniString("p.le"), MakeUniString("piazzale")}, + {MakeUniString("p.º"), MakeUniString("paseo")}, + {MakeUniString("p.º mar."), MakeUniString("paseo marítimo")}, + {MakeUniString("p.s.p."), MakeUniString("polícia de segurança pública")}, + {MakeUniString("p-ta"), MakeUniString("piața")}, + {MakeUniString("p-ţa"), MakeUniString("piața")}, + {MakeUniString("p-ța"), MakeUniString("piața")}, + {MakeUniString("p.ta"), MakeUniString("porta")}, + {MakeUniString("p.te"), MakeUniString("ponte")}, + {MakeUniString("p.za"), MakeUniString("piazza")}, + {MakeUniString("p.zza"), MakeUniString("piazza")}, + {MakeUniString("r/c"), MakeUniString("rés-do-chão")}, + {MakeUniString("s.a."), MakeUniString("sociedade anónima")}, + {MakeUniString("s/àt"), MakeUniString("sobreàtic")}, + {MakeUniString("s. c."), MakeUniString("sport clube")}, + {MakeUniString("s.c."), MakeUniString("sport clube")}, + {MakeUniString("s.da"), MakeUniString("salizada")}, + {MakeUniString("s.ra"), MakeUniString("senhora")}, + {MakeUniString("sr.ª"), MakeUniString("senhora")}, + {MakeUniString("ss.ma"), MakeUniString("santissima")}, + {MakeUniString("ss.me"), MakeUniString("santissime")}, + {MakeUniString("ss.mi"), MakeUniString("santissimi")}, + {MakeUniString("ss.mo"), MakeUniString("santissimo")}, + {MakeUniString("str-la"), MakeUniString("stradela")}, + {MakeUniString("v.co"), MakeUniString("vico")}, + {MakeUniString("v. d."), MakeUniString("van de")}, + {MakeUniString("v.d"), MakeUniString("von der")}, + {MakeUniString("v.lo"), MakeUniString("vicolo")}, + {MakeUniString("w z"), MakeUniString("westzijde")}, + {MakeUniString("w. z"), MakeUniString("westzijde")}, + {MakeUniString("z z"), MakeUniString("zuidzijde")}, + {MakeUniString("z. z"), MakeUniString("zuidzijde")}, + {MakeUniString("δημ. σχ"), MakeUniString("δημοτικό σχολείο")}, + {MakeUniString("θεσ/νίκης"), MakeUniString("θεσσαλονίκης")}, + {MakeUniString("ι.μ"), MakeUniString("ιερά μονή")}, + {MakeUniString("ι.ν"), MakeUniString("ιερός ναός")}, + {MakeUniString("κων/νου"), MakeUniString("κωνσταντίνου")}, + {MakeUniString("д-р"), MakeUniString("доктор")}, + {MakeUniString("ж.к"), MakeUniString("жилищен комплекс")}, {MakeUniString("м-н"), MakeUniString("микрорайон")}, + {MakeUniString("наб-я"), MakeUniString("набережная")}, + {MakeUniString("пр-д"), MakeUniString("проезд")}, + {MakeUniString("пр-т"), MakeUniString("проспект")}, }; void TransliterateHiraganaToKatakana(UniString & s) diff --git a/libs/search/query_params.cpp b/libs/search/query_params.cpp index 95dbb74aa..25f3b5e9a 100644 --- a/libs/search/query_params.cpp +++ b/libs/search/query_params.cpp @@ -1418,97 +1418,6 @@ unordered_map> const kSynonyms = { {"الاحد", {"الحد"}}, {"التلات", {"الثلاثاء"}}, {"الثلاثاء", {"التلات"}}, - - /* - These synonyms are currently unreachable per https://codeberg.org/comaps/comaps/issues/1242 - {"arm. gen", {"armádneho generála"}}, - {"atr'", {"ambohitr'"}}, - {"a. v", {"asociación vecinal", "asociación veciñal"}}, - {"a. vv", {"asociación de vecinos", "asociación de veciños"}}, - {"b-dul", {"bulevardul"}}, - {"b.dul", {"bulevardul"}}, - {"b.º", {"barrio"}}, - {"b.v", {"bombeiros voluntários"}}, - {"c/", {"carrer", "calle"}}, - {"c.c", {"centro comercial"}}, - {"c. e. b", {"ciclo do ensino básico"}}, - {"c.e.b", {"ciclo do ensino básico"}}, - {"c. h", {"camino hondo"}}, - {"c.le", {"calle"}}, - {"c. m", {"câmara municipal"}}, - {"c.m", {"câmara municipal"}}, - {"c.na", {"cascina"}}, - {"c. n", {"camino nuevo"}}, - {"c.po", {"campo"}}, - {"c.so", {"corso"}}, - {"c.te", {"corte"}}, - {"c. v", {"camino viejo"}}, - {"d'", {"de"}}, - {"e. b", {"escola básica"}}, - {"e.b", {"escola básica"}}, - {"e.p", {"empresa pública"}}, - {"e.t.a.r", {"estação de tratamento de águas residuais"}}, - {"f. c", {"ferrocarril", "futebol clube"}}, - {"f.c", {"futebol clube"}}, - {"ff. cc", {"ferrocarrís", "ferrocarriles"}}, - {"f.ta", {"fondamenta"}}, - {"g.n.r", {"guarda nacional republicana"}}, - {"g. v", {"gran vía"}}, - {"i.d", {"in der"}}, - {"k/s", {"khách sạn"}}, - {"l.go", {"largo"}}, - {"m-te", {"muntele"}}, - {"nat'l", {"national"}}, - {"n.ª s.ª", {"nuestra señora"}}, - {"n z", {"noordzijde"}}, - {"n. z", {"noordzijde"}}, - {"o.l.v", {"onze-lieve-vrouw"}}, - {"o z", {"oostzijde"}}, - {"o. z", {"oostzijde"}}, - {"pg. ind", {"polígono industrial"}}, - {"p.j", {"polícia judiciária"}}, - {"p.le", {"piazzale"}}, - {"p. k", {"punto kilométrico"}}, - {"p.º mar", {"paseo marítimo"}}, - {"p.º", {"paseo"}}, - {"p.s.p", {"polícia de segurança pública"}}, - {"p-ta", {"piața"}}, - {"p-ţa", {"piața"}}, - {"p-ța", {"piața"}}, - {"p.ta", {"porta", "piazzetta"}}, - {"p.te", {"ponte"}}, - {"p.za", {"piazza"}}, - {"p.zza", {"piazza"}}, - {"r/c", {"rés-do-chão"}}, - {"s.a", {"sociedade anónima"}}, - {"s/àt", {"sobreàtic"}}, - {"s. c", {"sport clube"}}, - {"s.c", {"sport clube"}}, - {"s.da", {"salizada"}}, - {"s/n", {"sense número", "sem número"}}, - {"s.ra", {"senhora"}}, - {"sr.ª", {"senhora"}}, - {"ss.ma", {"santissima"}}, - {"ss.me", {"santissime"}}, - {"ss.mi", {"santissimi"}}, - {"ss.mo", {"santissimo"}}, - {"str-la", {"stradela"}}, - {"v.co", {"vico"}}, - {"v. d.", {"van de", "van den", "van der"}}, - {"v.d", {"von der", "vor der"}}, - {"v.lo", {"vicolo"}}, - {"w z", {"westzijde"}}, - {"w. z", {"westzijde"}}, - {"z z", {"zuidzijde"}}, - {"z. z", {"zuidzijde"}}, - {"ι.μ", {"ιερά μονή"}}, - {"ι.ν", {"ιερός ναός"}}, - {"θεσ/νίκης", {"θεσσαλονίκης"}}, - {"κων/νου", {"κωνσταντίνου"}}, - {"δημ. σχ", {"δημοτικό σχολείο"}}, - {"д-р", {"доктор"}}, - {"ж.к", {"жилищен комплекс"}}, - */ }; } // namespace