[search] Improve search synonyms spanish

Signed-off-by: patepelo <developing.anton@gmail.com>
This commit is contained in:
patepelo
2025-11-13 01:13:23 +07:00
committed by x7z4w
parent 6d0111b434
commit e862da648e

View File

@@ -3,8 +3,8 @@
#include "search/ranking_utils.hpp" #include "search/ranking_utils.hpp"
#include "search/token_range.hpp" #include "search/token_range.hpp"
#include <unordered_map>
#include <sstream> #include <sstream>
#include <unordered_map>
namespace search namespace search
{ {
@@ -18,38 +18,77 @@ namespace
unordered_map<string, vector<string>> const kSynonyms = { unordered_map<string, vector<string>> const kSynonyms = {
/// @todo Should process synonyms with errors like "blvrd" -> "blvd". /// @todo Should process synonyms with errors like "blvrd" -> "blvd".
/// @see HouseOnStreetSynonymsWithMisprints test. /// @see HouseOnStreetSynonymsWithMisprints test.
{"1", {"pierwszy", "pierwsza", "un", "una", "pierwsze", "primo", "واحد", "حادى", "احد"}}, {"10a", {"décima"}},
{"1st", {"first"}}, {"10o", {"décimo"}},
{"", {"primo"}},
{"20", {"venti", "عشرين", "عشرون"}},
{"25", {"venticinque", "خمسه و عشرون", "خمس و عشرين"}},
{"2", {"due", "drugi", "drugie", "druga", "اثنان", "اثنين"}},
{"2nd", {"second"}},
{"3", {"trzecia", "trzecie", "tre", "trzeci", "ثلاث"}},
{"3rd", {"third"}},
{"4", {"quattro", "اربع"}},
{"4th", {"fourth"}},
{"5", {"cinque", "خمس"}},
{"5th", {"fifth"}},
{"6", {"sei", "ست"}},
{"6th", {"sixth"}},
{"7", {"sette", "سبع"}},
{"7th", {"seventh"}},
{"8", {"otto", "ثمان", "ثمانيه"}},
{"8th", {"eighth"}},
{"9", {"nove", "تسع"}},
{"9th", {"ninth"}},
{"10th", {"tenth"}}, {"10th", {"tenth"}},
{"11a", {"undécima", "decimoprimera"}},
{"11o", {"undécimo", "decimoprimero"}},
{"11th", {"eleventh"}}, {"11th", {"eleventh"}},
{"12a", {"duodécima", "decimosegunda"}},
{"12o", {"duodécimo", "decimosegundo"}},
{"12th", {"twelfth"}}, {"12th", {"twelfth"}},
{"13a", {"decimotercera"}},
{"13o", {"decimotercero"}},
{"13th", {"thirteenth"}}, {"13th", {"thirteenth"}},
{"14a", {"decimocuarta"}},
{"14o", {"decimocuarto"}},
{"14th", {"fourteenth"}}, {"14th", {"fourteenth"}},
{"15a", {"decimoquinta"}},
{"15o", {"decimoquinto"}},
{"15th", {"fifteenth"}}, {"15th", {"fifteenth"}},
{"16a", {"decimosexta"}},
{"16o", {"decimosexto"}},
{"16th", {"sixteenth"}}, {"16th", {"sixteenth"}},
{"17a", {"decimoséptima"}},
{"17o", {"decimoséptimo"}},
{"17th", {"seventeenth"}}, {"17th", {"seventeenth"}},
{"18a", {"decimoctava"}},
{"18o", {"decimoctavo"}},
{"18th", {"eighteenth"}}, {"18th", {"eighteenth"}},
{"19a", {"decimonovena"}},
{"19o", {"decimonoveno"}},
{"19th", {"nineteenth"}}, {"19th", {"nineteenth"}},
{"1a", {"primera"}},
{"1o", {"primo", "primero"}},
{"1",
{"pierwszy", "pierwsza", "un", "una", "uno", "pierwsze", "primo", "primer", "primero", "واحد", "حادى", "احد"}},
{"", {"primo", "primero"}},
{"1st", {"first"}},
{"20th", {"twentieth"}}, {"20th", {"twentieth"}},
{"20", {"venti", "veinte", "عشرين", "عشرون"}},
{"25", {"venticinque", "خمسه و عشرون", "خمس و عشرين"}},
{"2a", {"segunda"}},
{"2", {"due", "drugi", "drugie", "druga", "dos", "segunda", "segundo", "اثنان", "اثنين"}},
{"2nd", {"second"}},
{"2o", {"segundo"}},
{"3a", {"tercera"}},
{"3o", {"tercero"}},
{"3rd", {"third"}},
{"3", {"trzecia", "trzecie", "tre", "trzeci", "tres", "tercera", "tercero", "ثلاث"}},
{"4a", {"cuarta"}},
{"4o", {"cuarto"}},
{"4", {"quattro", "cuatro", "cuarta", "cuarto", "اربع"}},
{"4th", {"fourth"}},
{"5a", {"quinta"}},
{"5", {"cinque", "cinco", "quinta", "quinto", "خمس"}},
{"5o", {"quinto"}},
{"5th", {"fifth"}},
{"6a", {"sexta"}},
{"6o", {"sexto"}},
{"6", {"sei", "seis", "sexta", "secto", "ست"}},
{"6th", {"sixth"}},
{"7a", {"séptima"}},
{"7o", {"séptimo"}},
{"7", {"sette", "siete", "séptima", "séptima", "سبع"}},
{"7th", {"seventh"}},
{"8a", {"octava"}},
{"8o", {"octavo"}},
{"8", {"otto", "ocho", "octava", "octavo", "ثمان", "ثمانيه"}},
{"8th", {"eighth"}},
{"9a", {"novena"}},
{"9o", {"noveno"}},
{"9", {"nove", "nueve", "تسع", "nueve", "novena", "noveno"}},
{"9th", {"ninth"}},
{"a", {"am", "auto-estrada", "aikštė"}}, {"a", {"am", "auto-estrada", "aikštė"}},
{"abe", {"abbaye"}}, {"abe", {"abbaye"}},
{"accs", {"access"}}, {"accs", {"access"}},
@@ -96,7 +135,7 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"arb", {"arboleda"}}, {"arb", {"arboleda"}},
{"arc", {"arcade", "arcades"}}, {"arc", {"arcade", "arcades"}},
{"arq", {"arquiteto", "arquitecto"}}, {"arq", {"arquiteto", "arquitecto"}},
{"arqº", {"arquiteto", "arquitecto"}}, {"arqo", {"arquiteto", "arquitecto"}},
{"arral", {"arrabal"}}, {"arral", {"arrabal"}},
{"arry", {"arroyo"}}, {"arry", {"arroyo"}},
{"art", {"anciennes routes", "ancienne route"}}, {"art", {"anciennes routes", "ancienne route"}},
@@ -114,8 +153,8 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"auto", {"autopista"}}, {"auto", {"autopista"}},
{"autop", {"autopista"}}, {"autop", {"autopista"}},
{"autov", {"autovía", "autovia"}}, {"autov", {"autovía", "autovia"}},
{"avª", {"avenida"}},
{"av", {"avinguda", "avenida", "avenue"}}, {"av", {"avinguda", "avenida", "avenue"}},
{"ava", {"avenida"}},
{"avda", {"avinguda", "avenida"}}, {"avda", {"avinguda", "avenida"}},
{"avd", {"avinguda", "avenida"}}, {"avd", {"avinguda", "avenida"}},
{"ave", {"avenue"}}, {"ave", {"avenue"}},
@@ -164,7 +203,6 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"blvrd", {"boulevard"}}, {"blvrd", {"boulevard"}},
{"bnc", {"barranc"}}, {"bnc", {"barranc"}},
{"bnd", {"bend"}}, {"bnd", {"bend"}},
{"", {"bairro"}},
{"bo", {"barrio"}}, {"bo", {"barrio"}},
{"boul", {"boulevard"}}, {"boul", {"boulevard"}},
{"bpa", {"biskupa", "biskup"}}, {"bpa", {"biskupa", "biskup"}},
@@ -203,9 +241,11 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"byp", {"bypass"}}, {"byp", {"bypass"}},
{"bywy", {"byway"}}, {"bywy", {"byway"}},
{"cac", {"cacique"}}, {"cac", {"cacique"}},
{"cª", {"companhia"}}, {"ca", {"compañía anónima","companhia", "compañía"}},
{"cad", {"cadde"}},
{"cal", {"calea"}}, {"cal", {"calea"}},
{"cale", {"cale"}}, {"cale", {"cale"}},
{"call", {"calleja", "callejón"}},
{"callej", {"callejón"}}, {"callej", {"callejón"}},
{"cam", {"caminho", "camino"}}, {"cam", {"caminho", "camino"}},
{"campg", {"camping"}}, {"campg", {"camping"}},
@@ -223,13 +263,11 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"cav", {"cavée"}}, {"cav", {"cavée"}},
{"cbtiz", {"cobertizo"}}, {"cbtiz", {"cobertizo"}},
{"cc", {"calçada", "centro comercial"}}, {"cc", {"calçada", "centro comercial"}},
{"call", {"calleja", "callejón"}},
{"c", {"cesta", "carrer", "calle", "centre"}}, {"c", {"cesta", "carrer", "calle", "centre"}},
{"cckq", {"căn cứ không quân"}}, {"cckq", {"căn cứ không quân"}},
{"ccnh", {"calçadinha"}}, {"ccnh", {"calçadinha"}},
{"cct", {"circuit"}}, {"cct", {"circuit"}},
{"ccvcn", {"circunvalación"}}, {"ccvcn", {"circunvalación"}},
{"cad", {"cadde"}},
{"cd", {"cadde", "caddesi"}}, {"cd", {"cadde", "caddesi"}},
{"", {"cao đẳng"}}, {"", {"cao đẳng"}},
{"cds", {"cul-de-sac"}}, {"cds", {"cul-de-sac"}},
@@ -331,8 +369,8 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"crtil", {"carretil"}}, {"crtil", {"carretil"}},
{"crtjo", {"cortijo"}}, {"crtjo", {"cortijo"}},
{"csac", {"cul-de-sac"}}, {"csac", {"cul-de-sac"}},
{"cs", {"cross"}},
{"čs", {"československé", "československého", "československých"}}, {"čs", {"československé", "československého", "československých"}},
{"cs", {"cross"}},
{"csg", {"crossing"}}, {"csg", {"crossing"}},
{"csl", {"casal"}}, {"csl", {"casal"}},
{"čsl", {"československej", "československé", "československého", "československých"}}, {"čsl", {"československej", "československé", "československého", "československých"}},
@@ -352,6 +390,8 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"cty", {"city", "công ty"}}, {"cty", {"city", "công ty"}},
{"cty cp", {"công ty cổ phần"}}, {"cty cp", {"công ty cổ phần"}},
{"ctyd", {"courtyard"}}, {"ctyd", {"courtyard"}},
{"cuarta", {"4", "4a"}},
{"cuarto", {"4", "4o"}},
{"cutt", {"cutting"}}, {"cutt", {"cutting"}},
{"cv", {"công viên", "cove", "cave"}}, {"cv", {"công viên", "cove", "cave"}},
{"cve", {"curve"}}, {"cve", {"curve"}},
@@ -360,7 +400,7 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"cway", {"causeway"}}, {"cway", {"causeway"}},
{"cyd", {"courtyard"}}, {"cyd", {"courtyard"}},
{"czada", {"calzada"}}, {"czada", {"calzada"}},
{"dª", {"dona"}}, {"da", {"dona"}},
{"dars", {"darse"}}, {"dars", {"darse"}},
{"dav", {"deutscher alpenverein"}}, {"dav", {"deutscher alpenverein"}},
{"d´", {"de"}}, {"d´", {"de"}},
@@ -388,7 +428,6 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"dom", {"domaine", "domaines"}}, {"dom", {"domaine", "domaines"}},
{"dq", {"duque"}}, {"dq", {"duque"}},
{"dra", {"doctora", "doutora"}}, {"dra", {"doctora", "doutora"}},
{"drª", {"doutora"}},
{"dr", {"doktora", "doktorky", "doktor", "dokter", "doctor", "drive", "doutora", "doutor", "doktora"}}, {"dr", {"doktora", "doktorky", "doktor", "dokter", "doctor", "drive", "doutora", "doutor", "doktora"}},
{"drec", {"drecera"}}, {"drec", {"drecera"}},
{"drs", {"doctorandus"}}, {"drs", {"doctorandus"}},
@@ -419,8 +458,8 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"egl", {"église"}}, {"egl", {"église"}},
{"égl", {"église"}}, {"égl", {"église"}},
{"ehem", {"ehemalige", "ehemaliger", "ehemaliges"}}, {"ehem", {"ehemalige", "ehemaliger", "ehemaliges"}},
{"eighth", {"8th"}},
{"eighteenth", {"18th"}}, {"eighteenth", {"18th"}},
{"eighth", {"8th"}},
{"elb", {"elbow"}}, {"elb", {"elbow"}},
{"eleventh", {"11th"}}, {"eleventh", {"11th"}},
{"emb", {"embaixador"}}, {"emb", {"embaixador"}},
@@ -430,10 +469,10 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"en", {"estrada nacional", "enceinte"}}, {"en", {"estrada nacional", "enceinte"}},
{"enf", {"enfermeiro"}}, {"enf", {"enfermeiro"}},
{"enfo", {"enfermeiro"}}, {"enfo", {"enfermeiro"}},
{"enfº", {"enfermeiro"}}, {"enfo", {"enfermeiro"}},
{"engª", {"engenheira"}}, {"enga", {"engenheira"}},
{"eng", {"engenheira", "engenheiro"}}, {"eng", {"engenheira", "engenheiro"}},
{"engº", {"engenheiro"}}, {"engo", {"engenheiro"}},
{"entd", {"entrada"}}, {"entd", {"entrada"}},
{"ent", {"entrance"}}, {"ent", {"entrance"}},
{"entl", {"entresòl"}}, {"entl", {"entresòl"}},
@@ -482,10 +521,10 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"ff", {"freiwillige feuerwehr"}}, {"ff", {"freiwillige feuerwehr"}},
{"fg", {"faubourg"}}, {"fg", {"faubourg"}},
{"fh", {"fachhochschule", "forsthaus"}}, {"fh", {"fachhochschule", "forsthaus"}},
{"fit", {"firetrail"}},
{"fifth", {"5th"}},
{"fifteenth", {"15th"}}, {"fifteenth", {"15th"}},
{"fifth", {"5th"}},
{"first", {"1st"}}, {"first", {"1st"}},
{"fit", {"firetrail"}},
{"flat", {"flat"}}, {"flat", {"flat"}},
{"fl", {"flat"}}, {"fl", {"flat"}},
{"fnd", {"fundătura"}}, {"fnd", {"fundătura"}},
@@ -493,8 +532,8 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"fon", {"fontaine"}}, {"fon", {"fontaine"}},
{"form", {"forum", "formation"}}, {"form", {"forum", "formation"}},
{"fos", {"fosses", "fosse"}}, {"fos", {"fosses", "fosse"}},
{"fourth", {"4th"}},
{"fourteenth", {"14th"}}, {"fourteenth", {"14th"}},
{"fourth", {"4th"}},
{"foyr", {"foyer"}}, {"foyr", {"foyer"}},
{"fr", {"father", "frontage", "frei"}}, {"fr", {"father", "frontage", "frei"}},
{"frm", {"ferme", "fermes"}}, {"frm", {"ferme", "fermes"}},
@@ -540,7 +579,9 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"gpt", {"groupement"}}, {"gpt", {"groupement"}},
{"gra", {"grange"}}, {"gra", {"grange"}},
{"grg", {"gymnasium und realgymnasium"}}, {"grg", {"gymnasium und realgymnasium"}},
{"gr", {"grande rue", "grandes rues", "gracht", "grandrue", "gränd", "graben", "grovet", "gränden", "grove", "großes", "große", "großer"}}, {"gr",
{"grande rue", "grandes rues", "gracht", "grandrue", "gränd", "graben", "grovet", "gränden", "grove", "großes",
"große", "großer"}},
{"gri", {"grille"}}, {"gri", {"grille"}},
{"grim", {"grimpette"}}, {"grim", {"grimpette"}},
{"grnd", {"ground"}}, {"grnd", {"ground"}},
@@ -593,11 +634,11 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"ii", {"seconda", "drugi", "druga", "secondo", "segundo", "drugie"}}, {"ii", {"seconda", "drugi", "druga", "secondo", "segundo", "drugie"}},
{"ile", {"île"}}, {"ile", {"île"}},
{"ima", {"irmã"}}, {"ima", {"irmã"}},
{"imª", {"irmã"}}, {"ima", {"irmã"}},
{"im", {"irmã", "irmão"}}, {"im", {"irmã", "irmão"}},
{"imm", {"immeubles", "immeuble"}}, {"imm", {"immeubles", "immeuble"}},
{"imo", {"irmão"}}, {"imo", {"irmão"}},
{"imº", {"irmão"}}, {"imo", {"irmão"}},
{"imp", {"impasse", "impasses"}}, {"imp", {"impasse", "impasses"}},
{"ind", {"industrial"}}, {"ind", {"industrial"}},
{"inf", {"infante"}}, {"inf", {"infante"}},
@@ -750,26 +791,28 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"mw", {"mews"}}, {"mw", {"mews"}},
{"mwy", {"motorway"}}, {"mwy", {"motorway"}},
{"mz", {"manzana"}}, {"mz", {"manzana"}},
{"nábr", {"nábrežie"}},
{"nábř", {"nábřeží"}}, {"nábř", {"nábřeží"}},
{"nábr", {"nábrežie"}},
{"nac", {"nacional"}}, {"nac", {"nacional"}},
{"nám", {"námestie", "náměstí"}}, {"nám", {"námestie", "náměstí"}},
{"n:a", {"norra"}}, {"n:a", {"norra"}},
{"nª", {"nossa"}}, {"na", {"nossa"}},
{"nd", {"niedere", "niederes", "niederer"}}, {"nd", {"niedere", "niederes", "niederer"}},
{"ndr", {"nordre"}}, {"ndr", {"nordre"}},
{"ne", {"northeast"}}, {"ne", {"northeast"}},
{"nh", {"nhà hát"}}, {"nh", {"nhà hát"}},
{"nhs", {"national high school"}}, {"nhs", {"national high school"}},
{"ninth", {"9th"}},
{"nineteenth", {"19th"}}, {"nineteenth", {"19th"}},
{"ninth", {"9th"}},
{"nk", {"nook"}}, {"nk", {"nook"}},
{"nms", {"neue mittelschule"}}, {"nms", {"neue mittelschule"}},
{"n", {"nowy", "nowa", "nossa", "norra", "número", "north", "nosso", "nacional", "nowe"}}, {"n", {"nowy", "nowa", "nossa", "norra", "número", "north", "nosso", "nacional", "nowe"}},
{"", {"niederösterreichischer", "niederösterreichisches", "niederösterreich", "niederösterreichische"}}, {"", {"niederösterreichischer", "niederösterreichisches", "niederösterreich", "niederösterreichische"}},
{"nº", {"número"}}, {"no", {"número"}},
{"nook", {"nook"}}, {"nook", {"nook"}},
{"nördl", {"nördlicher", "nördliche", "nördliches"}}, {"nördl", {"nördlicher", "nördliche", "nördliches"}},
{"novena", {"9", "9a"}},
{"noveno", {"9", "9o"}},
{"no", {"சாலை", "salai", "nomor", "vazhi", "வழி"}}, {"no", {"சாலை", "salai", "nomor", "vazhi", "வழி"}},
{"np", {"nationalpark", "national park"}}, {"np", {"nationalpark", "national park"}},
{"nra", {"national recreation area"}}, {"nra", {"national recreation area"}},
@@ -789,6 +832,8 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"öav", {"österreichischer alpenverein"}}, {"öav", {"österreichischer alpenverein"}},
{"obj", {"objekt"}}, {"obj", {"objekt"}},
{"ob", {"oberer", "obere", "oberes"}}, {"ob", {"oberer", "obere", "oberes"}},
{"octava", {"8", "8a"}},
{"octavo", {"8", "8o"}},
{"ögv", {"österreichischer gebirgsverein"}}, {"ögv", {"österreichischer gebirgsverein"}},
{"olv", {"onze-lieve-vrouw"}}, {"olv", {"onze-lieve-vrouw"}},
{"o", {"ob"}}, {"o", {"ob"}},
@@ -828,7 +873,7 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"pcp", {"police community precinct"}}, {"pcp", {"police community precinct"}},
{"pc", {"praça"}}, {"pc", {"praça"}},
{"", {"praça"}}, {"", {"praça"}},
{"pctª", {"praceta"}}, {"pcta", {"praceta"}},
{"pct", {"precinct", "praceta"}}, {"pct", {"precinct", "praceta"}},
{"pda", {"pujada"}}, {"pda", {"pujada"}},
{"pde", {"parade"}}, {"pde", {"parade"}},
@@ -850,8 +895,8 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"piaz", {"piazza"}}, {"piaz", {"piazza"}},
{"pim", {"petite impasse"}}, {"pim", {"petite impasse"}},
{"pi", {"polígon industrial"}}, {"pi", {"polígon industrial"}},
{"pj", {"polícia judiciária"}},
{"pje", {"pasaje"}}, {"pje", {"pasaje"}},
{"pj", {"polícia judiciária"}},
{"pkg", {"parking"}}, {"pkg", {"parking"}},
{"pkld", {"parklands"}}, {"pkld", {"parklands"}},
{"pko", {"puistikko"}}, {"pko", {"puistikko"}},
@@ -882,7 +927,7 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"pol. ind", {"polígon industrial"}}, {"pol. ind", {"polígon industrial"}},
{"pol", {"polígon"}}, {"pol", {"polígon"}},
{"pont", {"ponts", "pont"}}, {"pont", {"ponts", "pont"}},
{"po", {"post office"}}, {"po", {"post office", "paseo"}},
{"por", {"porucznika", "porucznik", "poručíka"}}, {"por", {"porucznika", "porucznik", "poručíka"}},
{"porq", {"portique", "portiques"}}, {"porq", {"portique", "portiques"}},
{"port", {"port"}}, {"port", {"port"}},
@@ -898,9 +943,11 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"pre", {"pré"}}, {"pre", {"pré"}},
{"presid", {"presidente"}}, {"presid", {"presidente"}},
{"pres", {"president"}}, {"pres", {"president"}},
{"primera", {"1", "1a"}},
{"primero", {"1", "1o"}},
{"prk", {"purok"}}, {"prk", {"purok"}},
{"prm", {"promenade"}}, {"prm", {"promenade"}},
{"profª", {"professora"}}, {"profa", {"professora"}},
{"prof", {"professora", "professor", "profesora", "profesorky", "profesor"}}, {"prof", {"professora", "professor", "profesora", "profesorky", "profesor"}},
{"proj", {"projectada", "projetada"}}, {"proj", {"projectada", "projetada"}},
{"prolng", {"prolongamento"}}, {"prolng", {"prolongamento"}},
@@ -949,6 +996,8 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"qt", {"quảng trường"}}, {"qt", {"quảng trường"}},
{"quad", {"quad"}}, {"quad", {"quad"}},
{"qua", {"quartier"}}, {"qua", {"quartier"}},
{"quinta", {"5", "5a"}},
{"quinto", {"5", "5o"}},
{"qu", {"quelle", "quai"}}, {"qu", {"quelle", "quai"}},
{"qy", {"quay", "quays"}}, {"qy", {"quay", "quays"}},
{"qys", {"quays"}}, {"qys", {"quays"}},
@@ -956,7 +1005,7 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"raid", {"raidillon"}}, {"raid", {"raidillon"}},
{"rang", {"rang"}}, {"rang", {"rang"}},
{"ra", {"ramble"}}, {"ra", {"ramble"}},
{"rª", {"ribeira"}}, {"ra", {"ribeira"}},
{"ras", {"rautatieasema"}}, {"ras", {"rautatieasema"}},
{"rbla", {"rambla"}}, {"rbla", {"rambla"}},
{"rbra", {"ribera"}}, {"rbra", {"ribera"}},
@@ -978,13 +1027,12 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"rem", {"rempart"}}, {"rem", {"rempart"}},
{"rep", {"representative"}}, {"rep", {"representative"}},
{"resid", {"residencial"}}, {"resid", {"residencial"}},
{"res", {"reservation", "reserve", "reservoir", "résidence", "résidences", "residencias", "residencia"}}, {"res", {"reservation", "reserve", "reservoir", "résidence", "résidences", "residencias", "residencia", "residencial"}},
{"rest", {"rest"}},
{"rge", {"range"}}, {"rge", {"range"}},
{"rg", {"range"}}, {"rg", {"range"}},
{"rgwy", {"ridgeway"}}, {"rgwy", {"ridgeway"}},
{"rh", {"rhein", "rạp hát"}}, {"rh", {"rhein", "rạp hát"}},
{"ribª", {"ribeira"}}, {"riba", {"ribeira"}},
{"rib", {"ribeirão", "ribeira"}}, {"rib", {"ribeirão", "ribeira"}},
{"ri", {"rise"}}, {"ri", {"rise"}},
{"rise", {"rise"}}, {"rise", {"rise"}},
@@ -1024,8 +1072,7 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"sanat", {"sanatorio"}}, {"sanat", {"sanatorio"}},
{"santu", {"santuario"}}, {"santu", {"santuario"}},
{"sarg", {"sargento"}}, {"sarg", {"sargento"}},
{"sª", {"senhora"}}, {"sa", {"sociedade anónima", "sociedad anónima","senhora"}},
{"sa", {"sociedade anónima"}},
{"s:a", {"södra"}}, {"s:a", {"södra"}},
{"savinj", {"savinjski"}}, {"savinj", {"savinjski"}},
{"sbg", {"salzburger", "salzburg"}}, {"sbg", {"salzburger", "salzburg"}},
@@ -1045,12 +1092,18 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"second", {"2nd"}}, {"second", {"2nd"}},
{"sect", {"sector"}}, {"sect", {"sector"}},
{"sedra", {"sendera"}}, {"sedra", {"sendera"}},
{"segunda", {"2", "2a"}},
{"segundo", {"2", "2o"}},
{"send", {"sendero"}}, {"send", {"sendero"}},
{"sen", {"sente", "senator", "sentiers", "sentier", "sentes"}}, {"sen", {"sente", "senator", "sentiers", "sentier", "sentes"}},
{"sent", {"sentier"}}, {"sent", {"sentier"}},
{"seventh", {"7th"}}, {"séptima", {"7", "7a"}},
{"seventeenth", {"17th"}}, {"séptimo", {"7", "7o"}},
{"se", {"southeast"}}, {"se", {"southeast"}},
{"seventeenth", {"17th"}},
{"seventh", {"7th"}},
{"sexta", {"6", "6a"}},
{"sexto", {"6", "6o"}},
{"sgda", {"sagrada"}}, {"sgda", {"sagrada"}},
{"sg", {"schottergrube", "sungai", "sandgrube"}}, {"sg", {"schottergrube", "sungai", "sandgrube"}},
{"sgt", {"sagrat", "sergeant"}}, {"sgt", {"sagrat", "sergeant"}},
@@ -1059,8 +1112,8 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"shun", {"shunt"}}, {"shun", {"shunt"}},
{"shwy", {"state highway"}}, {"shwy", {"state highway"}},
{"sídl", {"sídlisko", "sídliště"}}, {"sídl", {"sídlisko", "sídliště"}},
{"sixth", {"6th"}},
{"sixteenth", {"16th"}}, {"sixteenth", {"16th"}},
{"sixth", {"6th"}},
{"sk", {"sokak", "sokağı"}}, {"sk", {"sokak", "sokağı"}},
{"skv", {"skveras"}}, {"skv", {"skveras"}},
{"slj", {"sobre-loja"}}, {"slj", {"sobre-loja"}},
@@ -1087,14 +1140,12 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"spl", {"splaiul"}}, {"spl", {"splaiul"}},
{"sp", {"strada provinciale", "szkoła podstawowa", "splaiul", "spodnja", "spodnji", "spitze", "spodnje"}}, {"sp", {"strada provinciale", "szkoła podstawowa", "splaiul", "spodnja", "spodnji", "spitze", "spodnje"}},
{"sq", {"square", "superquadra"}}, {"sq", {"square", "superquadra"}},
{"srª", {"senhora"}},
{"sra", {"senhora", "senora", "señora"}}, {"sra", {"senhora", "senora", "señora"}},
{"sr", {"srednje", "strada regionale", "senior", "srednja", "senhor", "srednji", "señor", "sister", "state route"}}, {"sr", {"srednje", "strada regionale", "senior", "srednja", "senhor", "srednji", "señor", "sister", "state route"}},
{"s", {"santo", "senhora", "sant'", "santa", "south", "são", "san", "södra", "senhor", "see"}}, {"s", {"santo", "senhora", "sant'", "santa", "south", "são", "san", "södra", "senhor", "see"}},
{"ss", {"simpang susun", "santi", "strada statale", "saints"}}, {"ss", {"simpang susun", "santi", "strada statale", "saints"}},
{"śś", {"świętych", "święci"}}, {"śś", {"świętych", "święci"}},
{"s:ta", {"sankta"}}, {"s:ta", {"sankta"}},
{"stª", {"santa"}},
{"sta", {"santa", "station"}}, {"sta", {"santa", "station"}},
{"stas", {"santas"}}, {"stas", {"santas"}},
{"staz", {"stazione"}}, {"staz", {"stazione"}},
@@ -1105,7 +1156,6 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"sth", {"south"}}, {"sth", {"south"}},
{"stn", {"station"}}, {"stn", {"station"}},
{"sto", {"santo"}}, {"sto", {"santo"}},
{"stº", {"santo"}},
{"stos", {"santos"}}, {"stos", {"santos"}},
{"strada", {"strada"}}, {"strada", {"strada"}},
{"stra", {"strand", "strada"}}, {"stra", {"strand", "strada"}},
@@ -1136,6 +1186,8 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"tcty", {"tổng công ty"}}, {"tcty", {"tổng công ty"}},
{"ten", {"tenente"}}, {"ten", {"tenente"}},
{"tenth", {"10th"}}, {"tenth", {"10th"}},
{"tercera", {"3", "3a"}},
{"tercero", {"3", "3o"}},
{"term", {"terminal"}}, {"term", {"terminal"}},
{"terr", {"terrace"}}, {"terr", {"terrace"}},
{"ter", {"terrace"}}, {"ter", {"terrace"}},
@@ -1359,6 +1411,33 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"туп", {"тупик", "тупік"}}, {"туп", {"тупик", "тупік"}},
{"ул", {"улица"}}, {"ул", {"улица"}},
{"ш", {"шаша", "шосе", "шоссе"}}, {"ш", {"шаша", "шосе", "шоссе"}},
{"اثنان", {"2"}},
{"اثنين", {"2"}},
{"احد", {"1"}},
{"اربع", {"4"}},
{"الاحد", {"الحد"}},
{"التلات", {"الثلاثاء"}},
{"الثلاثاء", {"التلات"}},
{"الحد", {"الاحد"}},
{"تسع", {"9"}},
{"ثلاث", {"3"}},
{"ثمان", {"8"}},
{"ثمانيه", {"8"}},
{"ج", {"جامعه"}},
{"حادى", {"1"}},
{"ح", {"حى"}},
{"خمس", {"5"}},
{"د", {"دكتور"}},
{"سبع", {"7"}},
{"ست", {"6"}},
{"ش", {"شارع"}},
{"ط", {"طريق"}},
{"عشر", {"10"}},
{"عشرون", {"20"}},
{"عشرين", {"20"}},
{"ع", {"عماره"}},
{"م", {"ميدان", "مجاوره", "محطه", "موقف"}},
{"واحد", {"1"}},
{"ইউপি", {"ইউনিয়ন পরিষদ"}}, {"ইউপি", {"ইউনিয়ন পরিষদ"}},
{"একনেক", {"জাতীয় অর্থনৈতিক পরিষদের নির্বাহী কমিটি"}}, {"একনেক", {"জাতীয় অর্থনৈতিক পরিষদের নির্বাহী কমিটি"}},
{"টেশিস", {"টেলিফোন শিল্প সংস্থা"}}, {"টেশিস", {"টেলিফোন শিল্প সংস্থা"}},
@@ -1379,7 +1458,7 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"", {"医療法人"}}, {"", {"医療法人"}},
{"", {"合同会社"}}, {"", {"合同会社"}},
{"", {"合名会社"}}, {"", {"合名会社"}},
{"", {"国立大学法人", "公立大学法人","大学"}}, {"", {"国立大学法人", "公立大学法人", "大学"}},
{"", {"学校法人"}}, {"", {"学校法人"}},
{"", {"小学校"}}, {"", {"小学校"}},
{"", {"有限会社"}}, {"", {"有限会社"}},
@@ -1390,33 +1469,6 @@ unordered_map<string, vector<string>> const kSynonyms = {
{"", {"銀行"}}, {"", {"銀行"}},
{"高校", {"高等学校"}}, {"高校", {"高等学校"}},
{"", {"高等学校"}}, {"", {"高等学校"}},
{"ش", {"شارع"}},
{"ط", {"طريق"}},
{"م", {"ميدان", "مجاوره", "محطه", "موقف"}},
{"د", {"دكتور"}},
{"ج", {"جامعه"}},
{"ح", {"حى"}},
{"ع", {"عماره"}},
{"احد", {"1"}},
{"واحد", {"1"}},
{"حادى", {"1"}},
{"اثنين", {"2"}},
{"اثنان", {"2"}},
{"ثلاث", {"3"}},
{"اربع", {"4"}},
{"خمس", {"5"}},
{"ست", {"6"}},
{"سبع", {"7"}},
{"ثمان", {"8"}},
{"ثمانيه", {"8"}},
{"تسع", {"9"}},
{"عشر", {"10"}},
{"عشرين", {"20"}},
{"عشرون", {"20"}},
{"الحد", {"الاحد"}},
{"الاحد", {"الحد"}},
{"التلات", {"الثلاثاء"}},
{"الثلاثاء", {"التلات"}},
}; };
} // namespace } // namespace