diff --git a/icu4c/source/data/translit/cs_cs_FONIPA.txt b/icu4c/source/data/translit/cs_cs_FONIPA.txt new file mode 100644 index 0000000000..499a5c050b --- /dev/null +++ b/icu4c/source/data/translit/cs_cs_FONIPA.txt @@ -0,0 +1,63 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: cs_cs_FONIPA.txt +# Generated from CLDR +# +::NFC; +::Lower; +ch } [ bdďjlmnňrřvwzž ] → ɣ ; +ch → x ; +dě → ɟɛ ; +mě → mɲɛ ; +tě → cɛ ; +ně → ɲɛ ; +dž → d \u0361 ʒ; # affricate indicated by ligature tie +dz → d \u0361 z; # affricate indicated by ligature tie +a → a ; +á → aː ; +b → b ; +c → t \u0361 s; # affricate indicated by ligature tie +č → t \u0361 ʃ; # affricate indicated by ligature tie +d → d ; +ď → ɟ ; +e → ɛ ; +é → ɛː ; +ě → jɛ ; +f → f ; +g → ɡ ; +h } [cčfkpqsštťx] → h ; +h → ɦ ; +i → ɪ ; +í → iː ; +j → j ; +k → k ; +l → l ; +m } [fvw] → ɱ ; +m → m ; +n } [gkqx] → ŋ ; +n → n ; +ň → ɲ ; +o → o ; +ó → oː ; +p → p ; +q → kv ; +r → r ; +ř → r\u031D ; +s → s ; +š → ʃ ; +t → t ; +ť → c ; +u → u ; +ú → uː ; +ů → uː ; +v → v ; +w → v ; +x → ks ; +y → ɪ ; +ý → iː ; +z → z ; +ž → ʒ ; diff --git a/icu4c/source/data/translit/es_FONIPA_am.txt b/icu4c/source/data/translit/es_FONIPA_am.txt new file mode 100644 index 0000000000..709ad7fd7d --- /dev/null +++ b/icu4c/source/data/translit/es_FONIPA_am.txt @@ -0,0 +1,168 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: es_FONIPA_am.txt +# Generated from CLDR +# +β → b; +ð → d; +ɣ → g; +ʎ → ʝ; +ŋ → n; +θ → s; +ɾ → r; +i\u032F → i; +u\u032F → u; +j → i; +[^gk] { w → u; +::Null; +'.' → ; +bb → | b; +dd → | d; +ff → | f; +gg → | g; +ʝʝ → | ʝ; +kk → | k; +ll → | l; +mm → | m; +nn → | n; +ɲɲ → | ɲ; +pp → | p; +rr → | r; +ss → | s; +ʃʃ → | ʃ; +tt → | t; +ʧʧ → | ʧ; +xx → | x; +ʒʒ → | ʒ; +a → አ ; +ba → ባ ; +be → ቤ ; +bi → ቢ ; +bo → ቦ ; +bu → ቡ ; +b → ብ ; +da → ዳ ; +de → ዴ ; +di → ዲ ; +do → ዶ ; +du → ዱ ; +d → ድ ; +e → ኤ ; +fa → ፋ ; +fe → ፌ ; +fi → ፊ ; +fo → ፎ ; +fu → ፉ ; +f → ፍ ; +ga → ጋ ; +ge → ጌ ; +gi → ጊ ; +go → ጎ ; +gu → ጉ ; +gwa → ጓ ; +gwe → ጔ ; +gwi → ጒ ; +gwo → ጉዎ ; +g → ግ ; +i → ኢ ; +ʝa → ያ ; +ʝe → ዬ ; +ʝi → ዪ ; +ʝo → ዮ ; +ʝu → ዩ ; +ʝ → ይ ; +ka → ካ ; +ke → ኬ ; +ki → ኪ ; +ko → ኮ ; +ku → ኩ ; +kwa → ኳ ; +kwe → ኴ ; +kwi → ኲ ; +kwo → ኩዎ ; +k → ክ ; +la → ላ ; +le → ሌ ; +li → ሊ ; +lo → ሎ ; +lu → ሉ ; +l → ል ; +ma → ማ ; +me → ሜ ; +mi → ሚ ; +mo → ሞ ; +mu → ሙ ; +m → ም ; +na → ና ; +ne → ኔ ; +ni → ኒ ; +no → ኖ ; +nu → ኑ ; +n → ን ; +ɲa → ኛ ; +ɲe → ኜ ; +ɲi → ኚ ; +ɲo → ኞ ; +ɲu → ኙ ; +ɲ → ኝ ; +o → ኦ ; +pa → ፓ ; +pe → ፔ ; +pi → ፒ ; +po → ፖ ; +pu → ፑ ; +p → ፕ ; +ra → ራ ; +re → ሬ ; +ri → ሪ ; +ro → ሮ ; +ru → ሩ ; +r → ር ; +sa → ሳ ; +se → ሴ ; +si → ሲ ; +so → ሶ ; +su → ሱ ; +s → ስ ; +ʃa → ሻ ; +ʃe → ሼ ; +ʃi → ሺ ; +ʃo → ሾ ; +ʃu → ሹ ; +ʃ → ሽ ; +ta → ታ ; +te → ቴ ; +ti → ቲ ; +to → ቶ ; +tu → ቱ ; +t → ት ; +ʧa → ቻ ; +ʧe → ቼ ; +ʧi → ቺ ; +ʧo → ቾ ; +ʧu → ቹ ; +ʧ → ች ; +u → ኡ ; +va → ቫ ; +ve → ቬ ; +vi → ቪ ; +vo → ቮ ; +vu → ቩ ; +v → ቭ ; +xa → ኻ ; +xe → ኼ ; +xi → ኺ ; +xo → ኾ ; +xu → ኹ ; +x → ኽ ; +ʒa → ዣ ; +ʒe → ዤ ; +ʒi → ዢ ; +ʒo → ዦ ; +ʒu → ዡ ; +ʒ → ዥ ; +::NFC; diff --git a/icu4c/source/data/translit/es_FONIPA_es_419_FONIPA.txt b/icu4c/source/data/translit/es_FONIPA_es_419_FONIPA.txt new file mode 100644 index 0000000000..214547e4e9 --- /dev/null +++ b/icu4c/source/data/translit/es_FONIPA_es_419_FONIPA.txt @@ -0,0 +1,11 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: es_FONIPA_es_419_FONIPA.txt +# Generated from CLDR +# +ʎ → ʝ; +[sθ]+ → s; diff --git a/icu4c/source/data/translit/es_am.txt b/icu4c/source/data/translit/es_am.txt new file mode 100644 index 0000000000..077eb1e146 --- /dev/null +++ b/icu4c/source/data/translit/es_am.txt @@ -0,0 +1,11 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: es_am.txt +# Generated from CLDR +# +::es-es_FONIPA; +::es_FONIPA-am; diff --git a/icu4c/source/data/translit/es_es_FONIPA.txt b/icu4c/source/data/translit/es_es_FONIPA.txt new file mode 100644 index 0000000000..ff695d65d1 --- /dev/null +++ b/icu4c/source/data/translit/es_es_FONIPA.txt @@ -0,0 +1,82 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: es_es_FONIPA.txt +# Generated from CLDR +# +$bow = [-\ $] ; # Beginning of word. +$consonant = [bβdðfgɣʝklʎmnŋɲθprɾstʧx] ; +$syll = '.' ; # Syllable boundary. +::NFC; +::Lower; +$bow { ct → | t ; # ctónico (?) +$bow { cz → | z ; # czar +$bow { gn → | n ; # gnomo +$bow { mn → | n ; # mnemotécnico +$bow { ps → | s ; # psicología +$bow { pt → | t ; # pterodáctilo +$bow { x → | s ; # xilófono +$bow { i → i ; +$consonant { i } [ aáeé oóuú] → j ; +[aeo] { i } [^aáeé oóuú] → i\u032F ; +i } [ aáeé oóuú] → ʝ ; +i → i ; +[aeo] { y } [^aáeéiíoóuú] → i\u032F ; +y } [ aáeéiíoóuú] → ʝ ; +y → i ; +[aeo] { u } [^aáeéiíoó ] → u\u032F ; +u } [ aáeéiíoó ] → w ; +ü } [ eéií ] → w ; +u → u ; +ü → u ; # Should not be needed, but just in case. +[aá] → a ; +[eé] → e ; +í → i ; +[oó] → o ; +ú → u ; +b → β ; +cch → ʧ ; +ch → ʧ ; +cc } [^eéií] → k ; +c } [eéií] → θ ; +c → k ; +d → ð ; +f → f; +gu } [eéiíy] → ɣ ; +g } [eéiíy] → x ; +g → ɣ ; +hi } [aáeéoóuú] → ʝ ; +h → $syll ; +j → x ; +k → k ; +ll → ʎ ; +l → l ; +m → m ; +n → n ; +ñ → ɲ ; +p → p ; +qu } [eéiíy] → k ; +q → k ; +[-\ lns$] { r → r ; +rr → r ; +r → ɾ ; +ss → s ; +s → s ; +tx → ʧ ; # for loanwords from Basque, Catalan +t → t ; +v → β ; +w → $syll w ; +x } h?[aáeéiíoóuú$] → ks ; +x } [^aáeéiíoóuú$] → s ; +x → ks ; +z → θ ; +::Null; +[-\ ] → ; +[mnɲŋ $] { β → b ; +[mnɲŋlʎ$] { ð → d ; +[mnɲŋ $] { ɣ → g ; +n } [gɣk] → ŋ ; +::NFC; diff --git a/icu4c/source/data/translit/it_am.txt b/icu4c/source/data/translit/it_am.txt new file mode 100644 index 0000000000..1ca63e4de5 --- /dev/null +++ b/icu4c/source/data/translit/it_am.txt @@ -0,0 +1,199 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: it_am.txt +# Generated from CLDR +# +::NFD(NFC); +::Lower(); +::[:Latin:] fullwidth-halfwidth(); +$vowel = [aeiou]; +$consonant = [bcdfghjklmnpqrstvwxyz]; +($consonant) \' → | $1; +\' → ; +cqu → ኩ ; +cc → | c; +ca → ካ; +cia → ቻ; +cio → ቺዮ; +ciu → ቺዩ; +ci → ቺ; +cu → ኩ; +ce → ቼ; +co → ኮ; +cha → ካ; +chi → ኪ; +chu → ኩ; +che → ኬ; +cho → ኮ; +c } $consonant → ክ; +gg → | g; +ghi → ጊ; +ghe → ጌ; +ghu → ጉ; +gli → | li; +gna → ኛ; +gni → ኚ; +gnu → ኙ; +gne → ኜ; +gno → ኞ; +gn } $consonant → ኝ; +ga → ጋ; +gia → ጂያ; +giu → ጂዩ; +gio → ጂዮ; +gi → ጂ; +gu → ጉ; +ge → ጄ; +go → ጎ; +g } $consonant → ግ; +rr → | r; +ra → ራ; +ri → ሪ; +ru → ሩ; +re → ሬ; +ro → ሮ; +r } $consonant → ር; +ll → | l; +la → ላ; +li → ሊ; +lu → ሉ; +le → ሌ; +lo → ሎ; +l } $consonant → ል; +tt → | t; +ta → ታ; +ti → ቲ; +thi → ቲ; +tu → ቱ; +thu → ቱ; +te → ቴ; +the → ቴ; +to → ቶ; +tho → ቶ; +tzu → ፁ; +tz → | zz; +t } $consonant → ት; +dd → | d; +da → ዳ; +di → ዲ; +du → ዱ; +de → ዴ; +do → ዶ; +d } $consonant → ድ; +mm → | m; +ma → ማ; +mi → ሚ; +mu → ሙ; +me → ሜ; +mo → ሞ; +m } $consonant → ም; +nn → | n; +na → ና; +ni → ኒ; +nu → ኑ; +ne → ኔ; +no → ኖ; +n } $consonant → ን; +ff → | f; +fa → ፋ; +fi → ፊ; +fu → ፉ; +fe → ፌ; +fo → ፎ; +f } $consonant → ፍ; +bb → | b; +ba → ባ; +bi → ቢ; +bu → ቡ; +be → ቤ; +bo → ቦ; +b } $consonant → ብ; +pp → | p; +pa → ፓ; +pi → ፒ; +pu → ፑ; +pe → ፔ; +po → ፖ; +p } $consonant → ፕ; +vv → | v; +va → ቫ; +vi → ቪ; +vu → ቩ; +ve → ቬ; +vo → ቮ; +v } $consonant → ቩ; +sa } nt[ao] → ሣ; +ss → | \~s; +sb → ዝ | b; +sd → ዝ | d; +sg → ዝ | g; +sl → ዝ | l; +sm → ዝ | m; +sn → ዝ | n; +sr → ዝ | r; +sv → ዝ | v; +($consonant) s } $vowel → | $1 \~ s; +\~sa → ሣ; +\~si → ሢ; +\~su → ሡ; +\~se → ሤ; +\~so → ሦ; +[:^Letter:] { sa → ሣ; +[:^Letter:] { si → ሢ; +[:^Letter:] { su → ሡ; +[:^Letter:] { se → ሤ; +[:^Letter:] { so → ሦ; +sa → ዛ; +si → ዚ; +su → ዙ; +se → ዜ; +so → ዞ; +scia → ሺያ; +sci → ሺ; +sce → ሼ; +zz → | \~z; +($consonant) z → | $1 \~z; +\~za → ጻ; +\~zi → ጺ; +\~zu → ጹ; +\~ze → ጼ; +\~zo → ጾ; +za → ዛ; +[:^Letter:] { zi → ዚ; +zi → ዚ; +zu → ዙ; +ze → ዜ; +zo → ዞ; +ja → ያ; +je → ዬ; +j → | i; +a → አ; +i → ዒ; +u → ዑ; +e → ዔ; +o → ዖ; +b → ብ; +c → ክ; +d → ድ; +f → ፍ; +g → ግ; +h → ህ; +k → ክ; +l → ል; +m → ም; +n → ን; +p → ፕ; +q → ክ; +r → ር; +s → ስ; +t → ት; +v → ው; +x → | cs; +y → | i; +z → ዝ; +[:nonspacing mark:] → ; +::NFC(NFD); diff --git a/icu4c/source/data/translit/ja_Latn_ko.txt b/icu4c/source/data/translit/ja_Latn_ko.txt new file mode 100644 index 0000000000..fd7b9513a3 --- /dev/null +++ b/icu4c/source/data/translit/ja_Latn_ko.txt @@ -0,0 +1,93 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: ja_Latn_ko.txt +# Generated from CLDR +# +::NFD(NFC); +::[:Latin:] Lower(); +$consonant = [ᄀᄁᄂᄃᄄᄅᄆᄇᄈᄉᄊᄋᄌᄍᄎᄏᄐᄑᄒ]; +$lengthMarker = [\u0302\u0304]; +[\-\'] → ; +e $lengthMarker → | e i ; +$lengthMarker → ; +[^$consonant] { ( [aiueoyw] ) → ᄋ | $1 ; # Supply a required null initial. +a → ᅡ ; +i\~e → | ie ; # イェ +i → ᅵ ; +u\~a → | wa ; # クァ, グァ +u\~i → ᅱ ; # ウィ, クィ, etc. +u\~e → ᅰ ; # ウェ +u\~o → ᅯ ; # ウォ +u → ᅮ ; +e → ᅦ ; +o → ᅩ ; +kk → ᆺ | k ; +ss → ᆺ | s ; +tt → ᆺ | t ; +tc → ᆺ | c ; +cc → ᆺ | c ; +hh → ᆺ | h ; +ff → ᆺ | f ; +rr → ᆺ | r ; +gg → ᆺ | g ; +zz → ᆺ | z ; +jj → ᆺ | j ; +dd → ᆺ | d ; +bb → ᆺ | b ; +vv → ᆺ | v ; +pp → ᆺ | p ; +' ' { k → | g ; # Beginning of a word (after space). +^k → | g ; # Beginning of the string. +k → ᄏ ; +sh → | sy ; +su → 스 ; +s → ᄉ ; +te\~ → | t ; # テュ +to\~ → | t ; # トゥ +tsu\~ → | ch ; # ツァ, ツィ, etc. +tsu → 쓰 ; +ts → | ch ; +' ' { t → | d ; +^t → | d ; +t → ᄐ ; +' ' { ch → | j ; +^ch → | j ; +ch → ᄎ ; +n } [\ \'bcdfghjkmnprstwz] → ᆫ ; +n$ → ᆫ ; +n → ᄂ ; +h → ᄒ ; +fu\~ → | p ; # フュ +fu → | hu ; +f → | p ; +m } [bmp] → ᆫ ; +m → ᄆ ; +ya → ᅣ ; +yi → ᅵ ; # Added for convenience, after shi. +yu → ᅲ ; +ye → ᅨ ; +yo → ᅭ ; +r → ᄅ ; +wa → ᅪ ; +w → ; +g → ᄀ ; +zu → 즈 ; +z → | j ; +j → ᄌ ; +de\~ → | d ; # デュ +dji\~ → | j ; # ヂァ, ヂゥ, etc. +dji → | ji ; # ヂ +do\~ → | d ; # ドゥ +dzu\~ → | j ; # ヅァ, ヅィ, etc. +dzu → | zu ; # ヅ +dz → | j ; +d → ᄃ ; +b → ᄇ ; +vu\~ → | b ; # ヴァ, etc. +v → | b ; +p → ᄑ ; +::NFC(NFD); diff --git a/icu4c/source/data/translit/ja_Latn_ru.txt b/icu4c/source/data/translit/ja_Latn_ru.txt new file mode 100644 index 0000000000..016ad7f4ae --- /dev/null +++ b/icu4c/source/data/translit/ja_Latn_ru.txt @@ -0,0 +1,64 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: ja_Latn_ru.txt +# Generated from CLDR +# +::NFD(NFC); +::[:Latin:] Lower(); +$lengthMarker = [\u0302\u0304]; +\' → ; +e $lengthMarker → эй ; +i $lengthMarker → | i i ; +$lengthMarker → ; +a → а ; +i\~e → | ye ; +i → и ; +u\~ → в ; # ウィ etc. +u → у ; +e → э ; +o → о ; +k → к ; +sh → | sy ; +s → с ; +ch → | ty ; +c } ch → t ; +te\~ → | t ; # テュ +to\~ → | t ; # トゥ +tsu\~ → | ts ; # ツァ, ツィ, etc. +ts → ц ; +t → т ; +\~tsu → | tsu ; +n } [bpm] → м ; # 群馬 → Гумма +n\' → нъ ; +n → н ; +h → х ; +fu\~ → | f ; # フュ +f → ф ; +m → м ; +ya → я ; +yi → и ; # Added for convenience, after sh, ch, j. +yu → ю ; +ye → е ; # ?? unobserved +yo → ё ; +r → р ; +wa → ва ; +w → ; +g → г ; +j → | zy ; +z → дз ; +de\~ → | d ; # デュ +dji\~ → | z ; # ヂャ, ヂュ, etc. +dj → | j ; # ヂ +do\~ → | d ; # ドゥ +dzu\~ → | z ; # ヅァ, ヅィ, etc. +dz → | z ; # ヅ +d → д ; +b → б ; +vu\~ → | v ; # ヴァ, etc. +v → в ; # ?? unobserved +p → п ; +::NFC(NFD); diff --git a/icu4c/source/data/translit/pl_pl_FONIPA.txt b/icu4c/source/data/translit/pl_pl_FONIPA.txt new file mode 100644 index 0000000000..19d5731ba2 --- /dev/null +++ b/icu4c/source/data/translit/pl_pl_FONIPA.txt @@ -0,0 +1,99 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: pl_pl_FONIPA.txt +# Generated from CLDR +# +:: NFC () ; +:: Lower () ; +$voiceless = [cfhkpst]; +$vowel = [ aąeęioóuy ]; +ch } i → ç ; +ch → x ; +ci } $vowel → t \u0361 ɕ ; +ci → t \u0361 ɕ i ; +cz → t \u0361 ʂ ; +dzi } $vowel → d \u0361 ʑ ; +dzi → d \u0361 ʑ i ; +dz } $voiceless → t \u0361 s ; +dz → d \u0361 z ; +dź } $voiceless → t \u0361 ɕ ; +dź → d \u0361 ʑ ; +dż } $voiceless → t \u0361 ʂ ; +dż → d \u0361 ʐ ; +kw → kf ; +krw → krf ; +ni } $vowel → ɲ ; +ni → ɲ i ; +$voiceless { rz → ʂ ; +rz } $voiceless → ʂ ; +rz → ʐ ; +sz → ʂ ; +trw → trf ; +tw → tf ; +zi } $vowel → ʑ ; +zi → ʑ i ; +a → a ; +ą } [bp] → ɔm ; +ą } [kg] → ɔŋ ; +ą } [cdt] → ɔn ; +ą → ɔ\u0303 ; +b } $voiceless → p ; +b → b ; +c → t \u0361 s ; +ć → t \u0361 ɕ ; +d } $voiceless → t ; +d → d ; +e → ɛ ; +ę } [bp] → ɛm ; +ę } [dt] → ɛn ; +ę } [gk] → ɛŋ ; +ę → ɛ\u0303; +f → f ; +g } $voiceless → k ; +g → ɡ ; +h } i → ç ; +h → x ; +i } $vowel → ʲ ; +i → i ; +j → j ; +k } [bdzż] → ɡ ; +k → k ; +l } i → ʎ ; +l → l ; +ł → w ; +m → m ; +n → n ; +ń → ɲ ; +o → ɔ ; +ó → u ; +r → r ; +si } $vowel → ɕ ; +si → ɕi ; +s → s ; +ś → ɕ ; +t → t ; +u → u ; +w } $voiceless → f ; +w → v ; +y → ɨ ; +ź } $voiceless → ɕ ; +ź → ʑ ; +ż } $voiceless → ʂ ; +ż → ʐ ; +:: Null ; +tʐ → tʂ ; +pʐ → pʂ ; +xʐ → xʂ ; +ʐt\u0361ʂ → ʂt\u0361ʂ ; +b } [$] → p ; +d \u0361 z } [$] → t \u0361 s ; # rydz → rɨt\u0361s +d } [$] → t ; +ɡ } [$] → k ; +v } [$] → f ; +ʐ } [$] → ʂ ; +ʑ } [$] → ɕ ; +z } [$] → s ; diff --git a/icu4c/source/data/translit/ro_ro_FONIPA.txt b/icu4c/source/data/translit/ro_ro_FONIPA.txt new file mode 100644 index 0000000000..1db325df48 --- /dev/null +++ b/icu4c/source/data/translit/ro_ro_FONIPA.txt @@ -0,0 +1,89 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: ro_ro_FONIPA.txt +# Generated from CLDR +# +:: NFC () ; +:: Lower () ; +eoai → eo\u032Faj ; # eg. leoaică → /leo\u032Fajkə/, not /le\u032Fo\u032Faikə/ +eai → e\u032Faj ; +eau → e\u032Faw ; +eoa → e\u032Fo\u032Fa ; +i\-ai → jaj ; +ia\-i → jaj ; +iau → jaw ; +iei → jej ; +ieu → jew ; +[\uffff] { eu → jew ; +ioa → jo\u032Fa ; +ioi → joj ; +i\-oi → joj ; +iou → jow ; +oai → o\u032Faj ; +uai → waj ; +uau → waw ; +uăi → wəj ; +ai → aj ; +âi → ɨj ; +ăi → əj ; +au } r → au ; +au → aw ; +âu → ɨw ; +ău → əw ; +ea → e\u032Fa ; +ei → ej ; +eo → e\u032Fo ; +e\-o → e\u032Fo ; +eu → ew ; +e\-u → e\u032Fu ; +ia → ja ; +i\-a → ja ; +ie → je ; +ii → ij ; +io → jo ; +iu } [aâăeiîou$] → iw ; +iu → ju ; +oa → o\u032Fa ; +oi → oj ; +ou → ow ; +ua → wa ; +uâ → wɨ ; +uă → wə ; +ue → we ; +ui → uj ; +uu → uw ; +a → a ; +â → ɨ ; +ă → ə ; +b → b ; +ch → k ; +c } [ei] → t \u0361 ʃ ; +c → k ; +d → d ; +e → e ; +f → f ; +gh → ɡ ; +g } [ei] → d \u0361 ʒ ; +g → ɡ ; +h → h ; +i → i ; +î → ɨ ; +j → ʒ ; +k → k ; +l → l ; +m → m ; +n → n ; +o → o ; +p → p ; +r → r ; +s → s ; +ş → ʃ ; +t → t ; +ţ → t \u0361 s ; +u → u ; +v → v ; +z → z ; diff --git a/icu4c/source/data/translit/root.txt b/icu4c/source/data/translit/root.txt index 271c705eee..4b6abfb55e 100644 --- a/icu4c/source/data/translit/root.txt +++ b/icu4c/source/data/translit/root.txt @@ -1333,6 +1333,13 @@ root { } } + cs-cs_FONIPA { + file { + resource:process(transliterator) {"cs_cs_FONIPA.txt"} + direction {"FORWARD"} + } + } + cs-ja { file { resource:process(transliterator) {"cs_ja.txt"} @@ -1361,6 +1368,20 @@ root { } } + es-am { + file { + resource:process(transliterator) {"es_am.txt"} + direction {"FORWARD"} + } + } + + es-es_FONIPA { + file { + resource:process(transliterator) {"es_es_FONIPA.txt"} + direction {"FORWARD"} + } + } + es-ja { file { resource:process(transliterator) {"es_ja.txt"} @@ -1389,6 +1410,20 @@ root { } } + es_FONIPA-am { + file { + resource:process(transliterator) {"es_FONIPA_am.txt"} + direction {"FORWARD"} + } + } + + es_FONIPA-es_419_FONIPA { + file { + resource:process(transliterator) {"es_FONIPA_es_419_FONIPA.txt"} + direction {"FORWARD"} + } + } + es_FONIPA-ja { file { resource:process(transliterator) {"es_FONIPA_ja.txt"} @@ -1403,6 +1438,13 @@ root { } } + it-am { + file { + resource:process(transliterator) {"it_am.txt"} + direction {"FORWARD"} + } + } + it-ja { file { resource:process(transliterator) {"it_ja.txt"} @@ -1410,6 +1452,20 @@ root { } } + ja_Latn-ko { + file { + resource:process(transliterator) {"ja_Latn_ko.txt"} + direction {"FORWARD"} + } + } + + ja_Latn-ru { + file { + resource:process(transliterator) {"ja_Latn_ru.txt"} + direction {"FORWARD"} + } + } + pl-ja { file { resource:process(transliterator) {"pl_ja.txt"} @@ -1417,6 +1473,13 @@ root { } } + pl-pl_FONIPA { + file { + resource:process(transliterator) {"pl_pl_FONIPA.txt"} + direction {"FORWARD"} + } + } + pl_FONIPA-ja { file { resource:process(transliterator) {"pl_FONIPA_ja.txt"} @@ -1431,6 +1494,13 @@ root { } } + ro-ro_FONIPA { + file { + resource:process(transliterator) {"ro_ro_FONIPA.txt"} + direction {"FORWARD"} + } + } + ro_FONIPA-ja { file { resource:process(transliterator) {"ro_FONIPA_ja.txt"} @@ -1438,6 +1508,20 @@ root { } } + ru-ja { + file { + resource:process(transliterator) {"ru_ja.txt"} + direction {"FORWARD"} + } + } + + ru-zh { + file { + resource:process(transliterator) {"ru_zh.txt"} + direction {"FORWARD"} + } + } + sk-ja { file { resource:process(transliterator) {"sk_ja.txt"} @@ -1445,6 +1529,13 @@ root { } } + sk-sk_FONIPA { + file { + resource:process(transliterator) {"sk_sk_FONIPA.txt"} + direction {"FORWARD"} + } + } + sk_FONIPA-ja { file { resource:process(transliterator) {"sk_FONIPA_ja.txt"} @@ -1452,6 +1543,13 @@ root { } } + zh_Latn_PINYIN-ru { + file { + resource:process(transliterator) {"zh_Latn_PINYIN_ru.txt"} + direction {"FORWARD"} + } + } + } TransliteratorNamePattern { // Format for the display name of a Transliterator. diff --git a/icu4c/source/data/translit/ru_ja.txt b/icu4c/source/data/translit/ru_ja.txt new file mode 100644 index 0000000000..eade2ca070 --- /dev/null +++ b/icu4c/source/data/translit/ru_ja.txt @@ -0,0 +1,442 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: ru_ja.txt +# Generated from CLDR +# +$word_boundary = [-\ $]; +$vowel = [аеийоуыьэюяёъ]; +$not_vowel = [^$vowel]; +::NFC; +::Lower; +$vowel { го } $word_boundary → во; +::Null; +а → ア ; +ба → バ ; +бе → ベ ; +бий → ビー ; +би → ビ ; +бо → ボ ; +бу → ブ ; +бы → ビ ; +бь → ビ ; +бэ → ベ ; +бю → ビュ ; +бя → ビャ ; +бё → ビョ ; +б → ブ ; +ва → ヴァ ; +ве → ヴェ ; +вий → ヴィ ; +ви → ヴィ ; +во → ヴォ ; +ву → ヴ ; +вый → ヴィ ; +вы → ヴィ ; +вь → ヴィ ; +вэ → ヴェ ; +вю → ヴュ ; +вя → ヴャ ; +вё → ヴョ ; +въ → ヴィ; +в } [линр] → ヴ ; +в → フ ; +га → ガ ; +ге → ゲ ; +гий → ギ ; +ги → ギ ; +го → ゴ ; +гу → グ ; +гый → ギ ; +гы → ギ ; +гь → ギ ; +гъ → ギ ; +гэ → ゲ ; +гю → ギュ ; +гя → ギャ ; +гё → ギョ ; +г } г → ッ ; +г → グ ; +да → ダ ; +де → デ ; +джа → ジャ ; +дже → ジェ ; +джий → ジ ; +джи → ジ ; +джо → ジョ ; +джу → ジュ ; +джый → ギ ; +джы → ジ ; +джь → ギ ; +джэ → ジェ ; +джю → ジュ ; +джя → ジャ ; +джё → ジョ ; +дж → ジ ; +дза → ザ ; +дзе → ゼ ; +дзий → ドジ ; +дзи → ドジ ; +дзо → ゾ ; +дзу → ズ ; +дзый → ドジ ; +дзы → ドジ ; +дзь → ドジ ; +дзэ → ゼ ; +дзю → ジュ ; +дзя → ジャ ; +дзё → ドジョ ; +дз → ドゼ ; +дий → ジ ; +ди → ジ ; +до → ド ; +дса → ツァ ; +дсе → ツェ ; +дсий → ツィ ; +дси → ツィ ; +дсо → ツォ ; +дсу → チュ ; +дсый → ツィ ; +дсы → ツィ ; +дсь → ツィ ; +дсэ → ツェ ; +дсю → チュ ; +дся → ツィア ; +дс → ツ ; +ду → ドゥ ; +дца → ツァ ; +дце → ツェ ; +дций → ツィ ; +дци → ツィ ; +дцо → ツォ ; +дцу → チュ ; +дцый → ツィ ; +дцы → ツィ ; +дць → ツィ ; +дцэ → ツェ ; +дцю → チュ ; +дця → ツィア ; +дц → ツ ; +дча → チャ ; +дче → チェ ; +дчий → チ ; +дчи → チ ; +дчо → チョ ; +дчу → チュ ; +дчый → チ ; +дчы → チ ; +дчь → チ ; +дчэ → チェ ; +дчё → チョ ; +дч → チ ; +дый → ド ; +ды → ディ ; +дью → ジュ ; +дь → ジ ; +дэ → デ ; +дю → ジュ ; +дя → ジャ ; +дё → ジョ ; +д → ド ; +е → エ ; +жа → ジャ ; +же → ジェ ; +жий → ジ ; +жи → ジュ ; +жо → ジョ ; +жу → ジュ ; +жый → ジュ ; +жы → ジ ; +жь → ジ ; +жэ → ジェ ; +жю → ジュ ; +жя → ジャ ; +жё → ジョ ; +ж → シュ ; +за → ザ ; +зе → ゼ ; +зий → ジ ; +зи → ジ ; +зо → ゾ ; +зу → ズ ; +зый → ジ ; +зы → ジ ; +зь → ジ ; +зэ → ゼ ; +зю → ジュ ; +зя → ジャ ; +зё → ジョ ; +з → ス ; +ий → イ ; +и → イ ; +й → イ ; +ка → カ ; +ке → ケ ; +кий → キー ; +ки → キ ; +ко → コ ; +ку → ク ; +кы → キ ; +кь → キ ; +кэ → ケ ; +кю → キュ ; +кя → キャ ; +кё → キョ ; +къ → キ ; +к → ク ; +ла → ラ ; +ле → レ ; +лий → リ ; +ли → リ ; +лй → リ ; +ло → ロ ; +лу → ル ; +лый → リ ; +лы → リ ; +ль → リ ; +лэ → レ ; +лю → リュ ; +ля → リャ ; +лё → リョ ; +л → ル ; +ма → マ ; +ме → メ ; +ми → ミ ; +мо → モ ; +му → ム ; +мый → ミ ; +мы → ミ ; +мь → ミ ; +мъ → ミ ; +мэ → メ ; +мю → ミュ ; +мя → ミャ ; +мё → ミョ ; +м → ム ; +на → ナ ; +не → ネ ; +ний → ニー ; +ни → ニ ; +нй → ニ ; +но → ノ ; +ну → ヌ ; +ный → ニ ; +ны → ニ ; +нь → ニ ; +нэ → ネ ; +ню → ニュ ; +ня → ニャ ; +нё → ニョ ; +нъ → ニ ; +н } $not_vowel → ン ; +о → オ ; +па → パ ; +пе → ペ ; +пий → ピ ; +пи → ピ ; +по → ポ ; +пу → プ ; +пый → ピ ; +пы → ピ ; +пь → ピ ; +пэ → ペ ; +пю → ピュ ; +пя → ピャ ; +пё → ピョ ; +пъ → ピ ; +п } п → ッ ; +п → プ ; +ра → ラ ; +ре → レ ; +рий → リ ; +ри → リ ; +рй → リ ; +ро → ロ ; +ру → ル ; +рый → リ ; +ры → リ ; +рь → リ ; +ръ → リ ; +рэ → レ ; +рю → リュ ; +ря → リャ ; +рё → リョ ; +р → ル ; +са → サ ; +се → セ ; +сий → シー ; +си → シ ; +со → ソ ; +су → ス ; +счий → チ ; +счи → チ ; +счо → チョ ; +счу → チュ ; +счь → チ ; +счю → チュ ; +счё → チョ ; +сый → シ ; +сы → シ ; +сь → シ ; +сэ → セ ; +сю → シュ ; +ся → シャ ; +сё → ショ ; +съ → シ ; +с } с → ッ ; +с → ス ; +та → タ ; +те → テ ; +тий → チ ; +ти → チ ; +то → ト ; +тса → ツァ ; +тсе → ツェ ; +тсий → ツィ ; +тси → ツィ ; +тсо → ツォ ; +тсу → チュ ; +тсый → ツィ ; +тсы → ツィ ; +тсь → ツィ ; +тсэ → ツェ ; +тсю → チュ ; +тся → ツィア ; +тс → ツ ; +ту → トゥ ; +тца → ッツァ ; +тце → ツェ ; +тций → ツィ ; +тци → ツィ ; +тцо → ツォ ; +тцу → チュ ; +тцый → ツィ ; +тцы → ツィ ; +тць → ツィ ; +тцэ → ツェ ; +тцю → チュ ; +тця → ツィア ; +тц → ツ ; +тча → チャ ; +тче → チェ ; +тчий → チ ; +тчи → チ ; +тчо → チョ ; +тчу → チュ ; +тчый → チ ; +тчы → チ ; +тчь → チ ; +тчэ → チェ ; +тч → チ ; +тый → ティ ; +ты → ティ ; +ть → チ ; +тъ → チ ; +тэ → チェ ; +тю → チュ ; +тя → チャ ; +тё → チョ ; +т } [тд] → ッ; +т → ト ; +у → ウ ; +фа → ファ ; +фе → フェ ; +фий → フィ ; +фи → フィ ; +фо → フォ ; +фу → フ ; +фый → フィ ; +фы → フィ ; +фь → フィ ; +фэ → フェ ; +фю → フュ ; +фя → フャ ; +фё → フョ ; +ф → フ ; +ха → ハ ; +хе → ヘ ; +хий → ヒー ; +хи → ヒ ; +хо → ホ ; +ху → フ ; +хый → ヒ ; +хы → ヒ ; +хь → ヒ ; +хэ → ヘ ; +хю → ヒュ ; +хя → ヒャ ; +х → フ ; +ца → ツァ ; +це → ツェ ; +ций → ツィ ; +ци → ツィ ; +цо → ツォ ; +цса → ツァ ; +цсе → ツェ ; +цсий → ツィ ; +цси → ツィ ; +цсо → ツォ ; +цсу → チュ ; +цсый → ツィ ; +цсы → ツィ ; +цсь → ツィ ; +цсэ → ツェ ; +цсю → チュ ; +цся → ツィア ; +цс → ツ ; +цу → チュ ; +цый → ツィ ; +цы → ツィ ; +ць → ツィ ; +цэ → ツェ ; +цю → チュ ; +ця → ツァ ; +ц → ツ ; +ча → チャ ; +че → チェ ; +чий → チー ; +чи → チ ; +чо → チョ ; +чу → チュ ; +чый → チ ; +чы → チ ; +чь → チ ; +чэ → チェ ; +чё → チョ ; +ч → チ ; +ша → シャ ; +ше → シェ ; +ший → シー ; +ши → シ ; +шо → ショ ; +шу → シュ ; +шый → シ ; +шы → シ ; +шь → シ ; +шэ → シェ ; +шю → シュ ; +шя → シャ ; +шё → ショ ; +ш → シュ ; +ща → シャ ; +ще → シェ ; +щий → シー ; +щи → シ ; +що → ショ ; +щу → シュ ; +щь → シ ; +щю → シュ ; +щё → ショ ; +щ → シ ; +ъ → ; +ый → イ ; +ы → ウィ ; +ь → イ ; +э → エ ; +ю → ユ ; +я → ヤ ; +ё → ョ ; +::NFC; diff --git a/icu4c/source/data/translit/ru_zh.txt b/icu4c/source/data/translit/ru_zh.txt new file mode 100644 index 0000000000..ebcbd8e088 --- /dev/null +++ b/icu4c/source/data/translit/ru_zh.txt @@ -0,0 +1,976 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: ru_zh.txt +# Generated from CLDR +# +$bow = [-\ $]; # Word boundary. +$vowel = [аеийоуыьэюяё]; +$not_vowel = [^$vowel]; +::NFC; +::Lower; +аа → а; +бб → б; +вв → в; +гг → г; +дд → д; +жж → ж; +зз → з; +ии → и; +кк → к; +лл → л; +мм → | м; +м } [бп] → н; +$vowel { нь → н; +пп → п; +рр → р; +сс → с; +тт → т; +уу → у; +фф → ф; +хх → х; +цц → ц; +чч → ч; +шш → ш; +щщ → щ; +::Null; +бург } $bow → 堡 ; +град } $bow → 格勒 ; +город } $bow → 哥罗德 ; +цов } $bow → 佐夫 ; +аи → 艾 ; +ай → 艾 ; +ан } $not_vowel → 安 ; +ао → 奥 ; +ау → 奥 ; +а → 阿 ; +баи → 拜 ; +бай → 拜 ; +бан } $not_vowel → 班 ; +бао → 包 ; +бау → 包 ; +ба → 巴 ; +бен } $not_vowel → 边 ; +бе → 别 ; +бий → 比 ; +бин } $not_vowel → 宾 ; +би → 比 ; +бйо → 比奥 ; +бон } $not_vowel → 邦 ; +бо → 博 ; +буй → 布伊 ; +бун } $not_vowel → 本 ; +бу → 布 ; +бый → 贝 ; +бын } $not_vowel → 本 ; +бы → 贝 ; +бьи → 比 ; +бью → 比尤 ; +бь → 比 ; +бэй → 贝 ; +бэн } $not_vowel → 本 ; +бэ → 贝 ; +бю → 比尤 ; +бян } $not_vowel → 比扬 ; +бя → 比亚 ; +бё → 比奥 ; +б → 布 ; +ваи → 瓦伊 ; +вай → 瓦伊 ; +ван } $not_vowel → 万 ; +вао → 沃 ; +вау → 沃 ; +ва → 瓦 ; +вен } $not_vowel → 文 ; +ве → 韦 ; +вий → 维 ; +вин } $not_vowel → 温 ; +ви → 维 ; +вйо → 维奥 ; +вон } $not_vowel → 翁 ; +во → 沃 ; +вуй → 维 ; +вун } $not_vowel → 文 ; +ву → 武 ; +вый → 维 ; +вын } $not_vowel → 文 ; +вы → 维 ; +вьи → 维 ; +вью → 维尤 ; +вь → 维 ; +вэй → 韦 ; +вэн } $not_vowel → 文 ; +вэ → 韦 ; +вю → 维尤 ; +вян } $not_vowel → 维扬 ; +вя → 维亚 ; +вё → 维奥 ; +в → 夫 ; +гаи → 盖 ; +гай → 盖 ; +ган } $not_vowel → 甘 ; +гао → 高 ; +гау → 高 ; +га → 加 ; +ген } $not_vowel → 根 ; +ге → 格 ; +гий → 吉 ; +гин } $not_vowel → 金 ; +ги → 吉 ; +гйо → 吉奥 ; +гон } $not_vowel → 贡 ; +го → 戈 ; +гуй → 圭 ; +гун } $not_vowel → 贡 ; +гу → 古 ; +гый → 格 ; +гын } $not_vowel → 根 ; +гы → 格 ; +гьи → 吉 ; +гью → 久 ; +гь → 吉 ; +гэй → 盖 ; +гэн } $not_vowel → 根 ; +гэ → 盖 ; +гю → 久 ; +гян } $not_vowel → 吉扬 ; +гя → 吉亚 ; +гё → 吉奥 ; +г → 格 ; +даи → 代 ; +дай → 代 ; +дан } $not_vowel → 丹 ; +дао → 道 ; +дау → 道 ; +да → 达 ; +ден } $not_vowel → 坚 ; +де → 杰 ; +джаи → 贾伊 ; +джай → 贾伊 ; +джан } $not_vowel → 占 ; +джао → 焦 ; +джау → 焦 ; +джа → 贾 ; +джен } $not_vowel → 真 ; +дже → 杰 ; +джий → 吉 ; +джин } $not_vowel → 金 ; +джи → 吉 ; +джйо → 焦 ; +джон } $not_vowel → 忠 ; +джо → 焦 ; +джуй → 朱伊 ; +джун } $not_vowel → 准 ; +джу → 朱 ; +джый → 吉 ; +джын } $not_vowel → 真 ; +джы → 吉 ; +джьи → 吉 ; +джью → 久 ; +джь → 吉 ; +джэй → 杰 ; +джэн } $not_vowel → 真 ; +джэ → 杰 ; +джю → 久 ; +джян } $not_vowel → 江 ; +джя → 贾 ; +джё → 焦 ; +дж → 季 ; +дзаи → 宰 ; +дзай → 宰 ; +дзан } $not_vowel → 赞 ; +дзао → 藻 ; +дзау → 藻 ; +дза → 扎 ; +дзен } $not_vowel → 津 ; +дзе → 泽 ; +дзий → 济 ; +дзин } $not_vowel → 津 ; +дзи → 济 ; +дзйо → 焦 ; +дзон } $not_vowel → 宗 ; +дзо → 佐 ; +дзуй → 祖伊 ; +дзун } $not_vowel → 尊 ; +дзу → 祖 ; +дзый → 济 ; +дзын } $not_vowel → 曾 ; +дзы → 济 ; +дзьи → 济 ; +дзью → 久 ; +дзь → 济 ; +дзэй → 泽 ; +дзэн } $not_vowel → 曾 ; +дзэ → 泽 ; +дзю → 久 ; +дзян } $not_vowel → 江 ; +дзя → 贾 ; +дзё → 焦 ; +дз → 兹 ; +дий → 季 ; +дин } $not_vowel → 金 ; +ди → 季 ; +дйо → 焦 ; +дон } $not_vowel → 东 ; +до → 多 ; +дсаи → 采 ; +дсай → 采 ; +дсан } $not_vowel → 灿 ; +дсао → 曹 ; +дсау → 曹 ; +дса → 察 ; +дсен } $not_vowel → 岑 ; +дсе → 采 ; +дсий → 齐 ; +дсин } $not_vowel → 钦 ; +дси → 齐 ; +дсон } $not_vowel → 聪 ; +дсо → 措 ; +дсуй → 崔 ; +дсун } $not_vowel → 聪 ; +дсу → 楚 ; +дсый → 齐 ; +дсын } $not_vowel → 岑 ; +дсы → 齐 ; +дсьи → 齐 ; +дсью → 秋 ; +дсь → 齐 ; +дсэй → 采 ; +дсэн } $not_vowel → 岑 ; +дсэ → 采 ; +дсю → 秋 ; +дся → 齐亚 ; +дс → 茨 ; +дуй → 杜伊 ; +дун } $not_vowel → 敦 ; +ду → 杜 ; +дцаи → 采 ; +дцай → 采 ; +дцан } $not_vowel → 灿 ; +дцао → 曹 ; +дцау → 曹 ; +дца → 察 ; +дцен } $not_vowel → 岑 ; +дце → 采 ; +дций → 齐 ; +дцин } $not_vowel → 钦 ; +дци → 齐 ; +дцон } $not_vowel → 聪 ; +дцо → 措 ; +дцуй → 崔 ; +дцун } $not_vowel → 聪 ; +дцу → 楚 ; +дцый → 齐 ; +дцын } $not_vowel → 岑 ; +дцы → 齐 ; +дцьи → 齐 ; +дцью → 秋 ; +дць → 齐 ; +дцэй → 采 ; +дцэн } $not_vowel → 岑 ; +дцэ → 采 ; +дцю → 秋 ; +дця → 齐亚 ; +дц → 茨 ; +дчаи → 柴 ; +дчай → 柴 ; +дчан } $not_vowel → 昌 ; +дчао → 乔 ; +дчау → 乔 ; +дча → 恰 ; +дчен } $not_vowel → 琴 ; +дче → 切 ; +дчий → 奇 ; +дчин } $not_vowel → 钦 ; +дчи → 奇 ; +дчйо → 乔 ; +дчон } $not_vowel → 琼 ; +дчо → 乔 ; +дчуй → 崔 ; +дчун } $not_vowel → 春 ; +дчу → 丘 ; +дчый → 奇 ; +дчын } $not_vowel → 琴 ; +дчы → 奇 ; +дчьи → 奇 ; +дчь → 奇 ; +дчэй → 切 ; +дчэн } $not_vowel → 琴 ; +дчэ → 切 ; +дчян } $not_vowel → 强 ; +дчё → 乔 ; +дч → 奇 ; +дый → 德 ; +дын } $not_vowel → 登 ; +ды → 德 ; +дьи → 季 ; +дью → 久 ; +дь → 季 ; +дэй → 代 ; +дэн } $not_vowel → 登 ; +дэ → 代 ; +дюн } $not_vowel → 久恩 ; +дю → 久 ; +дян } $not_vowel → 江 ; +дя → 佳 ; +дё → 焦 ; +д → 德 ; +ен } $not_vowel → 延 ; +е → 耶 ; +жаи → 扎伊 ; +жай → 扎伊 ; +жан } $not_vowel → 然 ; +жао → 饶 ; +жау → 饶 ; +жа → 扎 ; +жен } $not_vowel → 任 ; +же → 热 ; +жий → 日 ; +жин } $not_vowel → 任 ; +жи → 日 ; +жйо → 若 ; +жон } $not_vowel → 容 ; +жо → 若 ; +жуй → 瑞 ; +жун } $not_vowel → 容 ; +жу → 茹 ; +жый → 日 ; +жын } $not_vowel → 任 ; +жы → 日 ; +жьи → 日 ; +жью → 茹 ; +жь → 日 ; +жэй → 热 ; +жэн } $not_vowel → 任 ; +жэ → 热 ; +жю → 茹 ; +жян } $not_vowel → 让 ; +жя → 扎 ; +жё → 若 ; +ж → 日 ; +заи → 宰 ; +зай → 宰 ; +зан } $not_vowel → 赞 ; +зао → 藻 ; +зау → 藻 ; +за → 扎 ; +зен } $not_vowel → 津 ; +зе → 泽 ; +зий → 济 ; +зин } $not_vowel → 津 ; +зи → 济 ; +зйо → 焦 ; +зон } $not_vowel → 宗 ; +зо → 佐 ; +зуй → 祖伊 ; +зун } $not_vowel → 尊 ; +зу → 祖 ; +зый → 济 ; +зын } $not_vowel → 曾 ; +зы → 济 ; +зьи → 济 ; +зью → 久 ; +зь → 济 ; +зэй → 泽 ; +зэн } $not_vowel → 曾 ; +зэ → 泽 ; +зю → 久 ; +зян } $not_vowel → 江 ; +зя → 贾 ; +зё → 焦 ; +з → 兹 ; +ий → 伊 ; +ин } $not_vowel → 因 ; +и → 伊 ; +йо → 约 ; +й → 伊 ; +каи → 凯 ; +кай → 凯 ; +кан } $not_vowel → 坎 ; +као → 考 ; +кау → 考 ; +ка → 卡 ; +кен } $not_vowel → 肯 ; +ке → 克 ; +кий → 基 ; +кин } $not_vowel → 金 ; +ки → 基 ; +кйо → 基奥 ; +кон } $not_vowel → 孔 ; +ко → 科 ; +куй → 奎 ; +кун } $not_vowel → 昆 ; +ку → 库 ; +кый → 克 ; +кын } $not_vowel → 肯 ; +кы → 克 ; +кьи → 基 ; +кью → 丘 ; +кь → 基 ; +кэй → 凯 ; +кэн } $not_vowel → 肯 ; +кэ → 凯 ; +кю → 丘 ; +кян } $not_vowel → 基扬 ; +кя → 基亚 ; +кё → 基奥 ; +к → 克 ; +лаи → 莱 ; +лай → 莱 ; +лан } $not_vowel → 兰 ; +лао → 劳 ; +лау → 劳 ; +ла → 拉 ; +лен } $not_vowel → 连 ; +ле → 列 ; +лий → 利 ; +лин } $not_vowel → 林 ; +ли → 利 ; +лйо → 廖 ; +лон } $not_vowel → 隆 ; +ло → 洛 ; +луй → 卢伊 ; +лун } $not_vowel → 伦 ; +лу → 卢 ; +лый → 雷 ; +лын } $not_vowel → 伦 ; +лы → 雷 ; +льи → 利 ; +лью → 柳 ; +ль → 利 ; +лэй → 莱 ; +лэн } $not_vowel → 伦 ; +лэ → 莱 ; +лю → 柳 ; +лян } $not_vowel → 良 ; +ля → 利亚 ; +лё → 廖 ; +л → 尔 ; +маи → 迈 ; +май → 迈 ; +ман } $not_vowel → 曼 ; +мао → 毛 ; +мау → 毛 ; +ма → 马 ; +мен } $not_vowel → 缅 ; +ме → 梅 ; +мий → 米 ; +мин } $not_vowel → 明 ; +ми → 米 ; +мйо → 苗 ; +мон } $not_vowel → 蒙 ; +мо → 莫 ; +муй → 穆伊 ; +мун } $not_vowel → 蒙 ; +му → 穆 ; +мый → 梅 ; +мын } $not_vowel → 门 ; +мы → 梅 ; +мьи → 米 ; +мью → 缪 ; +мь → 米 ; +мэй → 梅 ; +мэн } $not_vowel → 门 ; +мэ → 梅 ; +мюн } $not_vowel → 敏 ; +мю → 缪 ; +мян } $not_vowel → 米扬 ; +мя → 米亚 ; +мё → 苗 ; +м → 姆 ; +наи → 奈 ; +най → 奈 ; +нан } $not_vowel → 南 ; +нао → 瑙 ; +нау → 瑙 ; +на → 纳 ; +нен } $not_vowel → 年 ; +не → 涅 ; +ний → 尼 ; +нин } $not_vowel → 宁 ; +ни → 尼 ; +нйо → 尼奥 ; +нон } $not_vowel → 农 ; +но → 诺 ; +нуй → 努伊 ; +нун } $not_vowel → 农 ; +ну → 努 ; +ный → 内 ; +нын } $not_vowel → 嫩 ; +ны → 内 ; +нь } $not_vowel → 尼 ; +нэй → 内 ; +нэн } $not_vowel → 嫩 ; +нэ → 内 ; +нюн } $not_vowel → 纽恩 ; +ню → 纽 ; +нян } $not_vowel → 尼扬 ; +ня → 尼亚 ; +нё → 尼奥 ; +н } $not_vowel → 恩 ; +он } $not_vowel → 翁 ; +о → 奥 ; +паи → 派 ; +пай → 派 ; +пан } $not_vowel → 潘 ; +пао → 保 ; +пау → 保 ; +па → 帕 ; +пен } $not_vowel → 片 ; +пе → 佩 ; +пий → 皮 ; +пин } $not_vowel → 平 ; +пи → 皮 ; +пйо → 皮奥 ; +пон } $not_vowel → 蓬 ; +по → 波 ; +пуй → 普伊 ; +пун } $not_vowel → 蓬 ; +пу → 普 ; +пый → 佩 ; +пын } $not_vowel → 彭 ; +пы → 佩 ; +пьи → 皮 ; +пью → 皮尤 ; +пь → 皮 ; +пэй → 佩 ; +пэн } $not_vowel → 彭 ; +пэ → 佩 ; +пю → 皮尤 ; +пян } $not_vowel → 皮扬 ; +пя → 皮亚 ; +пё → 皮奥 ; +п → 普 ; +раи → 赖 ; +рай → 赖 ; +ран } $not_vowel → 兰 ; +рао → 劳 ; +рау → 劳 ; +ра → 拉 ; +рен } $not_vowel → 连 ; +ре → 列 ; +рий → 里 ; +рин } $not_vowel → 林 ; +ри → 里 ; +рйо → 廖 ; +рон } $not_vowel → 龙 ; +ро → 罗 ; +руй → 鲁伊 ; +рун } $not_vowel → 伦 ; +ру → 鲁 ; +рый → 雷 ; +рын } $not_vowel → 伦 ; +ры → 雷 ; +рьи → 里 ; +рью → 留 ; +рь → 里 ; +рэй → 雷 ; +рэн } $not_vowel → 伦 ; +рэ → 雷 ; +рю → 留 ; +рян } $not_vowel → 良 ; +ря → 里亚 ; +рё → 廖 ; +р → 尔 ; +саи → 赛 ; +сай → 赛 ; +сан } $not_vowel → 桑 ; +сао → 绍 ; +сау → 绍 ; +са → 萨 ; +сен } $not_vowel → 先 ; +се → 谢 ; +сий → 西 ; +син } $not_vowel → 辛 ; +си → 西 ; +сйо → 肖 ; +сон } $not_vowel → 松 ; +со → 索 ; +суй → 绥 ; +сун } $not_vowel → 孙 ; +су → 苏 ; +счаи → 夏伊 ; +счай → 夏伊 ; +счан } $not_vowel → 先 ; +счао → 肖 ; +счау → 肖 ; +сча → 夏 ; +счен } $not_vowel → 先 ; +сче → 谢 ; +счий → 希 ; +счин } $not_vowel → 辛 ; +счи → 希 ; +счйо → 晓 ; +счон } $not_vowel → 雄 ; +счо → 晓 ; +счуй → 休伊 ; +счун } $not_vowel → 逊 ; +счу → 休 ; +счын } $not_vowel → 欣 ; +счьи → 希 ; +счью → 休 ; +счь → 希 ; +счэн } $not_vowel → 欣 ; +счю → 休 ; +счё → 晓 ; +сч → 希 ; +сый → 瑟 ; +сын } $not_vowel → 森 ; +сы → 瑟 ; +сьи → 西 ; +сью → 休 ; +сь → 西 ; +сэй → 塞 ; +сэн } $not_vowel → 森 ; +сэ → 塞 ; +сюн } $not_vowel → 雄 ; +сю → 休 ; +сян } $not_vowel → 相 ; +ся → 贾 ; +сё → 肖 ; +с → 斯 ; +таи → 泰 ; +тай → 泰 ; +тан } $not_vowel → 坦 ; +тао → 陶 ; +тау → 陶 ; +та → 塔 ; +тен } $not_vowel → 坚 ; +те → 捷 ; +тий → 季 ; +тин } $not_vowel → 京 ; +ти → 季 ; +тйо → 乔 ; +тон } $not_vowel → 通 ; +то → 托 ; +тсаи → 采 ; +тсай → 采 ; +тсан } $not_vowel → 灿 ; +тсао → 曹 ; +тсау → 曹 ; +тса → 察 ; +тсен } $not_vowel → 岑 ; +тсе → 采 ; +тсий → 齐 ; +тсин } $not_vowel → 钦 ; +тси → 齐 ; +тсон } $not_vowel → 聪 ; +тсо → 措 ; +тсуй → 崔 ; +тсун } $not_vowel → 聪 ; +тсу → 楚 ; +тсый → 齐 ; +тсын } $not_vowel → 岑 ; +тсы → 齐 ; +тсьи → 齐 ; +тсью → 秋 ; +тсь → 齐 ; +тсэй → 采 ; +тсэн } $not_vowel → 岑 ; +тсэ → 采 ; +тсю → 秋 ; +тся → 齐亚 ; +тс → 茨 ; +туй → 图伊 ; +тун } $not_vowel → 通 ; +ту → 图 ; +тцаи → 采 ; +тцай → 采 ; +тцан } $not_vowel → 灿 ; +тцао → 曹 ; +тцау → 曹 ; +тца → 察 ; +тцен } $not_vowel → 岑 ; +тце → 采 ; +тций → 齐 ; +тцин } $not_vowel → 钦 ; +тци → 齐 ; +тцон } $not_vowel → 聪 ; +тцо → 措 ; +тцуй → 崔 ; +тцун } $not_vowel → 聪 ; +тцу → 楚 ; +тцый → 齐 ; +тцын } $not_vowel → 岑 ; +тцы → 齐 ; +тцьи → 齐 ; +тцью → 秋 ; +тць → 齐 ; +тцэй → 采 ; +тцэн } $not_vowel → 岑 ; +тцэ → 采 ; +тцю → 秋 ; +тця → 齐亚 ; +тц → 茨 ; +тчаи → 柴 ; +тчай → 柴 ; +тчан } $not_vowel → 昌 ; +тчао → 乔 ; +тчау → 乔 ; +тча → 恰 ; +тчен } $not_vowel → 琴 ; +тче → 切 ; +тчий → 奇 ; +тчин } $not_vowel → 钦 ; +тчи → 奇 ; +тчйо → 乔 ; +тчон } $not_vowel → 琼 ; +тчо → 乔 ; +тчуй → 崔 ; +тчун } $not_vowel → 春 ; +тчу → 丘 ; +тчый → 奇 ; +тчын } $not_vowel → 琴 ; +тчы → 奇 ; +тчьи → 奇 ; +тчь → 奇 ; +тчэй → 切 ; +тчэн } $not_vowel → 琴 ; +тчэ → 切 ; +тчян } $not_vowel → 强 ; +тчё → 乔 ; +тч → 奇 ; +тый → 特 ; +тын } $not_vowel → 滕 ; +ты → 特 ; +тьи → 季 ; +тью → 秋 ; +ть → 季 ; +тэй → 泰 ; +тэн } $not_vowel → 滕 ; +тэ → 泰 ; +тюн } $not_vowel → 琼 ; +тю → 秋 ; +тян } $not_vowel → 强 ; +тя → 佳 ; +тё → 乔 ; +т → 特 ; +уй → 维 ; +ун } $not_vowel → 温 ; +у → 乌 ; +фаи → 法伊 ; +фай → 法伊 ; +фан } $not_vowel → 凡 ; +фао → 福 ; +фау → 福 ; +фа → 法 ; +фен } $not_vowel → 芬 ; +фе → 费 ; +фий → 菲 ; +фин } $not_vowel → 芬 ; +фи → 菲 ; +фйо → 菲奥 ; +фон } $not_vowel → 丰 ; +фо → 福 ; +фуй → 富伊 ; +фун } $not_vowel → 丰 ; +фу → 富 ; +фый → 菲 ; +фын } $not_vowel → 芬 ; +фы → 菲 ; +фьи → 菲 ; +фью → 菲尤 ; +фь → 菲 ; +фэй → 费 ; +фэн } $not_vowel → 芬 ; +фэ → 费 ; +фю → 菲尤 ; +фя → 菲亚 ; +фё → 菲奥 ; +ф → 夫 ; +хаи → 海 ; +хай → 海 ; +хан } $not_vowel → 汉 ; +хао → 豪 ; +хау → 豪 ; +ха → 哈 ; +хен } $not_vowel → 亨 ; +хе → 赫 ; +хий → 希 ; +хин } $not_vowel → 欣 ; +хи → 希 ; +хон } $not_vowel → 洪 ; +хо → 霍 ; +хуй → 惠 ; +хун } $not_vowel → 洪 ; +ху → 胡 ; +хый → 黑 ; +хын } $not_vowel → 亨 ; +хы → 黑 ; +хьи → 希 ; +хью → 休 ; +хь → 希 ; +хэй → 黑 ; +хэн } $not_vowel → 亨 ; +хэ → 海 ; +хю → 休 ; +хян } $not_vowel → 希扬 ; +хя → 希亚 ; +х → 赫 ; +цаи → 采 ; +цай → 采 ; +цан } $not_vowel → 灿 ; +цао → 曹 ; +цау → 曹 ; +ца → 察 ; +цен } $not_vowel → 岑 ; +це → 采 ; +ций → 齐 ; +цин } $not_vowel → 钦 ; +ци → 齐 ; +цон } $not_vowel → 聪 ; +цо → 措 ; +цсаи → 采 ; +цсай → 采 ; +цсан } $not_vowel → 灿 ; +цсао → 曹 ; +цсау → 曹 ; +цса → 察 ; +цсен } $not_vowel → 岑 ; +цсе → 采 ; +цсий → 齐 ; +цсин } $not_vowel → 钦 ; +цси → 齐 ; +цсон } $not_vowel → 聪 ; +цсо → 措 ; +цсуй → 崔 ; +цсун } $not_vowel → 聪 ; +цсу → 楚 ; +цсый → 齐 ; +цсын } $not_vowel → 岑 ; +цсы → 齐 ; +цсьи → 齐 ; +цсью → 秋 ; +цсь → 齐 ; +цсэй → 采 ; +цсэн } $not_vowel → 岑 ; +цсэ → 采 ; +цсю → 秋 ; +цся → 齐亚 ; +цс → 茨 ; +цуй → 崔 ; +цун } $not_vowel → 聪 ; +цу → 楚 ; +цый → 齐 ; +цын } $not_vowel → 岑 ; +цы → 齐 ; +цьи → 齐 ; +цью → 秋 ; +ць → 齐 ; +цэй → 采 ; +цэн } $not_vowel → 岑 ; +цэ → 采 ; +цю → 秋 ; +ця → 齐亚 ; +ц → 茨 ; +чаи → 柴 ; +чай → 柴 ; +чан } $not_vowel → 昌 ; +чао → 乔 ; +чау → 乔 ; +ча → 恰 ; +чен } $not_vowel → 琴 ; +че → 切 ; +чий → 奇 ; +чин } $not_vowel → 钦 ; +чи → 奇 ; +чйо → 乔 ; +чон } $not_vowel → 琼 ; +чо → 乔 ; +чуй → 崔 ; +чун } $not_vowel → 春 ; +чу → 丘 ; +чый → 奇 ; +чын } $not_vowel → 琴 ; +чы → 奇 ; +чьи → 奇 ; +чь → 奇 ; +чэй → 切 ; +чэн } $not_vowel → 琴 ; +чэ → 切 ; +чян } $not_vowel → 强 ; +чё → 乔 ; +ч → 奇 ; +шаи → 沙伊 ; +шай → 沙伊 ; +шан } $not_vowel → 尚 ; +шао → 绍 ; +шау → 绍 ; +ша → 沙 ; +шен } $not_vowel → 申 ; +ше → 舍 ; +ший → 希 ; +шин } $not_vowel → 申 ; +ши → 希 ; +шйо → 绍 ; +шон } $not_vowel → 雄 ; +шо → 绍 ; +шуй → 舒伊 ; +шун } $not_vowel → 顺 ; +шу → 舒 ; +шый → 希 ; +шын } $not_vowel → 申 ; +шы → 希 ; +шьи → 希 ; +шью → 舒 ; +шь → 希 ; +шэй → 舍 ; +шэн } $not_vowel → 申 ; +шэ → 舍 ; +шю → 舒 ; +шян } $not_vowel → 尚 ; +шя → 沙 ; +шё → 绍 ; +ш → 什 ; +щаи → 夏伊 ; +щай → 夏伊 ; +щан } $not_vowel → 先 ; +щао → 肖 ; +щау → 肖 ; +ща → 夏 ; +щен } $not_vowel → 先 ; +ще → 谢 ; +щий → 希 ; +щин } $not_vowel → 辛 ; +щи → 希 ; +щйо → 晓 ; +щон } $not_vowel → 雄 ; +що → 晓 ; +щуй → 休伊 ; +щун } $not_vowel → 逊 ; +щу → 休 ; +щын } $not_vowel → 欣 ; +щьи → 希 ; +щью → 休 ; +щь → 希 ; +щэн } $not_vowel → 欣 ; +щю → 休 ; +щё → 晓 ; +щ → 希 ; +ъ → ; +ый → 厄 ; +ын } $not_vowel → 恩 ; +ы → 厄 ; +ьи → 伊 ; +ью → 尤 ; +ь → 伊 ; +эй → 埃 ; +эн } $not_vowel → 恩 ; +э → 埃 ; +юн } $not_vowel → 云 ; +ю → 尤 ; +ян } $not_vowel → 扬 ; +я → 亚 ; +ё → 约 ; +:: Null (); +$bow { 耶 → 叶 ; +$bow { 夫 → 弗 ; +$bow { 东 → 栋 ; +$bow { 南 → 楠 ; +$bow { 西 → 锡 ; +江 } $bow → 姜 ; +海 } $bow → 亥 ; +::NFC; diff --git a/icu4c/source/data/translit/sk_sk_FONIPA.txt b/icu4c/source/data/translit/sk_sk_FONIPA.txt new file mode 100644 index 0000000000..62debef765 --- /dev/null +++ b/icu4c/source/data/translit/sk_sk_FONIPA.txt @@ -0,0 +1,75 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: sk_sk_FONIPA.txt +# Generated from CLDR +# +$soften = [ptťkcčsš$] ; +:: NFC () ; +:: Lower () ; +ch → x ; +dž } $soften → t \u0361 ʃ ; # affricate indicated by ligature tie +dz } $soften → t \u0361 s ; +dž → d \u0361 ʒ ; +dz → d \u0361 z ; +a → a ; +á → aː ; +ä → ɛ ; +b } $soften → p ; +b → b ; +c → t \u0361 s; # affricate indicated by ligature tie +č → t \u0361 ʃ; # affricate indicated by ligature tie +d } [ie] → ɟ ; +d } $soften → t ; +d → d ; +ď } $soften → c ; +ď → ɟ ; +e → e ; +é → eː ; +f → f ; +g } $soften → k ; +g → ɡ ; +h } $soften → x ; +h → ɦ ; +i → ɪ ; +í → iː ; +j → j ; +k → k ; +l → l ; +ĺ → l\u0329ː ; +ľ → ʎ ; +m } [fv] → ɱ ; +m → m ; +n } [kg] → ŋ ; +n } [ie] → ɲ ; +n → n ; +ň → ɲ ; +o → ɔ ; +ó → ɔː ; +ô → u\u032Fo ; +p → p ; +q → kv ; +r → r ; +ŕ → r\u0329ː ; +s → s ; +š → ʃ ; +t } [ie] → c ; +t → t ; +ť → c ; +u → u ; +ú → uː ; +vz } $soften → fs ; +v } $soften → f ; +[ $] { v } ' ' $soften → f ; # v as preposition +v → v ; +w → v ; +x → ks ; +y → ɪ ; +ý → iː ; +z } $soften → s ; +z → z ; +ž } $soften → ʃ ; +ž → ʒ ; diff --git a/icu4c/source/data/translit/zh_Latn_PINYIN_ru.txt b/icu4c/source/data/translit/zh_Latn_PINYIN_ru.txt new file mode 100644 index 0000000000..db2c0d008a --- /dev/null +++ b/icu4c/source/data/translit/zh_Latn_PINYIN_ru.txt @@ -0,0 +1,121 @@ +# *************************************************************************** +# * +# * Copyright (C) 2004-2010, International Business Machines +# * Corporation; Unicode, Inc.; and others. All Rights Reserved. +# * +# *************************************************************************** +# File: zh_Latn_PINYIN_ru.txt +# Generated from CLDR +# +:: NFD (NFC); +[\u0304\u0301\u030C\u0300\u0306] → ; +:: NFC (NFD); +:: Null (); +ng } [aeou] → n\'g; +ng → ng\'; +n } [aeiouü] → \'n; +n → n\'; +:: Null (); +Ai → Ай; +A → А; +B → Б; +Ch → Ч; +Ci → Цы; +C → Ц; +D → Д; +E → Э; +F → Ф; +G → Г; +H → Х; +Ju → Цз | ü; +J → Цз; +K → К; +L → Л; +M → М; +N → Н; +O → О; +P → П; +Qu → Ц | ü; +Q → Ц; +R → Ж; +Sh → Ш; +Si → Сы; +S → С; +T → Т; +Wu → У; +W → В; +Xu → С | ü; +X → С; +Yai → Яй; +Ya → Я; +Ye → Е; +Yi → И; +You → Ю; +Yo } ng → Ю; +Yo → Ё; +Yu → Ю | v; +Zh → Чж; +Zi → Цзы; +Z → Цз; +[$] { n → н; +\'n → н; +\' → ; +ai → ай; +a → а; +b → б; +ch → ч; +ci → цы; +c → ц; +d → д; +ei → эй; +e → э; +f → ф; +g → г; +h → х; +ia → я; +ie → е; +io } ng → ю; +iu → ю; +i → и; +ju → цз | ü; +j → цз; +k → к; +l → л; +m → м; +ng → н; +n → нь; +o } ng → у; +o → о; +p → п; +qu → ц | ü; +q → ц; +r } [^aeiou] → р; +r → ж; +sh → ш; +si → сы; +s → с; +t → т; +[Хх] { ui → уэй; # special exception +ui → уй; +uo → о; +u → у; +ü → ю | v; +ve → э; +v } [an] → ; +v → й; +wu → у; +w → в; +xu → с | ü; +x → с; +yai → яй; +ya → я; +ye → е; +yi → и; +you → ю; +yo } ng → ю; +yo → ё; +yu → ю | v; +zh → чж; +zi → цзы; +z → цз; +:: NFC ();