scuffed-code/icu4c/source/test/testdata/ConverterSelectorTestUTF16.txt

255 lines
48 KiB
Plaintext
Raw Normal View History

<EFBFBD><EFBFBD>'B> B0:>5 Unicode?
Unicode - MB> C=8:0;L=K9 :>4 4;O ;N1>3> A8<2>;0,
=57028A8<> >B ?;0BD>@<K,
=57028A8<> >B ?@>3@0<<K,
=57028A8<> >B O7K:0.
> A2>59 ?@8@>45 :><?LNB5@K <>3CB @01>B0BL ;8HL A G8A;0<8.  4;O B>3>, GB>1K >=8 <>3;8 E@0=8BL 2 ?0<OB8 1C:2K 8;8 4@C385 A8<2>;K, :064><C B0:><C A8<2>;C 4>;6=> 1KBL ?>AB02;5=> 2 A>>B25BAB285 G8A;>. > B>3>, :0: ?>O28;AO Unicode, 2 <8@5 8<5;8 E>645=85 A>B=8 @07;8G=KE AE5< ?>4>1=>3> :>48@>20=8O A8<2>;>2. > =8 >4=0 87 MB8E AE5< =5 1K;0 AB>;L C=825@A0;L=>9, GB>1K >?8A0BL 2A5 =5>1E>48<K5 A8<2>;K: =0?@8<5@, B>;L:> 4;O :>48@>20=8O 1C:2, 2E>4OI8E 2 0;D028BK O7K:>2 2@>?59A:>3> !>>1I5AB20, =5>1E>48<> 1K;> 8A?>;L7>20BL =5A:>;L:> @07;8G=KE :>48@>2>:. > 1>;LH><C AGQBC 4065 8 4;O >B45;L=>3> O7K:0, A:065<, 0=3;89A:>3>, =5 ACI5AB2>20;> 548=>9 A8AB5<K :>48@>20=8O, 2:;NG02H59 2 A51O 2A5 >1KG=> 8A?>;L7C5<K5 1C:2K, 7=0:8 ?C=:BC0F88 8 B5E=8G5A:85 A8<2>;K.
>;55 B>3>, 2A5 MB8 AE5<K :>48@>20=8O G0AB> 4065 =5 1K;8 A>2<5AB8<K 4@C3 A 4@C3><.  ?@8<5@C, 425 @07=K5 :>48@>2:8 <>3;8 8A?>;L7>20BL >48= 8 B>B 65 :>4 4;O ?@54AB02;5=8O 42CE @07=KE A8<2>;>2 8;8 ?@8A20820BL @07=K5 :>4K >4=>9 8 B>9 65 1C:25.  MB>9 A8BC0F88 4;O ;N1>3> :><?LNB5@0, 0 >A>15==> A5@25@0, ?@8E>48;>AL ?>445@6820BL =5A:>;L:> @07=KE :>48@>2>:, :>B>@K5 <>3;8 ?>=04>18BLAO, => 4065 8 B>340 ?@8 ?5@540G5 40==KE =0 4@C3CN ?;0BD>@<C 8;8 ?@8 8E ?@5>1@07>20=88 2 4@C3CN :>48@>2:C 2A5340 >AB020;AO @8A:, GB> MB8 40==K5 >:06CBAO ?>2@564Q==K<8.
Unicode 87<5=O5B B0:>5 ?>;>65=85 25I59!
!8AB5<0 Unicode ?@8A208205B C=8:0;L=K9 :>4 ;N1><C A8<2>;C, =57028A8<> >B ?;0BD>@<K, =57028A8<> >B ?@>3@0<<K, =57028A8<> >B O7K:0. Unicode 1K; ?@8=OB :0: AB0=40@B B0:8<8 ;845@0<8 :><?LNB5@=>9 8=4CAB@88, :0: Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys 40 8 <=>38<8 4@C38<8. <5==> MB0 AE5<0 :>48@>20=8O 8A?>;L7C5BAO B0:8<8 A>2@5<5==K<8 B5E=>;>38O<8 8 AB0=40@B0<8, :0: =0?@8<5@ XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML 8 B0: 40;55. <5==> Unicode O2;O5BAO >D8F80;L=>9 AE5<>9 @50;870F88 ISO/IEC 10646. 0:>=5F, MB0 :>48@>2:0 ?>445@68205BAO 2> <=>65AB25 >?5@0F8>==KE A8AB5<, 2> 2A5E A>2@5<5==KE 1@0C75@0E =B5@=5B 8 2 1>;LH>< :>;8G5AB25 4@C38E ?@>3@0<<. >2A5<5AB=>5 @0A?@>AB@0=5=85 AB0=40@B0 Unicode @>2=> :0: 8 4>ABC?=>ABL ?>445@6820NI8E 53> A@54AB2 2 =0AB>OI55 2@5<O O2;ONBAO >4=8<8 87 =081>;55 206=KE =0?@02;5=89 @0728B8O 8=4CAB@88 ?@>3@0<<=>3> >15A?5G5=8O.
A?>;L7>20=85 Unicode 2 <=>3>C@>2=52KE ?@8;>65=8OE 8;8 ?@>3@0<<=KE :><?;5:A0E, ?>AB@>5==KE 2 @0<:0E 0@E8B5:BC@K :;85=B-A5@25@, 0 B0:65 ?@8 ?@54AB02;5=88 40==KE 2 A5B8 =B5@=5B, ?@82>48B : 7=0G8B5;L=><C A=865=8N @0AE>4>2 =0 ?>445@6:C MB8E ?@>4C:B>2 8;8 A5@28A>2 ?> A@02=5=8N A> A;CG05< 8A?>;L7>20=8O AB0@KE AE5< :>48@>20=8O. 59AB28B5;L=>, Unicode ?>72>;O5B A>74020BL 548=K9 ?@>3@0<<=K9 ?@>4C:B 8;8 A09B =B5@=5B 4;O <=>65AB20 ?;0BD>@<, O7K:>2 8 AB@0= 157 :0:8E-;81> ?5@545;>:.  53> 8A?>;L7>20=85 ?@8 ?5@540G5 40==KE <564C @07;8G=K<8 A8AB5<0<8 ?@54>E@0=O5B MB8 40==K5 >B ?>2@5645
#
E' GJ 'D4A1) 'DEH-/) "JHFPCH/" 
#3'3K'  **9'ED 'D-H'3J( AB7 E9 'D#1B'E  H*BHE (*.2JF 'D#-1A H'DE-'1A 'D#.1I (9/ #F *O97J 1BE' E9JF' DCD H'-/ EFG'. HB(D '.*1'9 "JHFPCH/"  C'F GF'C E&'* 'D#F8E) DD*4AJ1 H*.5J5 G0G 'D#1B'E DDE-'1A  HDE JH,/ F8'E *4AJ1 H'-/ J-*HJ 9DI ,EJ9 'DE-'1A 'D61H1J). H9DI 3(JD 'DE+'D  A%F 'D'*-'/ 'D#H1H(J DH-/G  '-*HI 'D9/J/ EF 'D4A1'* 'DE.*DA) DJ:7J ,EJ9 'DD:'* 'DE3*./E) AJ 'D'*-'/. H-*I DH '9*(1F' D:) H'-/)  C'DD:) 'D%F,DJ2J)  A%F ,/HD 4A1) H'-/ DE JCA D'3*J9'( ,EJ9 'D#-1A H9D'E'* 'D*1BJE H'D1EH2 'DAFJ) H'D9DEJ) 'D4'&9) 'D'3*9E'D.
H*,/1 'DED'-8) #F #F8E) 'D*4AJ1 'DE.*DA) **9'16 E9 (96G' 'D(96. H(9('1) #.1I  JECF #F J3*./PE ,/HDJ 4A1) FA3 'D1BE D*E+JD E-1AJF E.*DAJF  #H 1BEJF E.*DAJF D*E+JD FA3 'DE-1A. HDH #.0F' #J ,G'2 -'3H(  H(.'5) ,G'2 'DF'/D (server)  AJ,( #F *CHF D/JG 'DB/1) 9DI 'D*9'ED E9 9// C(J1 EF 'D4A1'* 'DE.*DA)  HJ*E *5EJEG 9DI G0' 'D#3'3. HE9 0DC  A9F/E' *E1 'D(J'F'* 9(1 #F8E) E.*DA)  *H,/ GF'C .7H1) D6J'9 #H *-1JA (96 G0G 'D(J'F'*.
"JHFPCH/" *:J1 G0' CDJ@' !
*.55 'D4A1) 'DEH-/) "JHFPCH/" 1BE' H-J/' DCD E-1A AJ ,EJ9 'DD:'* 'D9'DEJ)  H0DC (:6 'DF81 9F FH9 'D-'3H( #H 'D(1'E, 'DE3*./E). HB/ *@E *(FJ EH'5A) "JHFPCH/" E@@F B(@D B'/) 'D5'F9JF D#F8E) 'D-H'3J( A@J 'D9'DE  E+D 41C'* "J.(J.%E. (IBM)  #(@D (APPLE)  GPJ@RHDP@* (@'C@1/ (Hewlett-Packard)  E'JC1H3HA* (Microsoft)  #H1'CP@D (Oracle)  5F (Sun) H:J1G'. CE' #F 'DEH'5A'* H'DEB'JJ3 'D-/J+) (E+D D:) 'D(1E,) ",'A'" "JAVA" HD:) "%C3 %E %D" "XML" 'D*J *3*./E D(1E,) 'D'F*1FJ*) **7D( '3*./'E "JHFPCH/". 9D'H) 9DI 0DC  A%F "JHFPCH/" GJ 'D7@1J@B@) 'D13@EJ) D*7(JB 'DEBJ@'3 'D@9@'D@EJ %J2H a`fdf (ISO 10646) .
%F (2H: EH'5A) "JHFPCH/" H*HAQO1 'D#F8E) 'D*J *3*./EG H*/9EG  J9*(1 EF #GE 'D'.*1'9'* 'D-/J+) AJ 9HDE) 'D(1E,J'* D,EJ9 'DD:'* AJ 'D9'DE. H%F '3*./'E "JHFPCH/" AJ 9'DE 'D'F*1FJ* 3J$/J %DI *HAJ1 C(J1 EB'1F) E9 '3*./'E 'DE,EH9'* 'D*BDJ/J) DDE-'1A 'DE4A1). CE' #F '3*./'E "JHFPCH/" 3JOECQPF 'DE(1E, EF C*'() 'D(1F'E, E1) H'-/)  H'3*./'EG 9DI #J FH9 EF 'D#,G2)
#
<00>N<EFBFBD><4E>/fUnicode(q}N<>x/j<>n,<2C> W<>x)?
Unicodef}<7D>k PW[CQ<43>c<EFBFBD>O<EFBFBD>NN P/UN<>vxeMO <0C>
N֊/f<>N<EFBFBD><4E>s^<5E><> <0C>
N֊/f<>N<EFBFBD><4E> z_ <0C>
N֊/f<>N<EFBFBD><4E><EFBFBD><EFBFBD><00>0
<00>W,g
N <0C><><EFBFBD>f<EFBFBD><66>S/fU<66>txeMO0<>[Pc<>[N PxeMO <0C><>O2QX[W[<5B>kbvQ<76>NW[CQ0(WuR <20>UnicodeKNMR <0C> gxe~v.zc<>[<19><>NxeMO<4D>v<EFBFBD>}<7D>x<EFBFBD>|q}0<>l gN P<>}<7D>x<EFBFBD>S<EFBFBD>NS+T<><54> Y<>vW[CQ<1A><>O<EFBFBD>Y <0C><>U<EFBFBD>UPk<50>]qQ TԚ1\<00><><EFBFBD>}Y~^.z N T<>v<EFBFBD>}<7D>x<EFBFBD>OS<>b@b g<>v<EFBFBD><76><00>0sSO/f<>UN.z<><7A><00> <0C><>O<EFBFBD>Y񂞊 <0C>_N<5F>l g<>TN P<>}<7D>x<EFBFBD>S<EFBFBD>Ni<4E>(u<>e@b g<>vW[<5B>k <0C>jޞ&{_<> <0C><>T8^(u<>v<EFBFBD>bS<62>&{_<>0
<19><>N<EFBFBD>}<7D>x<EFBFBD>|q}_Ng<>N<EFBFBD>v]<5D><>z0_N1\/f<><66> <0C>iQ.z<>}<7D>x<EFBFBD>S<EFBFBD><53>O(u<>v T<>vxeMO<4D>Nh<4E>iQ P N T<>vW[CQ <0C>bO(u N T<>vxeMO<4D>Nh<4E><68>v T<>vW[CQ0<>NUON<>Syr<79>[<5B>v<EFBFBD><76>f<EFBFBD> (yr%R/f:O ghV<68><56><00><><EFBFBD>/e<>c1<63>Y N T<>v<EFBFBD>}<7D>x <0C>FO/f <0C><4E>N<EFBFBD><4E>Bf<50>e<1A>N<EFBFBD> N T<>v<EFBFBD>}<7D>xbs^<5E><>KN<4B><4E> <0C><><EFBFBD><EFBFBD><4E>e=~g g d<>X<EFBFBD>vqS<71><53>0
Unicodeck(W9e<39><65>@b g<19>NR<01>
Unicodef}<7D>k PW[CQ<43>c<EFBFBD>O<EFBFBD>NN P/UN<>vxeMO <0C> N֊/f<>N<EFBFBD><4E>s^<5E><> <0C> N֊/f<>N<EFBFBD><4E> z_ <0C><4E>N<EFBFBD><4E><EFBFBD><EFBFBD><00>0Unicodej<>n<EFBFBD>]<5D>}<7D><><19><>N<EFBFBD>]miLu<4C>v<18>\P@b<>c(u <0C><>O<EFBFBD>Y<1A>Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys <00>TvQ<76>N1<4E>YlQ<6C>S0g<>e<EFBFBD>vj<>n<EFBFBD><6E><00><><EFBFBD>Unicode <0C><>O<EFBFBD>YXML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WMLI{I{ <0C>&NN <0C>Unicode/f<>[<5B>sISO/IEC 10646<00>vck<63><6B><EFBFBD>e_01<30>Y\Omi<6D>|q} <0C>@b gg<>e<EFBFBD>vp<><70>hV<68>T 1<>YvQ<76>N#u<>T<EFBFBD><54>/e<>c<EFBFBD>[0Unicodej<>n<EFBFBD>v<EFBFBD>Q<EFBFBD>s<EFBFBD>T/e<>c<EFBFBD>[<5B>]wQ<77>vX[(W <0C>/fя<66>OhQtߎԚ<DF8E>bS<62><67><CD91><EFBFBD>v|vU\<5C><><EFBFBD>R0
\Unicode<07><>[6b:O ghVbYd\<5C>a(u z_<>T<EFBFBD>}<7D><><EFBFBD>}<7D><>P}T <0C><>kO(u<>Pq}W[CQƖ<51>{w<><77>(u0UnicodeO<7F>UNߎԚ#u<>Tb<>UN<>}<7D>z<EFBFBD><7A> Y<><59>zY Ps^<5E><> <0C><><EFBFBD><00><>T W<>[ <0C> <0C> N<00><><EFBFBD>͑<EFBFBD>^0<>[<5B>S<>e<EFBFBD>P8<50>0R1<52>Y N T<>v<EFBFBD>|q} <0C> <0C>!q d<>X0
ܕ<>eUnicodex[S<>x[g
Unicodex[S<>x[g
#
<00>'<00>sht<00> UNICODE?
Unicode siguron nj<00> num<00>r t<00> vet<00>m p<00>r <00>do g<00>rm<00>,
p<00>r cil<00>ndo platform<00>,
p<00>r cilindo program,
p<00>r cil<00>ndo gjuh<00>.
N<00> themel, kompjuterat veprojn<00> me an<00>n e numrave. Ata ruajn<00> g<00>rmat dhe sh<00>njat (karakteret) e tjera duke u caktuar nga nj<00> num<00>r (kod). Para zbulimit t<00> Unicode-s, kishte qindra sisteme kodimi t<00> ndrysh<00>m p<00>r t<00> caktuar k<00>ta numra. Por asnj<00> kodim i vet<00>m nuk mund t<00> p<00>rmbante mjaft sh<00>nja: p<00>r shembull, vet<00>m Bashkimi Europian k<00>rkon disa kodime t<00> ndryshme p<00>r t<00> mbuluar gjith<00> gjuh<00>t e tij. Edhe p<00>r nj<00> gjuh<00> t<00> vetme si Anglishtja asnj<00> kodim nuk ishte i mjaftuesh<00>m p<00>r t<00> gjitha g<00>rmat, sh<00>njat e pik<00>simit, dhe simbolet teknike n<00> p<00>rdorim t<00> zakonsh<00>m.
K<00>ta sisteme kodimi gjithashtu p<00>rplasen me nj<00>ri-tjetrin. Dmth, dy kodime mundet q<00> t<00> p<00>rdorin t<00> nj<00>jtin num<00>r p<00>r dy sh<00>nja krejt t<00> ndryshme, ose dy numra t<00> ndrysh<00>m p<00>r t<00> nj<00>jt<00>n sh<00>nj<00>. Secili kompjuter (sidomos sh<00>rbyesit - serverat) duhet t<00> jet<00> i aft<00> t<00> mb<00>shtes<00> shum<00> kodime, dhe megjithat<00> kur t<00> dh<00>nat kalohen p<00>rmes kodimeve t<00> ndryshme ose platformave, <00>sht<00> gjithmon<00> rreziku i korruptimit t<00> tyre.
Unicode po e ndryshon gjith<00> k<00>t<00> rr<00>muj<00>!
Unicode siguron nj<00> num<00>r t<00> vet<00>m p<00>r <00>do g<00>rm<00>, p<00>r cil<00>ndo platform<00>, p<00>r cilindo program, p<00>r cil<00>ndo gjuh<00>. Standarti Unicode <00>sht<00> f<00>mij<00>ruar (adaptuar) nga udh<00>heq<00>s t<00> till<00> t<00> industris<00> si Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys dhe shum<00> t<00> tjer<00>. Unicode k<00>rkohet nga standarte moderne si XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, etj., dhe <00>sht<00> m<00>nyra zyrtare p<00>r t<00> zbatuar ISO/IEC 10646. Unicode <00>sht<00> i mb<00>shtetur nga shum<00> sisteme vepruese (operativ<00>), gjith<00> shfletuesat (brauzerat) modern<00>, dhe shum<00> produkte t<00> tjera. Dalja n<00> drit<00> e Standartit Unicode, dhe pasja e veglave q<00> e mb<00>shtesin, jan<00> midis faktor<00>ve m<00> dometh<00>n<00>s t<00> koh<00>ve t<00> fundit t<00> drejtimeve t<00> zhvillimit t<00> p<00>rgjith<00>shme t<00> teknologjive t<00> softuer<00>ve.
P<00>rtrup<00>zimi i Unicode n<00> zbatimet klient-server apo shum<00>-shkall<00>sh si dhe n<00> faqet internet, krijon mund<00>sin<00> p<00>r kursime kostoje t<00> ndjeshme n<00> krahasim me p<00>rdorimin e kodimeve t<00> m<00>parshme. Unicode b<00>n t<00> mundur q<00> nj<00> produkt softuer ose nj<00> faqe interneti t<00> p<00>rdoret p<00>r shum<00> platforma, gjuh<00> dhe vende pa re-inxhinierim. Ai lejon t<00> dh<00>nat t<00> kalohen p<00>rmes shum<00> sistemeve t<00> ndryshme pa korruptim.
#
/ B ( ?  K !  M / > 9 H ?
/ B ( ?  K ! * M 0 $ M / G    M 7 0  G 2 ?    5 ? 6 G 7 ( . M , 0 * M 0 & > (  0 $ > 9 H ,
 > 9 G  K  - @ * M 2 H  + I 0 M . 9 K ,
 > 9 G  K  - @ * M 0 K  M 0 > . 9 K ,
 > 9 G  K  - @ - > 7 > 9 K d
 . M * M / B  0 , . B 2 0 B * 8 G , (  , 0 K  8 G 8 . M ,  ' 0  $ G 9 H  d / G * M 0 $ M / G    M 7 0  0 5 0 M #  G 2 ?    (  , 0 ( ? 0 M ' > 0 ? $  0  G   M 7 0  0 5 0 M # 8   M 0 9 ? $  0 $ G 9 H  d / B ( ?  K !  >  5 ? 7 M  > 0 9 K ( G 8 G * 9 2 G ,  8 G (  , 0 & G ( G  G 2 ?  8 H   ! K  5 ? - ? ( M ( 8   G $ 2 ? * ? * M 0 # > 2 ? / >  % @  d  ? 8 @   8   G $ 2 ? * ? . G  * 0 M / > * M $   M 7 0 ( 9 @  9 K 8  $ G 9 H  : & > 9 0 #  G 2 ?  , / B 0 K * ? / 8    K   G 2 G 9 @ ,  * ( @ 8 - @ - > 7 >    K  5 0  0 ( G  G 2 ?   ( G  5 ? - ? ( M ( 8   G $ 2 ? * ? / K   @  5 6 M /  $ > 9 K $ @ 9 H d    M 0 G  @  H 8 @ - > 7 >  G 2 ?  - @ , 8 - @   M 7 0 K  , 5 ? 0 > .  ? ( M 9 K   0 8 > . > ( M / * M 0 / K   G $  ( @  @ * M 0 $ @  K  9 G $ A   9 @ 8   G $ 2 ? * ? * 0 M / > * M $ ( 9 @  % @ d
/ G 8   G $ 2 ? * ? * M 0 # > 2 ? / >  * 0 8 M * 0 5 ? 0 K ' @ - @ 9 H  d  8 @ 2 ?  , & K 8   G $ 2 ? * ? / >  & K 5 ? - ? ( M (   M 7 0 K   G 2 ?  ,   9 @ (  , 0 * M 0 / K   0 8  $ @ 9 H  ,  % 5 > 8 . > (   M 7 0  G 2 ?  5 ? - ? ( M ( ( . M , 0 K   > * M 0 / K   0 8  $ @ 9 H  d  ? 8 @ - @  . M * M / B  0 (5 ? 6 G 7 0 B * 8 G 8 0 M 5 0 )  K 5 ? - ? ( M ( 8   G $ 2 ? * ? / >  8  - > 2 ( @ * ! < $ @ 9 H ; + ? 0 - @  , & K 5 ? - ? ( M ( 8   G $ 2 ? * ? / K   % 5 > * M 2 H  + I 0 M . K   G , @  ! >  > - G  >  > $ > 9 H $ K 8 ! >  >  G 9 . G 6 >  0 > , 9 K ( G  >  K  ? . 0 9 $ > 9 H d
/ B ( ?  K ! 8 G / 9 8 ,  A  , & 2 0 9 > 9 H !
/ B ( ?  K ! , * M 0 $ M / G    M 7 0  G 2 ?    5 ? 6 G 7 (  , 0 * M 0 & > (  0 $ > 9 H ,  > 9 G  K  - @ * M 2 H  + I 0 M . 9 K ,  > 9 G  K  - @ * M 0 K  M 0 > . 9 K ,  > 9 G  K  - @ - > 7 > 9 K d / B ( ?  K ! 8 M  H  ! 0 M !  K  * 2 ,   .* @ .,   ., @ . . .,  8 M  8 ? 8 M  . , . >   M 0 K 8 I + M  ,  0 G  2 , 8 H * , 8 ( , 8 >  , G 8 , / B ( ? 8 ? 8  H 8 @ & M / K   @ * M 0 . A   . M * ( ? / K   0    ( M / ( G  * ( > / > 9 H d / B ( ?  K !  @  5 6 M /  $ >  ' A ( ?  . > ( &  ! K  ,  H 8 G   M 8 . . . 2 .,  > 5 > ,   . > 8 M  M 0 ? * M  ( > 5 > 8 M  M 0 ? * M  ),  2 .! @ . .* @ .,  K 0 M , > 3.0, ! , M 2 M / B . . . 2 .  G 2 ?  9 K $ @ 9 H  0 / 9   . 8 . ./  . .8 @ . 10646  K 2 >  B  0 ( G  >  ' ?  > 0 ?  $ 0 @  > 9 H d / 9   8   > 2 ( * M 0 # > 2 ? / K  , 8 - @  ' A ( ?  , M 0 >  0 K   0    ( M / $ M * > & K  . G  9 K $ > 9 H d / B ( ?  K ! 8 M  H  ! 0 M !  @ $ M * $ ?  0  8  G 8 9 > /  *  0 # K   @ * 2 , M ' $ > , 9 > 2 9 @  G  $ ? . 9 $ M 5 * B 0 M # 5 ? 6 M 5 5 M / > * @ 8 I + M  5 G / 0  G  M ( K 2 I  @ 0 A  > ( K  . G  8 G 9 H  d
/ B ( ?  K !  K  M 0 > 9  -8 0 M 5 0  % 5 > , 9 A - / > . @ *  0 # K   0 5 G , 8 >   K  . G  6 > . ? 2  0 ( G 8 G , * 0  * 0 >  $ *  0 # K   G * M 0 / K   @  * G  M 7 >  0 M  . G   $ M / ' ?  ,  $ 9 K $ @ 9 H d / B ( ?  K ! 8 G    8 >   G 2 > 8 I + M  5 G / 0 $ M * > &  % 5 >   G 2 > 5 G , 8 >   . ? 2  > $ > 9 H ,  ? 8 G 0 @ -   @ ( ? / 0 ?    G , ? ( > 5 ? - ? ( M ( * M 2 H  + I 0 M . K  , - > 7 >    0 & G 6 K  . G  * / K   ? / >  > 8  $ > 9 H d  8 8 G ! >  >  K , ? ( >  ? 8 @ , > ' >  G 5 ? - ? ( M ( * M 0 # > 2 ? / K  8 G 9 K  0 2 G  > / >  > 8  $ > 9 H d
#
@#7H--1'@%. -!4'@-#L1@G1'-1)#A%0-1#0-7HF B"2#3++!2"@%C+I*3+#1AH%01'. H-+I25HJ Unicode 09*#I26I, DI!5#0 encoding -"9H+%2"#I-"#0*3+#12#3++!2"@%@+%H25I. D!H!5 encoding C5H!53'1'-1#0!2@5"-: "1'-"H2@
H, @ 20C%8H!*+ 2"8B#@5"A+H@5"' GI-2#+%2" encoding C2##-%8!8 2)2C%8H!. +#7-A!IAHC 2)2@5H"' @
H 2)2-1$) GD!H!5 encoding C5H@5"-*3+#181'-1)#, @#7H-+!2"'##- A%0*1 %1)L2@45HC
I1-"9H1H'D.
#0 encoding @+%H25I"11A"I 6H1A%01. 1HG7-, C*- encoding *2!2#C
I+!2"@%@5"'1*3+#11'-1#0*-1'5HAH21,+#7-C
I+!2"@%H21*3+#1-1#01'@5"'1. C#0-!4'@-#L (B"@ 20@ 4#L@'-#L) I-!52#*1*8+%2" encoding; A%0@!7H-I-!9%5HH2D!2#0+'H22#@I2#+1*+#7-A%G-#L!5HH21, I-!9%1I0@*5H"H-2#4%2@*5"+2".
Unicode 0@%5H"A%*4H@+%H21I1I+!!
Unicode 3++!2"@%@ 20*3+#1AH%0-1#0, B"D!H*C'H2@GA%G-#L!C, D!H6I1'H20@GB#A#!CA%0D!H'H20@G 2)2C. !2#2 Unicode DI93DC
IB"9I3C-8*2+##! @
H Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys A%0-7HF -5!2. Unicode @G*4H5H3@G*3+#1!2#2C+!HF @
H XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML /%/., A%0@GA'2-"H2@G22#C2#3 ISO/IEC 10646. Unicode DI#12#*1*8C#04142#3'!2, #2'@ -#LC+!HF 1', A%0%4 1L-7HF -5!2. 2#@46I- Unicode Standard A%09%*LH2F 5H!5C2#*1*8 Unicode, @G+6HCA'BI!2@BB%"5 -LA'#L#01B%5H!5'2!*3
#
Cos'<00> Unicode?
Unicode assegna un numero univoco a ogni carattere,
indipendentemente dalla piattaforma,
indipendentemente dall'applicazione,
indipendentemente dalla lingua.
I computer, in buona sostanza, non sanno far altro che trattare numeri. Per immagazzinare in memoria lettere o altri segni <00> necessario che a ogni carattere venga assegnato un numero. Esistono centinaia di sistemi di codifica, preesistenti a Unicode, e ognuno di questi abbina i numeri ai caratteri in modo differente. Nessuna di queste codifiche comprende un numero di caratteri sufficiente per tutte le circostanze. Per le sole lingue dell'Unione Europea, ad esempio, <00> necessario utilizzare parecchi sistemi di codifica distinti. Anche considerando una solo lingua, come l'italiano, non esiste una codifica unica che comprenda tutte le lettere e tutti i segni di punteggiatura e simboli tecnici di uso comune.
Questi sistemi di codifica, inoltre, sono in contraddizione l'uno con l'altro. Succede che due codifiche utilizzino lo stesso numero per due caratteri diversi o che, viceversa, adottino numeri diversi per lo stesso carattere. Qualsiasi elaboratore, e a maggior ragione un server di rete, ha bisogno di utilizzare codifiche diverse. Il problema <00> che, quando i dati passano da una codifica a un'altra, o da una piattaforma a un'altra, si corre il serio rischio di perdere informazioni.
Unicode sta cambiando le cose!
Unicode attribuisce un numero univoco a ogni carattere, indipendentemente dalla piattaforma, dall'applicativo, dalla lingua. Lo standard Unicode <00> stato adottato da leader di mercato del calibro di Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys e molti altri. Unicode <00> alla base di molti moderni standard, come XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML eccetera, e costituisce l'implementazione ufficiale dello standard internazionale ISO/IEC 10646. Unicode <00> supportato da molti sistemi operativi, da tutti i pi<00> moderni web browser e da molti altri prodotti. L'emergere dello standard Unicode, unito alla recente disponibilit<00> di strumenti che lo supportano, <00> fra i pi<00> significativi sviluppi della tecnologia della globalizzazione del software.
L'adozione di Unicode sui siti web e nelle applicazioni client/server o multi-tiered, rispetto all'utilizzo dei set di caratteri tradizionali, permette un significativo abbattimento dei costi di gestione. Unicode consente che un'unica versione di un software o di un sito web siano fruibili con piattaforme, lingue e paesi diversi, evitando la necessit<00> di reingenierizzare il prodotto per ogni situazione specifica. Permette, inoltre, il trasporto del testo fra sistemi diversi senza che abbia luogo alcuna corruzione dei dati.
#
<00>NHN/fUnicode(<00>~Nx)?
Unicode<00>~<7E>k*NW[&{<7B>c<EFBFBD>O<EFBFBD>NN*N/UN<>vpeW[ <0C>
N<><4E>/f<>NHNs^<5E>S <0C>
N<><4E>/f<>NHN z<>^ <0C>
N<><4E>/f<>NHN<48><4E><00>0
<00>W,g
N <0C><><EFBFBD><EFBFBD>{:g<>S/fYtpeW[0<>[<5B>Nc<>[N*NpeW[ <0C>eg<65>PX[W[<5B>kbvQ<76>NW[&{0(WR <20>UnicodeKNMR <0C> gpe~v<>yc<><>NpeW[<5B>vx<>|<7C>~0<>l gN*Nx<>S<EFBFBD>NS+T<><54>Y<>vW[&{<1A><>O<EFBFBD>Y <0C>USUS'k<>]qQ TSO1\<00><><EFBFBD>}Y<>Q<EFBFBD>y N T<>vxegS<>b@b g<>v<EFBFBD><76><00>0sSO/fUSN<>y<EFBFBD><79><00> <0C><>O<EFBFBD>Y<EFBFBD><59><EFBFBD><EFBFBD> <0C>_N<5F>l g<>TN*Nx<>S<EFBFBD>N<02>(u<>N@b g<>vW[<5B>k <0C>h<>p&{<7B>S <0C><>T8^(u<>v<EFBFBD>b/g&{<7B>S0
ُ<>Nx<>|<7C>~_NO<>N<EFBFBD>v<EFBFBD>Q<EFBFBD>z0_N1\/f<><66> <0C>$N<>yx<>S<EFBFBD><53>O(u<>v T<>vpeW[<5B>Nh<4E>$N*N N T<>vW[&{ <0C>bO(u N T<>vpeW[<5B>Nh<4E><68>v T<>vW[&{0<>NUON<>Syr<79>[<5B>v<EFBFBD><76><EFBFBD>{:g(yr+R/f g<>RhV)<00><><00><><EFBFBD>/ec<><63>Y N T<>vx <0C>FO/f <0C> N<><4E><EFBFBD>NHN<48>ePpenc<1A>Ǐ N T<>vxbs^<5E>SKN<4B><4E> <0C><><EFBFBD><EFBFBD>Npenc;`O g_cOW<4F>vqSi<53>0
Unicodeck(W9e<39>S@b gُNR<01>
Unicode<00>~<7E>k*NW[&{<7B>c<EFBFBD>O<EFBFBD>NN*N/UN<>vpeW[ <0C> N<><4E>/f<>NHNs^<5E>S <0C> N<><4E>/f<>NHN z<>^ <0C> N<><4E><EFBFBD>NHN<48><4E><00>0Unicodeh<>Q<EFBFBD>]<5D>~<7E><>ُ<EFBFBD>N<EFBFBD>]NLu<4C>v<EFBFBD><76><EFBFBD>[<5B>N@bǑ(u <0C><>O<EFBFBD>Y<1A>Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys<00>TvQ<76>[<5B><>YlQ<6C>S0g<>e<EFBFBD>vh<>Q<EFBFBD><51><00><><EFBFBD>Unicode <0C><>O<EFBFBD>YXML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WMLI{I{ <0C>v^N <0C>Unicode/f<>[<5B>sISO/IEC 10646<00>vckĉ<6B>e_0<><30>Y<>d\O<>|<7C>~ <0C>@b gg<>e<EFBFBD>vOmȉhV<68>T<EFBFBD><54>YvQ<76>N<EFBFBD>N<EFBFBD>T<EFBFBD><54>/ec<>[0Unicodeh<>Q<EFBFBD>v<EFBFBD>Q<EFBFBD>s<EFBFBD>T/ec<>[<5B>]wQ<77>vX[(W <0C>/fяeghQto<74><6F>N<EFBFBD>b/g<67><CD91><EFBFBD>v<EFBFBD>SU\<5C><><EFBFBD>R0
\UnicodeN<>[7b g<>RhVbYB\<5C>^(u z<>^<5E>TQ<51>z<EFBFBD>~T <0C><>kO(u O<>~W[&{Ɩ<><C696>w9<77>(u0UnicodeOUSNo<4E><6F>N<EFBFBD>N<EFBFBD>TbUSNQ<51>z<EFBFBD><7A>Y/<2F>zY*Ns^<5E>S <0C><><EFBFBD><00><>T<EFBFBD>V<EFBFBD>[ <0C> <0C> N<00><><EFBFBD>͑<EFBFBD>^0<>[<5B>S\penc O<><4F>0R<30><52>Y N T<>v<EFBFBD>|<7C>~ <0C> <0C><>e_cOW0
sQ<73>NUnicodef[/gf[O
Unicodef[/gf[O/fN*N^<5E><>v)R<>v<EFBFBD>~<7E>~ <0C>/f:N<>SU\ <0C>ibU\<5C>T<EFBFBD>c^O(uUnicodeh<>Q <0C><>^<5E>z<EFBFBD>v <0C>Unicodef[/gf[O<><4F><EFBFBD>z<EFBFBD>N<EFBFBD>s<EFBFBD>No<4E><6F>N<EFBFBD>N<EFBFBD>T<EFBFBD>Th<>Q<EFBFBD>e,g<>vh<76>:y<>l0f[/gf[O<>vOXT<58>Nh<4E><68>N^<5E>l<EFBFBD><6C><EFBFBD>W<EFBFBD>v<EFBFBD><76><EFBFBD>{:g<>TD<54><44><EFBFBD><EFBFBD>]N<>vlQ<6C>S<EFBFBD>T<EFBFBD>~<7E>~0f[/gf[O<>S1uOXT<58>c<EFBFBD>OD<4F>ё0Unicodef[/gf[O<>vOXTD<54><h_>e<>~NLu
N<EFBFBD>NUO/ecUnicodeh<>Q<EFBFBD>T ^gOS<4F>RvQibU\<5C>TgbL<62><4C>v<EFBFBD>~<7E>~<7E>S*N<>N0
#
Mik<00> Unicode on?
Unicode m<00><00>ritt<00><00> jokaiselle merkille yksil<00>llisen arvon.
Riippumatta k<00>ytt<00>j<00>rjestelm<00>st<00>
Riippumatta ohjelmistosta
Riippumatta kielest<00>
Tietokoneiden toiminta perustuu numeroiden k<00>sittelylle. My<00>s kirjaimet ja muut merkit ovat tietokoneiden muistissa lukusarjoina. Ennen Unicodea oli k<00>yt<00>ss<00> satoja eri tapoja esitt<00><00> merkkej<00> ja kirjaimia mutta yksik<00><00>n n<00>ist<00> koodisivuista ei kyennyt m<00><00>ritt<00>m<00><00>n kovin kattavaa merkist<00><00>. Jo yksinomaan Euroopan Unionissa k<00>ytetyille kielille tarvitaan useita erilaisia merkist<00>j<00> ja koodisivuja, eik<00> edes englannin kaltaisen, yksinkertaisen kielen kaikkien kirjaimien, v<00>limerkkien ja yleisten teknisten symbolien esitt<00>minen onnistu yhdell<00> n<00>ist<00> koodisivuista.
Lis<00>ksi koodisivut ovat ristiriidassa kesken<00><00>n. Eri koodisivuilla voidaan k<00>ytt<00><00> samaa arvoa kahdelle t<00>ysin erilaiselle merkille tai samalla merkill<00> voi olla eri arvo eri koodivulla. Jokaisen tietokoneen, varsinkin jos kyseess<00> on palvelin, pit<00><00> tukea lukuisia eri merkist<00>j<00> ja koodisivuja ja kun tietoa siirret<00><00>n j<00>rjestelmien ja merkist<00>jen v<00>lill<00> on tiedon v<00><00>ristymisen ja tuhoutumisen riski suuri.
Unicode on ratkaisu
Unicodessa jokaiselle merkille on m<00><00>ritetty yksil<00>llinen, riippumaton arvo. Alan johtavat yritykset, kuten Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys ja lukuisat muut toimijat k<00>ytt<00>v<00>t Unicodea. Unicode on sis<00>llytetty vaatimuksena moniin nykyisiin standardeihin, kuten XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0 ja WML. Unicode on virallinen keino toteuttaa ISO/IEC 10646 -standardi. Useat k<00>ytt<00>j<00>rjestelm<00>t, kaikki internet-selaimet ja monet muut tuotteet k<00>ytt<00>v<00>t Unicodea. Unicoden syntyminen ja sit<00> tukevien ty<00>kalujen suuri m<00><00>r<00> on yksi viime aikojen merkitt<00>vimmist<00> maailmanlaajuisen ohjelmistotuotannon suuntauksista.
Unicoden k<00>ytt<00>minen palvelintekniikassa, vaativissa sovelluksissa ja internet-sivustoilla tuo merkitt<00>vi<00> kustannuss<00><00>st<00>j<00> verrattuna usean eri koodisivun k<00>yt<00>lle. Unicoden ansiosta yksitt<00>inen sovellus tai sivusto voidaan tarjota useille eri k<00>ytt<00>j<00>rjestelmille ja monilla eri kielill<00> maailmanlaajuisesti, ilman uudelleenohjelmoinnin tarvetta. Tieto kulkee j<00>rjestelmien v<00>lill<00> vailla tuhoutumisen tai v<00><00>ristymisen vaaraa.
Unicode-konsortio
#
Co je Unicode?
Unicode pYiYazuje ka~d<00>mu znaku jedine n<00> <01>slo,
nez<00>visle na platform,
nez<00>visle na programu,
nez<00>visle na jazyce.
Po <01>ta e, ze sv<00> podstaty, pracuj<00> pouze s <01>sly. P<00>smena a dala<01> znaky ukl<00>daj<00> tak, ~e ka~d<00>mu z nich pYiYad<00> <01>slo. PYed vznikem Unicode existovaly stovky rozd<00>ln<00>ch k<00>dovac<00>ch syst<00>mo pro pYiYazov<00>n<00> tchto <01>sel. }<01>dn<00> z tchto k<00>dov<00>n<00> nemohlo obsahovat dostatek znako: napY<01>klad Evropsk<00> unie sama potYebuje nkolik rozn<00>ch k<00>dov<00>n<00>, aby pokryla vaechny sv<00> jazyky. Dokonce i pro jeden jedin<00> jazyk, jako je angli tina, nevyhovovalo ~<01>dn<00> k<00>dov<00>n<00> pro vaechny p<00>smena, interpunkci a b~n pou~<01>van<00> technick<00> symboly.
Tyto k<00>dovac<00> syst<00>my tak<00> byly v konfliktu jeden s druh<00>m. To znamen<00>, ~e dv k<00>dov<00>n<00> mohou pou~<01>vat stejn<00> <01>slo pro dva rozn<00> znaky, nebo pou~<01>vat rozn<00> <01>sla pro stejn<00> znak. Jak<00>koli po <01>ta  (zvl<00>at servery) mus<00> podporovat mnoho rozn<00>ch k<00>dov<00>n<00>; pYesto, kdykoli jsou data pYed<00>v<00>na mezi rozn<00>mi k<00>dov<00>n<00>mi nebo platformami, hroz<00>, ~e tato data budou poakozena.
Unicode toto vaechno mn<00>!
Unicode pYiYazuje ka~d<00>mu znaku jedine n<00> <01>slo, nez<00>visle na platform, nez<00>visle na programu, nez<00>visle na jazyku. Unicode Standard byl pYijat takov<00>mi promyslov<00>mi vodci, jako jsou Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys a mnoha dala<01>mi. Unicode je vy~adov<00>n modern<00>mi standardy, jako jsou XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML atd. a je ofici<00>ln<00> formou implementace ISO/IEC 10646. Je podporov<00>n v mnoha opera n<00>ch syst<00>mech, vaech modern<00>ch prohl<00>~e <01>ch a mnoha dala<01>ch produktech. To, ~e se objevil Unicode Standard a dostupnost n<00>strojo, kter<00> jej podporuj<00>, patY<01> mezi nejv<00>znamnja<01> ned<00>vn<00> trendy v glob<00>ln<00> technologii softwaru.
Za lenn<00> Unicode do klient-server nebo v<00>cevrstv<00>ch aplikac<00> a webov<00>ch str<00>nek nab<00>z<00> v<00>znamn<00> uaetYen<00> n<00>klado oproti dY<01>vja<01>m znakov<00>m sad<00>m. Unicode umo~Huje, aby jedin<00> softwarov<00> produkt nebo jedin<00> webov<00> str<00>nka byla zamYena na mnoho platforem, jazyko a zem<00> beze zmn n<00>vrhu. To dovoluje pYen<00>aet data pYes mnoho rozn<00>ch syst<00>mo bez poruaen<00>.
#
?
<00><05><05><05><05><05><05> <00><05><05><05> <00><05><05><05> <00><05><05><05><05><05> <00><05><05> <00><05>,
<00><05> <00><05><05><05> <00><05> <00><05><05><05> <00><05><05><05><05><05><05><05>,
<00><05> <00><05><05><05> <00><05><05><05><05> <00><05><05><05><05><05>,
<00><05><05> <00><05><05><05> <00><05><05><05><05> <00><05><05>.
<00><05><05><05><05> <00><05><05><05><05>, <00><05><05><05><05><05> <00><05><05><05><05><05> <00><05> <00><05><05><05><05><05><05>. <00><05> <00><05><05><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05> <00><05>-<00><05><05> <00><05><05><05><05> <00><05><05><05> <00><05><05> <00><05><05> <00><05><05>. <00><05><05><05> <00><05><05><05><05> <00><05><05><05><05><05><05><05>, <00><05><05> <00><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05> <00><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05>. <00><05> <00><05> <00><05><05> <00><05><05> <00><05><05><05> <00><05><05><05><05> <00><05><05><05> <00><05><05><05><05> <00><05><05><05><05>. <00><05><05><05><05><05>: <00><05> <00><05><05><05><05><05> <00><05><05><05><05><05><05><05> <00><05><05><05><05><05> <00><05><05> <00><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05> <00><05> <00><05><05> <00><05><05><05><05> <00><05> <00><05> <00><05><05><05><05> <00><05><05><05><05><05><05><05> <00><05>. <00><05><05><05><05> <00><05><05><05> <00><05> <00><05><05><05> <00><05><05><05><05>, <00><05><05> <00><05><05><05><05><05> <00><05><05><05>, <00><05> <00><05><05> <00><05> <00><05><05><05><05><05> <00><05><05><05><05> <00><05><05> <00><05><05><05><05> <00><05> <00><05><05><05><05><05><05>, <00><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05>.
<00><05><05><05><05><05> <00><05><05><05><05> <00><05><05> <00><05> <00><05><05><05><05><05> <00><05> <00><05> <00><05>. <00><05><05><05><05>, <00><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05> <00><05><05><05> <00><05><05><05> <00><05><05><05> <00><05><05><05><05><05>, <00><05> <00><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05> <00><05><05><05><05> <00><05>. <00><05> <00><05> <00><05><05><05> (<00><05><05><05><05><05><05> <00><05><05><05><05>) <00><05><05><05><05> <00><05><05><05><05> <00><05> <00><05> <00><05><05><05><05><05> <00><05><05><05><05> <00><05><05><05><05>; <00><05><05><05> <00><05> <00><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05><05> <00><05><05> <00><05><05><05><05><05> <00><05><05><05><05> <00><05> <00><05><05><05><05><05><05><05><05> <00><05><05><05><05> <00><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05><05><05>.
<00><05><05><05><05><05><05> <00><05><05><05> <00><05> <00><05> <00><05>!
<00><05><05><05><05><05><05> <00><05><05><05> <00><05><05><05> <00><05><05><05><05><05> <00><05><05> <00><05>, <00><05><05> <00><05><05><05> <00><05><05><05><05><05><05><05><05>, <00><05><05><05><05><05><05>, <00><05> <00><05><05><05>. <00><05><05> <00><05><05><05><05><05><05><05> <00><05><05><05> <00><05>-<00><05><05> <00><05><05><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05> Apple , HP , IBM , JustSystem , Microsoft , Oracle , SAP , Sun , Sybase , Unisys <00><05><05><05><05> <00><05><05><05><05>. <00><05><05><05><05><05><05> <00><05><05><05> <00><05>-<00><05><05> <00><05><05><05><05> <00><05><05><05><05><05><05><05> <00><05><05> XML , Java , ECMAScript (JavaScript)  , LDAP , CORBA 3.0  , WML <00><05><05><05><05><05>, <00><05><05><05><05><05> <00><05><05><05><05> <00><05> <00><05><05><05><05><05> <00><05><05><05><05> <00><05> <00><05><05> ISO/IEC 10646. <00><05><05> <00><05><05><05> <00><05> <00><05><05> <00><05><05><05><05><05> <00><05><05><05><05> <00><05><05><05>, <00><05> <00><05><05><05><05><05><05><05> <00><05><05><05><05><05><05>, <00><05><05><05><05><05><05> <00><05><05><05> <00><05><05><05><05>. <00><05><05><05><05> <00><05><05> <00><05><05><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05> <00><05><05><05><05><05><05> <00><05> <00><05><05><05><05> <00><05> <00><05><05><05><05><05> <00><05><05><05>-<00><05><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05>, <00><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05><05><05><05><05><05><05> <00><05><05><05><05><05>.
<00><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05>-<00><05><05><05> <00><05> <00><05><05><05><05><05><05><05> <00><05><05>-<00><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05> <00><05><05><05><05><05><05> <00><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05><05><05><05><05>. <00><05><05><05><05> <00><05><05><05><05><05><05><05>, <00><05><05><05> <00><05><05><05><05> <00><05><05> <00><05> <00><05><05> <00><05><05><05> <00><05><05><05> <00><05><05><05> <00><05><05><05><05><05> <00><05> <00><05><05><05><05> <00><05><05><05><05><05> <00><05><05><05><05><05><05><05><05>, <00><05><05><05><05> <00><05><05><05><05> <00><05><05> <00><05><05><05> <00><05><05><05><05><05><05><05> <00><05><05><05><05><05><05>. <00><05><05><05><05><05><05> <00><05><05><05><05> <00><05><05><05> <00><05><05><05><05><05> <00><05><05> <00><05><05><05><05><05> <00><05><05><05> <00><05><05><05><05><05> <00><05><05><05> <00><05><05><05><05><05><05>.
<00><05><05><05><05> <00><05><05><05><05> <00><05><05><05><05><05><05><05><05><05><05> <00><05> <00><05><05><05><05><05><05> (Unicode Consortium
#
Hva<00> er Unicode?
Unicode sta<00>allinn <00>thlutar hverju skrift<00>kni t<00>lu,
sem er <00>h<00><00> t<00>lvuger<00>,
sem er <00>h<00><00> forriti,
sem er <00>h<00><00> tungum<00>li.
T<00>lvur geta <00> e<00>li s<00>nu a<00>eins unni<00> me<00> t<00>lur. <00><00>r geyma b<00>kstafi og <00>nnur skrift<00>kn me<00> <00>v<00> a<00> <00>thluta <00>eim t<00>lu. <00><00>ur en Unicode kom til voru hundru<00> mismunandi t<00>lkunarkerfa sem <00>thlutu<00>u <00>essum t<00>lum. Ekkert eitt t<00>lkunarkerfi gat innihaldi<00> n<00>gilegan fj<00>lda skrift<00>kna; t.d. <00>arfnast Evr<00>pusambandi<00> nokkurra mismunandi kerfa til a<00> spanna <00>ll tungum<00>l <00>ess. Jafnvel fyrir eitt tungum<00>l, eins og ensku, var eitt t<00>lkunarkerfi ekki n<00>g fyrir alla b<00>kstafi, greinarmerki og algengustu einingat<00>kn.
T<00>lkunarkerfin hafa einnig veri<00> <00> andst<00><00>u hvert vi<00> anna<00>, <00>.e. tv<00> kerfi geta nota<00> s<00>mu t<00>lu fyrir tv<00> <00>l<00>k skrift<00>kn e<00>a nota<00> tv<00>r mismunandi t<00>lur fyrir sama t<00>kni<00>. S<00>rhver t<00>lva <00>arf(s<00>rstaklega mi<00>larar) a<00> sty<00>ja margs konar t<00>lkanir <00> st<00>fum; engu a<00> s<00><00>ur er alltaf h<00>tta <00> stafabrenglun <00>egar g<00>gn fara <00> milli t<00>lva og <00> milli mismunandi t<00>lkunarkerfa.
Unicode breytir <00>essu <00>llu!
Unicode gefur hverju skrift<00>kni eigin t<00>lu sem breytist ekki eftir t<00>lvuger<00>, forriti e<00>a tungum<00>li. Unicode sta<00>allinn hefur veri<00> tekinn upp af fork<00>lfum t<00>lvui<00>na<00>arins; Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys og m<00>rgum <00><00>rum. Unicode er nota<00> af n<00>t<00>mast<00><00>lum eins og XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, o.s.frv. og er hin opinbera lei<00> til a<00> <00>tf<00>ra ISO/IEC 10646. Unicode sta<00>allinn er studdur af m<00>rgum st<00>rikerfum, <00>llum n<00>t<00>mav<00>frum og m<00>rgum <00><00>rum b<00>na<00>i. Tilkoma Unicode sta<00>alsins og b<00>na<00>ar til a<00> sty<00>ja hann eru veigamikil skref <00> <00>r<00>un hnattr<00>nnar t<00>kni.
A<00> nota Unicode <00> notendami<00>lurum e<00>a <00> forritum og vefs<00><00>um me<00> m<00>rgum notendavi<00>m<00>tum b<00><00>ur upp <00> umtalsver<00>an sparna<00>, <00> samanbur<00>i vi<00> a<00> nota eldri stafat<00>flur. Unicode leyfir einum forritapakka e<00>a einni vefsl<00><00> a<00> n<00> til margra t<00>lvuger<00>a, tungum<00>la og landa <00>n endurh<00>nnunar. Unicode gerir g<00>gnum kleift a<00> fer<00>ast gegnum m<00>rg mismunandi kerfi <00>n brenglunar.
Um Unicode samt<00>kin (Consortium)
Unicode Consortium samt<00>kin stefna ekki a<00> hagna<00>i. <00>au voru stofnu<00> til a<00> <00>r<00>a, <00>tv<00>kka og koma <00> framf<00>ri Unicode sta<00>linum, sem skilgreinir framsetningu <00> texta <00> n<00>t<00>maforritap<00>kkum og st<00><00>lum. Me<00>limir samtakanna eru fulltr<00>ar margs konar fyrirt<00>kja og stofnana <00> t<00>lvu- og uppl<00>singai<00>na<00>inum. Samt<00>kin hafa eing<00>ngu tekjur af a<00>ildargj<00>ldum s<00>num. Fyrirt<00>ki, stofnanir og einstaklingar hvar sem er <00> heiminum sem <00>
#<00><>