Unikodo venas!

Ĵuse pluraj eventoj markis avancon de Unikodo. Ni parolos pri tiuj, kiuj koncernas eŭropajn normojn kaj la Tut-Teran Teksaĵon.

Du Eŭropaj normoj

Realigo de la plena Unikoda normo, entenanta pli ol 30 mil signojn, rimedojn por la dedekstra skribo ktp prezentas seriozajn teĥnikajn problemojn. Tamen iom post iom oni komencas solvi ilin.

Por bezonoj de la Eŭropa Komunumo la normo ENV 1973:1995 difinas du grandajn subsignarojn de Unikodo, kiuj sufiĉas por la skribsistemoj de ĉiuj eŭropaj lingvoj, kaj interalie entenas ĉiujn literojn de Esperanto:

MES
Minimuma Eŭropa Subsignaro (angle "Minimum European Subset") havas nur 926 signojn, kio ebligas malmultekostan realigon, sufiĉan por la bezonoj de plimulto da eŭropanoj. Detalojn vd en http://www.indigo.ie/egt/standards/mes.html.
EES
Etendita Eŭropa Subsignaro (angle "Extended European Subset") havas ĉiujn signojn, uzatajn en la eŭropaj skriboj kaj relative kompletan sortimenton da signoj uzataj en tekstoj sciencaj, teĥnikaj kaj komercaj. Detalojn vd en http://www.indigo.ie/egt/standards/ees.html.

La Tut-Tera Teksaĵo internaciiĝas

Ankaŭ la programaj varoj komercaj ĉiam pli multe atentas Unikodon. Majkrosofto ellaboris firmaan normon WGL4 (de la angla "Windows Glyph List 4"). Temas pri signaro entenanta 652 signojn sufiĉajn por la skriboj de la eŭropaj lingvoj, inklude la slavajn, la grekan kaj la turkan. WGL4 estas bazita sur la kapablo de Windows-95 kaj Windows-NT adresi (almenaŭ el kelkaj aplikaĵoj) signojn per ilia unikoda dubajta kodono (numero en koda tabelo).

Vd la informojn ĉe la Majkrosofta servilo http://www.microsoft.com/truetype/unicode/cscp.htm.

"Monato" jam raportis (septembro 1996, pĝ 18), ke kvankam Windows-95 kaj Windows-NT enhavas, en siaj tut-eŭropaj versioj, tiparojn kun la kompleta sortimento da literoj de Esperanto, tamen uzi ilin oni ne povis pro manko de aplikaj programoj, kapablaj atingi la "sud-eŭropan" parton de la signaro.

Nun tia aplikaĵo ekzistas. La ĵusa eldono de Netscape [Neckejp], la versio 4.0b3, disponigas al la posedantoj de la tut-eŭropa (Pan-European) vario de Vindozo pretan rimedon por foliumi tre internaciajn dokumentojn en TTT, kiuj povas kombini en unu sama paĝo tekstojn en la lingvoj franca, sveda, pola, rusa ... kaj Esperanto (tamen plu mankas literoj por la skriboj armena, kartvela, kaj la cirilaj literoj por neslavaj lingvoj, ekz-e por la tatara, uzbeka, kazaĥa, ktp).

Du vortojn pri detaloj teĥnikaj. Por transsendi Unikodon tra Interreto estas uzataj la normoj UTF-7 (kun sepbitaj bajtoj) kaj UTF-8 (kun okbitaj bajtoj). En ambaŭ normoj la signoj askiaj (tiuj kies numeroj estas malpli grandaj ol 128) estas prezentataj per unu bajto; por la pli grandaj numeroj oni uzas dekuman numeralon (en UTF-7), aŭ pli komplikan kombinon da tujsekvaj bajtoj (en UTF-8 ĉiuj signoj de la eŭropaj signaroj prezenteblas per dubajtaj kombinoj). Ekz-e la vortojn "Eĥoŝanĝo ĉiuĵaŭde" oni kodas en UTF-7 per

Eĥoŝanĝo ĉiuĵaŭde

Evidente, por ĉiu supersignita litero UTF-7 bezonas 6 bajtojn, dum UTF-8, nur 2 (por la signoj de orienta Azio UTF-8 bezonas pli da bajtoj); aliaj diferencoj inter UTF-7 kaj UTF-8 ne estas. Mi aldonas foton de ekrana fenestro, sur kiu Netscape 4.0b3 prezentas fragmenton el la reta versio de mia "Komputika Leksikono". Atenta leganto trovos tie literojn Esperantajn, rusajn, polajn, signojn de fajna tipografio (haltostreko, citiloj), mankantajn en la Latina-1a.

Oni povas trovi Netscape 4.0b3 laŭ la indikoj el http://home.netscape.com/comprod/mirror/client_download.html (sufiĉas elŝuti "Netscape Communicator Preview Release 3 --- Typical Install").

Instalinte tiun foliumilon en vian komputilon, vi povos legi specimenajn HTML-tekston en UTF-7 aŭ en UTF-8. Cetere, ankaŭ la alia plej grava foliumilo, la majkrosofta "Internet Explorer 4.0" bone komprenas tiun signaron, kaj tute ĝuste surekranigas la indikitajn ekzemplajn HTML-paĝojn.

Sergio POKROVSKIJ

Noto de la eldonejo

Por povi uzi Unikodon en Windows 95, tamen estas necese instali la "fremdlingvajn" tiparojn. Tio okazu en "Tiu ĉi komputilo", "Konfiguraĵo", "Programaro", "Windows". Tie "Plurlingva uzo" devas esti hokita.

Indekso
Lasta adapto: 11 januaro 2000