UTF-8: Malsamoj inter versioj

[kontrolita revizio][kontrolita revizio]
Enhavo forigita Enhavo aldonita
Addbot (diskuto | kontribuoj)
e Roboto: Forigo de 35 interlingvaj ligiloj, kiuj nun disponeblas per Vikidatumoj (d:q193537)
malkonfuzo de signo kaj signonumero
Linio 1:
'''UTF-8''' estas maniero prezenti (enkodigi) [[Unikodo|unikodajn]] signojnsignonumerojn per sinsekvo da [[bajto]]j. Ĝia nomo devenas de la [[angla lingvo|anglalingva]] mallongigo ''Unicode Transformation Format'' (unikoda transforma aranĝo). La nombro "8" indikas la fakton, ke la plejsignonumerojn mallongajoni koderojmalkomponas havasen 8-bitajn bitojn; la longo de la kodoj povas varii inter 8 kaj 32 bitojbajtojn, grupigitaj al 1 ĝis 4 [[bitoko]]jjn.
Tia perbajta kodoprezento havas varian longon, de 1 ĝis 4 bajtoj.
 
UTF-8 estas difinita en la [[normo]] [[RFC 3629]]. Principe ĝia skemo povas uzi ĝis 6 bitokojn por unu signo, sed Unikodola estasUnikodaj limigitasignonumeroj alne superas 17·2<sup>16</sup> koderoj, kaj por tiuj sufiĉas 4 bitokoj.
 
UTF-8 sekvas la principon, ke la komenca bitoko de signosignonumero estu klare rekonebla. TielTial eblas malkodi signoviconkodoprezenton de signoĉeno ne nur deekde la komenco, sed de ajna punktoties en ĝipozicio. Tio funkcias, ĉar la unua bitoko en signosignonumero neniam komenciĝas per la bitoj "10", sed la sekvaj bitokoj ĉiam. Krome el, la unua bitoko klare ekkoneblasindikas, kiom da bitokoj havas la signo,prezento de signonumero — nome tiom, kiom da unuoj estas(kiom da bitoj "1") aperas komence de la unua bitoko. Escepto estas la unu-bitokajunubajtaj signojprezentoj de signonumeroj, kiuj komencaskomenciĝas per "0".
 
Jena tabelo montras la strukturon de la 1-, 2-, 3- kaj 4-bitokaj signojprezentoj de signonumeroj (x-oj indikas variajn bitojn informajn, kiuj konsistigas la propran numeron):
 
{| border="1" cellspacing="0" cellpadding="2"
Linio 30 ⟶ 31:
|}
 
Oni kritikis pri UTF-8, ke ĝiajla prezentoj de koderojsignonumeroj havas malsamajn longojn. Iam tiurilate la enkodigokodoprezento [[UTF-16]] havis avantaĝon, sed de kiam 2 bitokoj ne plu sufiĉas por Unikodo, tiu avantaĝo malpliiĝis.
 
La fakto, ke la unu-bitokaj signoj komenciĝas ne per "10", sed per "0", impresas kiel neregulaĵo. Sendube tiun decidon kaŭzis la deziro de kongrueco kun 8-bita reprezento de [[Askio]].