UTF-8: Malsamoj inter versioj

[nekontrolita versio][nekontrolita versio]
Enhavo forigita Enhavo aldonita
SieBot (diskuto | kontribuoj)
e roboto modifo de: sr:UTF-8
Xqbot (diskuto | kontribuoj)
e roboto aldono de: ms:UTF-8; cosmetic changes
Linio 1:
'''UTF-8''' estas maniero prezenti (enkodigi) [[Unikodo|unikodajn]] signojn. Ĝia nomo devenas de la [[angla lingvo|anglalingva]] mallongigo ''Unicode Transformation Format'' (unikoda transforma aranĝo). La nombro "8" indikas la fakton, ke la plej mallongaj koderoj havas 8 bitojn; la longo de la kodoj povas varii inter 8 kaj 32 bitoj, grupigitaj al 1 ĝis 4 [[bitoko]]j.
 
UTF-8 estas difinita en la [[normo]] [[RFC 3629]]. Principe ĝia skemo povas uzi ĝis 6 bitokojn por unu signo, sed Unikodo estas limigita al 17&middot;·2<sup>16</sup> koderoj, kaj por tiuj sufiĉas 4 bitokoj.
 
UTF-8 sekvas la principon, ke la komenca bitoko de signo estu klare rekonebla. Tiel eblas malkodi signovicon ne nur de la komenco, sed de ajna punkto en ĝi. Tio funkcias, ĉar la unua bitoko en signo neniam komenciĝas per la bitoj "10", sed la sekvaj bitokoj ĉiam. Krome el la unua bitoko klare ekkoneblas, kiom da bitokoj havas la signo, nome tiom, kiom da unuoj estas komence de la unua bitoko. Escepto estas la unu-bitokaj signoj, kiuj komencas per "0".
Linio 56:
[[lv:UTF-8]]
[[ml:യു.ടി.എഫ്-8]]
[[ms:UTF-8]]
[[nl:UTF-8]]
[[nn:UTF-8]]