Vikipedia diskuto:Laŭalfabetigo/Arĥivo-01

Kion fari pri w? Laŭ punkto 5 oni taksu ĝin kiel ligaturon v+v, sed mi jam suspektas, ke multaj homoj kontraŭos tion. Ni havas la sekvajn eblojn:

  • Trakti ĝin kiel propran literon inter v kaj z, simile al la statuso de q. Tio normalas en multaj lingvoj.
  • Trakti ĝin kiel specialan v kiu aperu tuj post la ordinara v, simile al þ tuj post t. Tio ankaŭ normalas, ekzemple en Islandaj vortaroj.
  • Trakti ĝin kiel v+v.
  • Trakti ĝin kiel varion de ŭ.

Bab 16:44, 22. Nov 2004 (UTC)


Dankon pro la detala propono, kun kiu mi preskaŭ senescepte konsentas. Koncerne "w" mi subtenas la unuan proponon (litero inter v kaj x – mi supozas); ne estas bezono devii de la latina kutimo. Fonetikajn similecojn (ekz. inter ŭ kaj w) ni devas ignori; ili estas tro dependaj de la konsiderata lingvo.

La logogramoj verŝajne ne kaŭzos grandajn problemojn (pro sia malofteco), sed tamen oni povus argumenti, ke "&" historie estas ligaturo de "e+t" (latina "et" = "kaj"). Kaj ekzistas plurliteraj logogramoj, ekzemple "TM" (™). Kio pri ili?

--ismo 19:24, 22. Nov 2004 (UTC)

Ni bezonas pli da voĉoj. Kiuj anoj de diversaj lingvoj opinias pri w? (Kaj mi volas precizigi, Ismo, ke w ne eris en la origina Latina alfabeto; ĝi estas Anglosaksa invento kiu poste disvastiĝis al diversaj lingvoj kaj pere de la kolonioj Anglaj, Germanaj kaj Nederlandaj al plej diversaj kulturoj.)
Koncerne "&", ĝia etimo ne plu klarvideblas, kaj tiukaze estus konfuze por multaj homoj ordigi ĝin sub "et". Plurliterajn logogramojn ni certe ordigu laŭ siaj respektivaj literoj. Ĉu tio jam ne klaras en la teksto? Bab 21:05, 22. Nov 2004 (UTC)
Mi ne komprenas la diferencon inter la unuaj du alternativoj por pritraktado de la litero 'w'.
--VerdLanco 13:16, 25. Nov 2004 (UTC)
Nu, la unua estas "trakti ĝin kiel memstaran literon", t.e. "Woodrow WILSON" aperas sub titola litero W inter V kaj X. La dua efektive estas "trakti ĝin same kiel oni traktas diakritajn literojn", t.e. oni konsideras w nuran varion de v, kiel ê de e, kaj sekve "Woodrow WILSON" aperas sub titola litero V sed post eventuala "VILSON". Bab 13:39, 26. Nov 2004 (UTC)
Bone, mi komprenas; laŭ tiu sistemo, "WILSON" aperas inter "Vikipedio" kaj "Vjetnamo". (Mi ne voĉdonos por tia sistemo.)
--VerdLanco 22:00, 26. Nov 2004 (UTC)

Cetere mi ĵus rimarkis, ke la Kategorioj aŭtomate laŭalfabetigas, verŝajne laŭ Angla modelo. Ĉu eblus reordigi la kodon al nia Esperanta sistemo? Bab 21:05, 22. Nov 2004 (UTC)

Kiel vi rimarkis tion? Ĉu ne estis iu 'boto kiu faris tion? 'Botojn oni certe povas reprogrami.
--VerdLanco 13:16, 25. Nov 2004 (UTC)
Nu, vidu ekzemple je Kategorio:Vikipediistoj kie aperas Ĉ... Bab 13:39, 26. Nov 2004 (UTC)
Same pri interviki-ligiloj.
--VerdLanco 13:16, 25. Nov 2004 (UTC)


En la hungara: v, w (sam sono kiel v) x,y,z. W sonas en la angla kiel ŭ en la hungara kiel v. Ĉu ni havs artikolon pri W? RK


Programo

redakti

Mi pensas, ke estas pli facile klarigi la regulojn per programeto. La nuna priskribo per vortoj estas (por mi) tre malklara, sed jen programeto, kiu realigas unu interpreton. Evidente mi ne kompletigis la tabelon, sed la inkluzivitaj signoj eble sufiĉas por montri ĉiujn interesajn problemojn.

#!/usr/bin/perl -w

use utf8;
use open ':utf8';
binmode(STDIN, ':utf8');
binmode(STDOUT, ':utf8');

print join("\n", sort { oval($a) cmp oval($b) } split(/\n/, join("", <>))), "\n";

sub oval {
    my ($x) = @_;
    my %t =
       (
        " " => " ::01",
        "-" => "::02",
        "s" => "s,:,:1",
        "S" => "s,:,:2",
        "ß" => "s,s,:1:1",
        "u" => "u,:,:1",
        "U" => "u,:,:1",
        "ŭ" => "ux,:,:1",
        "Ŭ" => "ux,:,:2",
        "û" => "u,:1,:1",
        "Û" => "u,:1,:2",
        "v" => "v,:,:1",
        "V" => "v,:,:2",
        );
    my $a = "";
    my $b = "";
    my $c = "";
    $x =~ s/ +/ /;
    $x =~ s/^ //;
    $x =~ s/ $//;
    foreach my $s (split(//, $x)) {
       $t{$s} =~ /(.*):(.*):(.*)/ or die "Nekonata signo: $c\n";
       $a .= $1;
       $b .= $2;
       $c .= $3;
    }
    "$a $b $c";
}

Jen kelkaj vortoj ordigitaj per la programo:

u u
us
ûs
Uss
uß
Uß
usss
u-U
uu
uU
Uu
uû
ŭs

Oni ordigas laŭ tri kriterioj: laŭ la literoj, laŭ la supersignoj, kaj laŭ la majuskleco kaj interpunkcio.


Diskuto

redakti

(Unue, mi ne pensas, ke longa listo de ĉiuj signoj estas utila; pli bone estus klarigi la ĝeneralan regulon. Due, mi malkonsentas pri la sinsekvo "Ĝ ğ". Trie, ordigado de unuopaj literoj ne estas la malfacila parto; la malfacila parto estas la prioritato: ekzemple, kiel oni ordigu "Aa" kaj "aá", aŭ "eb" kaj "éa"? Spacetoj kaj interpunkcio estas alia problemo.)

Respondo: Mi komencis ĉi liston nur pro la "programinto", laŭ kiu "La nuna priskribo per vortoj estas (por mi) tre malklara". Mi volonte forigos ĝin anstataŭ tutplenigi ĝin. :-)
Se vi zorge legis la tekston de la regularo, vi vidas ke ordigado de diakritaj literoj tie estas plejparte solvita. "éa" venas antaŭ "eb", ĉar "é" estas nura vario de "e", dum "a" kaj "b" estas malsamaj leteroj. Pri "Aa" kaj "aá" mi ne certas, sed mi pensas ke sendiakritaj literoj ĉiam venu unue, senkonsidere de uskleco (turka senpunkta i estas nepra escepto, pri la kialo vidu la regulojn). La sinsekvo "Ĝ ğ" kreskis el natura bezono havi unuecan sinsekvon por ĉiaj diakritaj markiloj, sen pripensi la literojn. Se vi ŝanĝas la sinsekvon, tio signifas, ke "û" venos post "ŭ", kio por mi estas multe pli ĝena "rompo" ol "Ĝ ğ". "ğ" ja ĉiukaze estas malofte uzata letero de la Turka, kiu eĉ ne estas prononcata kaj (laŭ mia scio) ne aperas vortokomence. La okazoj kiam ĝi sekvos je ĝ do estas ege malpli multaj ol tiuj kiam aperas vortoj distingitaj je û - ŭ. Bab 20:16, 26. Nov 2004 (UTC)
Tio neniel signifas, ke "û" venos post "ŭ". Male. Provu la programon.
Diru, se vi malkonsentas pri la ordigado en la listo sub ĝi.
Ne, vi ne komprenas min. En via programo ğ venas antaŭ ĝ, dum ŭ venas post û. Tio estas nelogikaĵ: Je unu signo "luneto" venas antaŭ "ĉapelo", dum je alia signo "ĉapelo" venas antaŭ "luneto". Kiam mi kreis mian ordigan liston, estis ĝuste por havi diakritan sinsekvon sendependan de la diversaj literoj. En via programo oni devas fari esceptojn por kelkaj literoj, kio ne necesas en mia "ĉion-ordiga" listo. Prenu ajnan literon, tralegu la regulojn, kaj vi trovos ĝian lokon. Vi bonvolas proponi alian sinsekvon, sed bonvolu pli bone konsideri la tuton antaŭe. Kiel mi skribas en la teksto, jam ekzistas tradicio por listigi haĉekajn c kaj s sub ĉ kaj ŝ, respektive, do la sola ĝeno estas tiu Turka luneta g - eble ĉar ni Eŭropanoj pli kutimas legi Ĉeĥajn ol Turkajn nomojn? Laŭ mia simpligema vidpunkto ĉapelo estas ĉapelo, ĉu ĝi aspektas kiel ĉe "ĝ", inversigite, aŭ kiel ĉe "ŭ". Mi vidas kiel avantaĝon samloken grupigi la ĉapelitajn literojn, ne obstaklon. Bab 21:22, 26. Nov 2004 (UTC)
Kompreneble mi miskomprenas vin, ĉar vi insistas komuniki per Esperanto anstataŭ per Perlo! :-)
Mi ne scias, ĉu mi povas konsenti pri via unueca supersigna sinsekvo. Laŭ mi estu ekzemple: ua, ûa, ub, ŭa.
Nu, plejmulto da homoj ĉi tie komunikadas per Esperanto! Via programo eble utilos por kelkaj, sed mi kredas ke oni ĝenerale preferos regulohavan tekston, kiel la nune ekzistantan. Kial vi ne povas konsenti? Laŭ mi ankaŭ estu ua, ûa, ub, ŭa. La sinsekvo de la diakritoj ne tute rilatas al la sinsekvo de la literoj: Vi imagu vastan gamon da diversaj signoj, kie oni "hazarde" (pro tradicio) decidas ke iuj estu propraj literoj kaj aliaj variaj literoj: u ú ù û ŭ v y ý z. La diakrita sinsekvo samas, sed je ŭ komenciĝas "nova sekcio". Espereble vi nun komprenas min. Bab 13:54, 27. Nov 2004 (UTC)
Estas malfacile kompreni tiajn neformalajn priskribojn. (Kion signifas "nova sekcio"?) Se vi ne povas kompreni la programon, ni devas komuniki per ekzemploj. Ĉu vi konsentas pri la ordigado en la skatolo sub la programo?
Ni revenu al ğ. Per viaj priskriboj mi komprenas pli-malpli nenion, do eble vi montru per ekzemplo, kiel vi ordigas jenon: ga ğa gb ğb ĝa ĝb
Eble estas iom malfacile, sed tute eblas kompreni la sistemon de Bab. "Nova sekcio" simple signifas "nova litero" (male al "variaĵo de la sama litero"). Do mi pensas, ke vi ambaŭ samopinias, kaj la ordo iĝas jena:
us
ûs
ûŝ
ŭs
ŭŝ
Por eviti miskomprenojn, indas en la reguloj mencii aparte, ke la ses specialajn Esperanto-literojn oni neniam traktu kiel variaĵojn de latinaj literoj (ĉar tiuj latinaj literoj mem ja estas apartaj E-literoj). En Esperanto (kaj kompreneble ankaŭ laŭ la sistemo proponita de Bab), vortoj kiuj komenciĝas per ĉ ne povas aperi en la sekcio "vortoj kiuj komenciĝas per 'c' ", kaj ŭ ne povas aperi sub 'u'. La diskutebla afero estas do, kie en la ordo meti la ne-esperantajn literojn. Ekzemple, se ni metos û sub 'ŭ' anstataŭ sub 'u', la ordo iĝos:
us
ŭs
ûs
ŭŝ
ûŝ
Pri la sinsekvo de diakritaj variaĵoj ("ê ě" aŭ "ě ê") mi opinias, ke ĝi neniel bezonas rilati al la sinsekvoj "u ŭ" kaj "s ŝ" en la esperanta alfabeto, ĉar "ê ě" estas variaĵoj de la sama litero, dum "u ŭ" (same kiel "s ŝ") estas du diversaj literoj en Esperanto.
--VerdLanco 23:26, 27. Nov 2004 (UTC)
Mi (Lingvano) konsentas kun VerdLanco. Tamen, mi pensas, ke Bab eble deziras, ke ğ estus variaĵo de ĝ. La klarigo per "sekcioj" estas pli-malpli komprenebla, kiam temas pri unuopaj literoj, sed por klarigi la traktadon de majuskleco oni supozeble bezonus subsekciojn, kaj mi ne scias, kiel tia maniero de klarigado inkluzivus traktadon de ß, kiu estu ordigita kiel ss en la unua paŝo, sed post ss en la dua paŝo, mi supozas. (En la tria paŝo oni distingus inter ss kaj SS.)
Pri la demando, ĉu ğ estu variaĵo de g ĉu de ĝ, mi restas pli-malpli neŭtrala. (Ĝuste tial mi donis du ekzemplojn pri ordigado.) Tamen mi sentas, ke en tiu decido prononco devus gravi pli ol aspekto.
ß oni povas pritrakti kiel "ss"-ligaturon laŭ regulo 5 (simile al æ kaj œ). Sed w mi preferas ne vidi kiel "vv"-ligaturon, ĉar tio ne estas kutimo en aliaj latin-alfabetaj lingvoj. (Mi subtenas pritrakti ĝin kiel apartan literon inter v kaj z, laŭ modelo de la latina aboco.)
Uskleco (se entute ĝi meritas pritraktadon) gravu nur dum la lasta, "polura" ordigado; Pri tio mi supozas ke ĉiuj samopinias.
--VerdLanco 00:21, 28. Nov 2004 (UTC)
Mi (Lingvano) konsentas, escepte pri prononco. Eble la litero ğ estas uzata en nur unu lingvo kaj tial havas difinitan prononcon, sed ĝenerale literoj ne havas bone difinitajn prononcojn, do oni kreas por si problemon, se oni volas uzi la prononcon kiel kriterion. Certe oni tentiĝas trakti č kiel variaĵon de ĉ, sed mi ne scias, kiel oni ĝeneraligus tion, do verŝajne estus pli bone ignori ĉiujn neesperantajn kromsignojn, tiel ke (en la unua paŝo) ğ traktiĝas kiel g.

Spacoj, streketoj kaj apostrofoj

redakti
Titoloj kiuj enhavas lig-streko(j)n (-), apostrofo(j)n ('), spaco(j)n, komo(j)n, punkto(j)n aŭ aliajn ligajn kaj paŭzajn signojn, kaj kiuj ne estas personaj nomoj, aperas kvazaŭ ili nur enhavus literojn, tamen post aliaj, nurliteraj titoloj.

Unue, mi ne komprenas, kial la regulo ne povas validi ankaŭ por personaj nomoj.
Due, mi opinias, ke tiaj titoloj devus veni antaŭ titoloj sen tiaj signoj, ne post. Laŭ mi, "li, bela" aperu post "Libano" sed antaŭ "libela".
--VerdLanco 22:17, 27. Nov 2004 (UTC)

Fakte, pripensinte la aferon iom pli, mi ne certas, ĉu entute indas havi tian regulon. Se ni anstataŭe sekvos la simplan, mekanikan regulon, ke ni dum laŭalfabetigo traktu ĉiun ne-alfabetan signon (inkluzive spacojn kaj parentezojn) simple kiel literon kiu venas plej unue en la alfabeto, ni ekhavos ordon kie "li, bela" aperas post "li" kaj antaŭ "liano", kaj la speciala regulo pri kolizi-evitigaj parentezoj iĝos superflua.
--VerdLanco 22:30, 27. Nov 2004 (UTC)

Tiu simpla regulo havas nedezirindajn sekvojn. Ekzemple, "di-servo" kaj "diservo" estus apartigitaj per multaj vortoj komenciĝantaj per "di", kaj oni havus ekzemple "a, b" antaŭ "a a". Pli bone laŭ mi estas ignori neliterajn signojn en paŝoj unu kaj du, sed atenti spacetojn en paŝo unu. (Mi rememorigas, ke en paŝo unu temas pri simplaj literoj, en paŝo du temas pri supersignoj, kaj en paŝo tri temas pri majuskleco kaj interpunkcio.) La supra programo devus jam realigi tion.


Alia klarigo

redakti

En paŝo unu oni:

  • ignoras ĉiujn signojn escepte literojn kaj ciferojn (kaj spacon)
  • ordigas spacon antaŭ ĉiuj signoj
  • ignoras majusklecon
  • ignoras ĉiujn kromsignojn, escepte tiujn en Esperantaj literoj
  • traktas ĉiun variaĵon de simpla litero same kiel la respondan simplan literon (ekzemple ı kiel i, ŋ kiel n, ...)
  • traktas ligaĵon same kiel ĝiajn konsistigajn literojn (ekzemple ß kiel ss)

La sinsekvo de la signoj estas: 0 1 2 3 4 5 6 7 8 9 a b c ĉ d e f g ĝ h ĥ i j ĵ k l m n o p q r s ŝ t þ u ŭ v w x y z

Se en paŝo unu oni ne povas distingi la du signoĉenojn, oni pluiras al paŝo du.

En paŝo du oni:

  • ignoras ĉiujn signojn escepte literojn kaj ciferojn (kaj spacon)
  • ordigas spacon antaŭ ĉiuj signoj
  • ignoras majusklecon
  • ordigas ligaĵojn post ĉiuj simplaj literoj

La sinsekvo de la signoj estas: 0 1 2 3 4 5 6 7 8 9 ... n ŋ ... ú ù ü ű ů ũ ū ų ư û ...

Se ankaŭ en paŝo du oni ne povas distingi la du signoĉenojn, oni pluiras al paŝo tri.

En paŝo tri oni:

  • atentas ĉiujn signojn
  • ordigas literojn kaj ciferojn post ĉiuj aliaj signoj
  • ordigas majusklojn post minuskloj

La sinsekvo de la signoj, kiuj estas nek ciferoj nek literoj, estas: ...

Reiri al la projektpaĝo "Laŭalfabetigo/Arĥivo-01".