Uzanto:Blahma/Proponoj por robotoj

Ĉi tio estas loko, kie vi rajtas enmeti viajn proponojn por robotoj, kiuj aŭtomate senigu la Vikipedion de la plej diversaj fuŝaĵoj, kiuj hodiaŭ malbeligas ĝin. Sentu vin libera skribante ĉi tien pri ĉiuj ajn problemoj, kiujn vi renkontas, kaj mi poste konsideros ilin, sciigos vin pri la kreebleco (efektive mia kapablo krei ;-) de tia roboto kaj fine eventuale kreos tian roboton kaj lanĉos ĝin por ke nia Vikipedio floru eĉ pli ol hodiaŭ :)

Nefunkciantaj malnovstilaj ligiloj al bildoj redakti

Antaŭe oni uzis en artikoloj rektajn ligilojn al bildoj de eksteraj fontoj, kio hodiaŭ ne plu funkcias. Necesas trovi tiajn paĝojn kaj:

  • aŭ la bildojn alŝuti en la Vikipedion rekte (prefere al Wikimedia Commons) se oni trovas la bezonatajn informojn pri kopirajto
  • aŭ trovi aliajn konvenajn bildojn pri la tempo en la esperanta enciklopedio mem aŭ en Wikimedia Commons kaj aldoni tiujn anstataŭe
  • aŭ enmeti ĝuste priskribitan kaj lokitan ligilon al bildo, se ĝi estas interesa sed nehavebla ene de la enciklopedio
  • aŭ tian ligilon entute forigi de la enciklopedio

La roboto prefere nur identigu tiajn fuŝe enmetitajn bildojn - la decidon pri la bezonata ago kaj la agon mem prefere faru kaj efektivigu homo. Blahma 01:23, 30. Nov 2005 (UTC)

Majuskligo de familiaj nomoj redakti

La kutimo skribi familiajn nomojn majuskle estas tre utila, sed ĝia nekono de ĉiuj vikipediistoj kaŭzas la ekeston de pluraj ligiloj, kiuj nefunkcias simple pro tio, ke alligas al malĝusta (neĝuste majuskligita) formo de la nomo. Roboto povus por ĉiu artikolo pri iu persono serĉi la enciklopedion por tiaj ĉi fuŝaj ligiloj kaj aŭtomate anstataŭigadi ilin. Blahma 01:23, 30. Nov 2005 (UTC)

Nealligitaj jaroj redakti

Jaron en artikoloj oni almenaŭ je la unua apero ĉiam alligu (ekzemple 1986). Tiel oni povas facile ekscii, kio alia okazis en la sama epoĥo. Roboto povus serĉi en artikoloj sendubajn menciojn de jaroj (ekzemple "en la jaro ####", kie #### estas iu nombro) kaj alligadi tiujn al la koncernaj artikoloj. Blahma 01:23, 30. Nov 2005 (UTC)

Certaj alilingvaj viki-oj alligas ĉiujn jarojn, ĉar li pensas ke malsamkoloraj datoj aspektas iom strangaj... mi akordas kun ili. Le Hibou 03:40, 30. Nov 2005 (UTC)
Bonas, ĉar tio plifaciligos mian estontan laboron, se mia roboto ne devos zorgi pri redundanco. Tamen, certe restos la problemo, ke ne ĉiu nombro en artikola teksto estas jaro, do se oni unue mencios la jaron en iu komprenebla formo (frazero sciiganta ke temas pri jaro) kaj duafoje enmetos ien nur la nombron sen vortoj informantaj pri la "jareco" de la nombro, la roboto ne sukcesos ekscii tion. Tamen verŝajne estas ĉi-kaze pli bona io ol nenio. Kaj, fakte, tiu ĉi (al alia) roboto povus ankaŭ prizorgi aŭtomatan alligadon de datoj nealligitaj, ne nur jaroj. Blahma 14:21, 30. Nov 2005 (UTC)

Ligiloj en titoloj redakti

La teksto de ĉiu artikolo en la enciklopedio komenciĝu per grase emfazita titolo de la artikolo. En la esperantlingva Vikipedio okazas ofte, ke tiu titolo rekte enhavas ligilojn al aliaj artikoloj. Tamen tio malbelaspektigas la titolon, ĉar pro la koloroj kaj substrekiĝo oni apenaŭ povas ankoraŭ distingi, ke temas pri parto de graslitere skribita titolo (ekzemple Universitato de Horní Dolní). Tia uzo kontraŭas la Stilgvidon de la angla Vikipedio (kiu bedaŭrinde multe pli grandas ol la Stilgvido de la esperantlingva), kie oni donas la rekomendon ripeti la vorton en la teksto ie proksime post la titolo kaj alligi nur tion. Roboto povus tiajn ĉi problemajn artikolojn elserĉadi kaj proponadi al homo ŝanĝojn. Blahma 01:23, 30. Nov 2005 (UTC)

Ordigo en kategorioj redakti

Post kiam oni interkonsentus pri kiel ordigi nomojn de homoj, universitatoj ktp. en kategorioj, roboto povus korekti ĉiujn kategoriajn ligilojn en tiuj artikoloj - ĉar tiuj ligiloj oftege entute ne enhavas la laŭalfabetigan parton ([[Kategorio:Esperantistoj|BLAHUS, MAREK]]), kio fuŝas sekve ilian ordon de apero en la koncerna kategorio - kaj, bedaŭrinde, kie oni jam sekvis tiun ĉi regulon, sed nur parte, la situacio poste iĝas eĉ pli konfuza kaj malklara, ĉar oni entute ne scias sub kiu litero serĉi artikolojn. Blahma 01:23, 30. Nov 2005 (UTC)


Mi proponas tiujn regulojn por kategorioj:
1. Ĉiu enkategoriigo enhavu kategorionomon (KN) kaj alfabetordigan parton (AP) ekz [[Kategorio:NP|AP]] [[Kategorio:Kosmonaŭtoj|GAGARIN JURIJ]]
2. La AP neniam estu malplena.
3. La AP enhavu nur la latinajn literojn A-Z, ĉiam majusklajn, kaj interspacon.
4. La AP neniam enhavu akcentitajn literojn, eks, Á Ñ Ö È ktp( mi ne certas pri la esperantaj aldonoj, Ĉ,Ĝ,Ĥ,Ĵ,Ŝ,Ŭ)
5. La AP neniam enhavas interpunkciaĵojn. Sole interspacoj validas, kaj neniam duoblitaj.
La kialo estas pro tio, ke la sortordigo estas severe ASCII-eca, (aŭ ASCII-eska?), aŭ Unikoda. Tiu signifas, ke post majusklaj literoj venas minusklaj literoj, interpunkciaĵoj povas veni antaŭ, post aŭ inter majusklaj kaj minuskloj, same por akcentitaj literoj. Do la ordo eble povus esti (me ne estas certa, nure por ekxemplo):
interspaco, [A-Z], [á,Á,Â] [Ĉ,ĉĜ,ĝ,Ĥ,ĥ,Ĵ,ĵ,Ŝ,ŝ,Ŭ,ŭ] [&",#'§!ç) ][a-z] [0-9] ktp
Mi preferus vidi je Martina NÁVRATILOVA post Vladimir NABOKOV, sed ne post John NOAKES. Ekz, se ni uzas la AP-oj "NABOKOV VLADIMIR", "NÁVRATILOVA MARTINA", "NOAKES JOHN", ni vidos sub N: "Vladimir NABOKOV", "John NOAKES", "Martina NÁVRATILOVA" ĉar Á sekvas Z. (memoru ke la AP neniam estas montrata, sole la artikolotitolo, do ni povas uzi NAVRATILOVA senakcente)
Roboto povus fari:-
1. Se la AP estas malplena, enmeti la titolon de la artikolo, laŭ la suprajn regulojn. (Pli bone ol la defaŭlto, kiu uzas la titolon, kun minuskloj, akcentoj ktp)
2. Se la AP estas uzata, ŝanĝi ĝin konforme al la suprajn regulojn.
3. Se la roboto povas dedukti ke la artikolo temas pri propra nomo, ĝi povus enmeti la AP kiel [[Kategorio:KN|MAJUSKLAPARTO MINUSKLAPARTO]] ekz [[Kategorio:Roboto|BLAHUS MAREK]] (mi preferus forigi la komon, ĉar homoj ne ĉiam uzas ĝin, kaj la komo kontraŭas regulon 5)
Konsiderenda: Germana "sz" au "ss" simbolo (mi ne povas tajpi ĝin, ĝi aspektas iom kiel B). Esperantaj literoj - ĉu ni volas ke ili venu post Z?. Aliaj kunligitaj literoj, OE, AE. Germana Ö, ĉu estu O aŭ OE? (Schröder --> SCHRODER aŭ SCHROEDER?).
Robotoj povus solvi ĉi tiujn problemojn, sed pli bone estus ŝanĝi la regulojn pri alfabetordigo - tiuj estas ie en la vikia programaro - eble estas pli facile, uzi robotojn.

Bonŝancon. Le Hibou 04:33, 30. Nov 2005 (UTC)


Elkorajn dankojn, Le Hibou, pro via profunde prilaborita propono por ordigado, kiu inkluzivas eĉ konkretajn konsilojn pri funkciado de la onta roboto. Mi konsentas kun vi pri la plejmulto, nur mi havas du komentojn:

  1. La specialan pritraktadon de iuj elnomitaj literoj mi evitus. Ja tiel farante vi jam komencas ion, kio certe estus plej taŭga (do enorda laŭnacilingva ordigado), sed ne ebla almenaŭ kun la nuna viki-programaro aŭ eble eĉ entute, ĉar ekzistas multaj lingvoj kaj ĉiu havas siajn proprajn, kaj ofte komplikajn ordigadregulojn (mi scias, pri kio mi parolas, ĉar ekzemple en la ĉeĥa ekzistas eĉ dufoja enordigado - je unua fojo oni traktas literojn kun certaj diakritikaĵoj egalaj al iliaj amikoj sendiakritikaĵaj, kaj je la dua trairo de la listo ne plu). Ja se oni enkondukus iun transkribadon por nomoj germanaj (ö -> oe ktp.), tiam kial poste ne enkonduku similajn regulojn por aliaj lingvoj? Kaj kiu diros, por kiuj lingvoj fari kaj por kiuj ne? Kaj kion fari se la verkinto de la artikolo ne konas la ordigadregulojn de la koncerna lingvo? Aŭ se la roboto nescipovas ekscii tion? Aŭ se eĉ la lingvo de kiu la nomo devenas estas ĝenerale nekonata? :o)
  2. La uzon de la komo (aŭ fakte prefere alia taŭga tipo) por apartigi familinomo(j)n kaj personnomo(j)n mi konservus. Ja se oni indikos tion en la reguloj (kiuj nepre ĉiukaze estos verkotaj, voĉdonkonfirmotaj kaj publikigotaj), homoj ne forgesados pri ĝi, same kiel ne forgesados pri la ĉiammajuskleco kaj nurlatinlitereco de la AP-j. Plej grave, la komo estas utila, ĉar ĝi aldonas kroman informon uzeblan dum la ordigado. Ja estus bone, se [[Matheus ARTIOLI FIRMINO]] aperas nur post [[Pablo ARTIOLI]]. Kun la nuna sistemo, la AP-j tamen enordiĝos kiel "ARTIOLI FIRMINO MATHEUS" kaj nur poste "ARTIOLI PABLO". La enmeto de iu taŭga tipo por apartigi familinomojn kaj personnomojn do helpus tiel, ke la ordo poste estus "ARTIOLI, PABLO" kaj nur post ĝi "ARTIOLI FIRMINO, MATHEUS". Tamen rigardante la ASCII-tabelon ŝajnas al mi, ke komo ne taŭgos por tio ĉi, ĉar ĝia ASCII-kodo estas pli granda ol tiu de spaco. Kaj ĉar spaco havas kodon 32, fakte verŝajne malfacilos trovi tian taŭgan tipon - kondiĉe ke la ordigsistemo de la Vikipedio laboras strikte laŭ tipokodoj - tion mi ankoraŭ priesploros.

Blahma 22:03, 30. Nov 2005 (UTC)


Punkto 2: Jes, vi certe ĝustas. Punkto 1, mi devas plu pripensi!

Aliaĵo - mi pensas ke se ni havas programiston ligita kun nia eo-projekto, tiu estus tre bone, do denove, bonŝancon al vi!.
Le Hibou 22:45, 30. Nov 2005 (UTC)