Viquipèdia Discussió:AutoWikiBrowser/Typos

De Viquipèdia

< Viquipèdia Discussió:AutoWikiBrowser

s'ha de tenir en compte que alguna frase pot estar en una altra llengua que empre diferents tipus d'accentuació, també passaria en els cognoms de personatges. –Pasqual · bústia 16:42, 3 set 2006 (UTC)

Has d'incloure un que corregeixi els ll·ll a ll-ll, això és per evitar que intenti posar com a ela geminada paraules del tipus "Bell-lloc" o similars.--SMP (missatges) 17:24, 3 set 2006 (UTC)

El de la ll-ll ja l'he tinguda en compte. Per les paraules en altres llengues, ja he afegit (o estic afegint) el comentari que quan es vulguin arreglar articles on apareixen paraules estrangeres, s'han d'evitar certes entrades. Per exemple, d'aquí un moment introduiré que totes les y passin a i perquè en català, llevat del dígraf ny, la y no apareix (quasi) mai. Però si repassem els articles de la categoria d'Anglaterra, això pot ser desastrós. En tot cas, com que sempre s'han de revisar les correccions que es fan, no hauria d'haver problema.
Voleu col·laborar en la causa tipus a la wiki anglesa on tothom va afegint typos? I podem fer un fòrum d'usuaris d'AWB per resoldre problemes...--Xtv (que dius que què?) 17:38, 3 set 2006 (UTC)

Taula de continguts

[edita] Domineu les regular expressions?

És que hi ha algunes entrades que estic posant que veig que es podrien simplificar i si algú té més coneixement que jo... Per cert, jo estic fent correccions que jo crec que són incorrectes, però és possible que algunes hagin estat acceptades fa poc per l'AVL. Digue-m'ho si en veieu cap! (des que xinés és correcte... :S hahaha).--Xtv (que dius que què?) 17:41, 3 set 2006 (UTC)

Vivenda no és cap barbarisme, està admesa i jo l'he sentida a TV3. --Pepetps hehehe (Podem discutir-ho) 18:30, 3 set 2006 (UTC)
Et recomane que et baixes el salt3. Hi ha un diccionari amb paraules d'ús valencianes. També hi ha col·loquialismes que no són normatius (hi posarà "col·loc"). --Pepetps hehehe (Podem discutir-ho) 18:34, 3 set 2006 (UTC)
regexes... no gaire però a mi em semblen prou bé (mentre funcionin... :). Jo també he provat de trobar errades ortogràfiques aquest matí http://ca.wikipedia.org/wiki/Viquipèdia:Ortografia/ortobot el problema (crec jo) si les corregeixes una a una és que probablement a l'article on hi eren també hi haurà d'altres que no seran detectades per les regexes. O sigui que fora preferible que si en trobes una llegeixis l'article o al menys passesis un corrector automàtic. --62.57.93.166 18:41, 3 set 2006 (UTC)
Osti, ara veig que vivenda i tamany, que fins ara no eren normatives perquè no estan incloses al DIEC, ara el diccionari de l'AVL sí que les accepta... :-S Bé..., mal que em pesi les hauré de de donar per bones, doncs... (el fet que les diguin a TV3 no és cap justificació, ans al contrari...).
Sobre els altres errors que també hi haurà a un article passi aquesta llista, en certa manrera "em són igual" (amb moltes cometes, eh?). M'explico: l'ATB és un programa per fer feines mecanitzades, com un bot, però semi-automàticament. L'altre dia, per exemple, vaig canviar a tots els pobles de Catalunya que tenien la plantilla {{esborrany}} per {{esborrany de Catalunya}}. Fer-ho manualment hauria costat dies i amb aquest programa vaig estar-hi poques hores. Si aprofitant que estic fent aquest feina puc, de passada, corregir algunes faltes que són fàcilment detectables, millor. Ara bé, no em posaré a llegir els 2.000 articles i fer-ne revisió perquè no acabaré mai la meva feina principal que era canviar les plantilles i no pas corregir l'ortografia. Salut.--Xtv (que dius que què?) 18:51, 3 set 2006 (UTC)

Estic tenint dubtes metafísics per moments. Ara es veu que nóvio, l'AVL també l'accepta. I jo em pregunto, pot tenir un article paraules que l'IEC accepti i l'AVL no i viceversa alhora? és a dir, jo entenc que tamany o vivenda s'accepti a un article escrit en valencià, però si en un article s'està usant l'adverbi aquí (per exemple, no admès per l'AVL ja que a València dirien ací), pot contenir alhora tamany? És a dir: és correcte la frase tinc un nóvio aquí i un allà? Quin aiguabarreig, senyor!--Xtv (que dius que què?) 19:05, 3 set 2006 (UTC)

Doncs no, no devem mesclar variants diatòpiques, és deu conservar la varietat dialectal en tot l'article. Jo havia tingut un projecte en ment que mai he ficat a la pràctica, on volia aclarir des del principi en quina variant està redactat l'article per poder mantenir-la en tot l'article. Aixó forma part de les recomanacions dee Viquipèdia:Com escriure un bon article: Redacció, gramàtica i ortografia i no he pogut trobar on es diu exactamant que al principi de l'article hauria de constar en quina variant s'ha redactat el text -que d'alguna manera és el que pretenia ficar en marxa-. –Pasqual · bústia 22:40, 3 set 2006 (UTC)
Doncs justament jo he tingut avui a la mà aquest article on he vist allò de recomanar posar en quin dialecte està escrit l'article i clar, he al·lucinat perquè no ho havia vist enlloc fins ara. Tanmateix, si no teniu res en contra els valencianoparlants, canviaré vivenda per habitatge i tamany per mida, ja que he vist que ni tamany ni vivenda apareixen al DIEC i en canvi tant habitatge com mida apareixen tant al DIEC com al DAVL i així ens apropem a un nombre més gran de parlants. Aixímateix, si veieu algun canvi en l'altre sentit (alguna paraula que al DAVL no aparegui i en canvi trobeu alguna alternativa que sí que apareix a tots dos diccionaris, també ho canviaré (si us sembla bé, eh?)).
Respecte el què és l'AWB i en com em pots ajudar, ara t'estic escrivint una resposta a la teva discussió. Fins ara...--Xtv (que dius que què?) 23:48, 3 set 2006 (UTC)

[edita] Rodejar

Com modifiquem la cadena 'rodej*' o 'rodeg*' per 'envolt*', encara no m'he llegit els enllaços... –Pasqual · bústia 02:58, 4 set 2006 (UTC)

A barbarismes poses "\b[Rr]ode[gj]" i la substitució "envolt" --Xtv (que dius que què?) 03:01, 4 set 2006 (UTC)
No! $1nvolt ! fa l'ullet –Pasqual · bústia 03:04, 4 set 2006 (UTC)
D'acord, aixó vol dir que no pot convertir la E en majúscula segons si la R ho està o no, llavors caldrien dues línies, una per a si la paraula comença amb majúscula i una altra per si és en minúscula, de no ser així ens trobarem que la substitució de "Rodejant la ciutat" ens donarà "envoltant la ciutat", sense respectar la majúscula de principi de frase, he vist uns quants així. –Pasqual · bústia 16:06, 4 set 2006 (UTC)
Jo no he sabut veure com fer-ho. Segurament deu existir la manera. Sí, si volem estalviar-nos haver de corregir les majúscules i minúscules, hauríem de fer les dues entrades. Ara bé: això voldria dir multiplicar per 2 un fotral d'entrades. Jo diria que a la wiki anglesa ho tenen com nosaltres (encara que no ho recordo exactament). De fet, les vegades que jo he usat l'AWB i que hagi hagut de corregir una minúscula que havia sigut majúscula són comptades (recordem que això no és un bot automàtic sinó que s'ha d'anar revisant els canvis que l'AWB proposa).--Xtv (que dius que què?) 16:37, 4 set 2006 (UTC)

[edita] Funció com a bot

Suposo que aquest arxiu no és compatible amb la funció de bot de l'AWB, no? Hi ha força correccions que necessiten ser comprovades.--SMP (missatges) 08:34, 4 set 2006 (UTC)

Què vols dir per la funció de bot? jo tinc un bot registrat per tal de fer les correccions de l'AWB, perquè en faig moltes molt ràpidament, però les repasso una a una igualment, tal com diu a la pàgina de l'AWB. En principi he fet aquesta llista preferint que trobi falsos positius però que alhora corregeixi molt, que no pas que no s'hagi de mirar la correcció (la qual cosa no s'ha de fer) i dexar passar moltes faltes. En tot cas podriem tenir dues llistes, una a TyposHard i l'altra a TyposSoft, i com que la majoria de vegades no usarem el programa alhora, quan un vulgui usar un tipus de plantilla, el copia a Typos i llestos. Després el que ve a darrera, agafa la que més li interessa i punt... no sé, dic jo...--Xtv (que dius que què?) 14:58, 4 set 2006 (UTC)
D'acord, ja m'has respost, la funció de bot és aquella per la qual no fa falta mirar-te els canvis sinó que ell sol va apretant el botó de "acceptar-los" cada 10 segons. És molt útil per a categoritzacions o canvis mecànics per l'estil.--SMP (d·+) 12:50, 26 set 2006 (UTC)

[edita] Perfilar la llista

Hola, alguns falsos positius a millorar;

  • estendre-la als nous territoris -> estendre-l'als nous territoris
  • Ohio -> Ohió
  • Interwikis:
    • [[am:...]] -> [[amb:...]]
    • [[be:...]] -> [[bé:...]]
    • ...

--Joanjoc (discussió) 02:50, 8 des 2006 (CET)

El cert és que aquesta llista que vaig fer, si només fes referència a textos en català, seria molt útil, però com que a la majoria de textos, si no apareix una paraula en llatí, n'apareix una en anglès, fa que aquesta llista sigui més aviat poc útil. Potser hauria (hauríem) de treure algunes línies posades amb molt bona intenció però gens eficaces. Quan veieu que una no funciona, traieu-la tranquil·lament!--Xtv (que dius que què?) 03:30, 8 des 2006 (CET)