Χρήστης:Gerakibot/Δημιουργία άρθρων

Από τη Βικιπαίδεια, την ελεύθερη εγκυκλοπαίδεια

Πίνακας περιεχομένων

[Επεξεργασία] Τι είναι το bot

Το bot που χρησιμοποιώ είναι στην ουσία ένα πρόγραμμα γραμμένο σε γλώσσα Python που τρέχει από την γραμμή εντολής οποιουδήποτε λειτουργικού συστήματος (εγώ χρησιμοποιώ Windows XP). Δεν έχει γραφικό περιβάλλον, και οποιεσδήποτε εντολές και στοιχεία πρέπει να πληκτρολογηθούν ή να δωθούν μέσω αρχείων κειμένου (αλλά η εντολή δίνεται χειροκίνητα). Παρακάτω εξηγώ ποιά είναι τα στοιχεία που χρειάζεται να δώσουμε στην εντολή για την δημιουργία άρθρων. (πληροφοριακά η εντολή που πληκτρολογείται είναι : pagefromfile.py -start:start -end:end -file:stoixeia.txt -utf

[Επεξεργασία] Μορφή εισαγωγής

Αυτό που πρέπει να διαβάσει το bot είναι ένα αρχείο κειμένου όπου τα άρθρα που θα δημιουργηθούν είναι χωρισμένα με σημεία που σηματοδοτούν την αρχή και το τέλος τους (π.χ. start και end), μέσα από αυτά τα σημεία το wiki κείμενο του άρθρου, με τον τίτλο που θα πρέπει να πάρει να είναι το πρώτο έντονο κείμενο. π.χ.:

start
Αυτό είναι το '''πρώτο άρθρο''' της ομάδας.
{{επέκταση}}
[[Κατηγορία:Πολλά άρθρα]]
end

start
Αυτό είναι το '''δεύτερο άρθρο''' της ομάδας.
{{επέκταση}}
[[Κατηγορία:Πολλά άρθρα]]
end

start
Αυτό είναι το '''τρίτο άρθρο''' της ομάδας.
{{επέκταση}}
[[Κατηγορία:Πολλά άρθρα]]
end

Το παραπάνω δημιουργεί τα άρθρα πρώτο άρθρο, δεύτερο άρθρο και τρίτο άρθρο.


[Επεξεργασία] Ετοιμασία στοιχείων

Για να φτάσω στην παραπάνω μορφή προσωπικά μου είναι ευκολότερο να χρησιμοποιήσω οτιδήποτε μπορώ να εισάγω στο Excel, όπου μπορώ να μετακινήσω στοιχεία μπρος πίσω, να αντιγράψω στήλες κλπ. Για να γίνει εισαγωγή στο Excel δεν είναι απαραίτητο τα στοιχεία να είναι ήδη σε αυτή την μορφή, αλλά απλά να είναι σε οποιαδήποτε μορφή πίνακα, όπως πίνακες σε ιστοσελίδες, αρχεία κειμένου οριοθετημένα με tab ή κόμμα κλπ.

Έχοντας τον πίνακα με τα στοιχεία σε κατάλληλες θέσεις, εμβολίζω τα κατάλληλα κείμενα μεταξύ των στοιχείων. π.χ:

Ο παρακάτω πίνακας στα αγγλικά, έχει έκταση, πληθυσμό και πρωτεύουσα.

Namibia 825,418 2,030,692 Windhoek
Nepal 140,8 27,676,547 Katmandu

Έγινε αυτόματη μετάφραση και χειροκίνητη διόρθωση εκεί που υπήρχαν λάθη. Ακολούθως προστέθηκαν ξανά στήλες με τα αγγλικά ονόματα σε κατάλληλες θέσεις σύμφωνα με την μορφή που σχεδιάζουμε να δώσουμε στο άρθρο.

Namibia Ναμίμπια 825,418 2,030,692 Γουϊντχοέκ Namibia Namibia
Nepal Νεπάλ 140,8 27,676,547 Κατμαντού Nepal Nepal

Με τις κατάλληλες εμβολές γίνεται έτσι:

start [[Εικόνα:Flag of Namibia.svg|thumb|Σημαία]] '''Ναμίμπια''' είναι μια χώρα με έκταση 825,418km² και πληθυσμό 2,030,692 [http://www.cia.gov/cia/publications/factbook/index.html]. Το όνομα της πρωτεύουσας είναι [[Γουϊντχοέκ]]. [[Εικόνα:LocationNamibia.png|frame|Η θέση της χώρας.]][[Κατηγορία:Χώρες]]{{γεωγρ}} [[en:Namibia]] end

start [[Εικόνα:Flag of Nepal.svg|thumb|Σημαία]] '''Νεπάλ''' είναι μια χώρα με έκταση 140,8km² και πληθυσμό 27,676,547 [http://www.cia.gov/cia/publications/factbook/index.html]. Το όνομα της πρωτεύουσας είναι [[Κατμαντού]]. [[Εικόνα:LocationNepal.png|frame|Η θέση της χώρας.]][[Κατηγορία:Χώρες]]{{γεωγρ}} [[en:Nepal]] end

και είναι έτοιμη τροφή για το bot. Από το παραπάνω φαίνεται ότι είναι χρήσιμο να μελετήσουμε πρώτα τα στοιχεία που έχουμε στα χέρια μας για το πως και πόσες φορές μπορούμε να εκμεταλλευτούμε το κάθε στοιχείο. Επίσης είναι πολύ βολικό όταν υπάρχουν εικόνες που μπορούμε να χρησιμοποιήσουμε από την wikipedia να ακολουθούν μια standard ακολουθία ονομάτων. π.χ. οι εικόνες σημαιών και τοποθεσίας των κρατών που υπάρχουν στα commons ακολουθούν μια πολιτική για τα ονόματα που βολεύει, π.χ. Flag of Xώρα.svg. Πρόβλημα μπορεί να δημιουργηθεί όταν σπάει η πολιτική, (π.χ. υπάρχουν σημαίες ως Flag of the Xώρα.svg) ή δεν μας βολεύει με τα στοιχεία (π.χ. LocationΚάποιαΧώρα.png - Στο όνομα της χώρας δεν έχουμε κενά). Μπορούν τέτοιες λεπτομέρειες να διορθωθούν μετά την δημιουργία των άρθρων, βλέποντας που υπάρχει πρόβλημα. Στην δημιουργία άρθρων για τα χημικά στοιχεία δεν υπήρξε τέτοιο πρόβλημα αφού ακολουθούνταν σταθερή ονοματοδότηση.


Άλλοι μπορεί να χρησιμοποιούν άλλες μεθόδους άντλησης στοιχείων και παραγωγής του αρχείου κειμένου που χρειάζεται το bot. π.χ. με άντληση των στοιχείων από μια βάση δεδομένων μέσω ενός προγράμματος και αυτόματη δημιουργία του κειμένου. Δυστηχώς ούτε τέτοια στοιχεία έχω στην διάθεσή μου αλλά ούτε μπορώ να σκεφτώ κάποιον έυκολο τρόπο για την δημιουργία ενός τέτοιου προγράμματος.

[Επεξεργασία] Σημειώσεις

Σημαντικό είναι κατά την επεξεργασία των στοιχείων στο Excel, οι αριθμοί να έχουν οριστεί ότι αντιπροσωπεύουν κείμενο, ώστε να αποφύγουμε τυχόν αυτόματες προσαρμογές που μπορεί να κάνει το Excel (π.χ. προσθήκη δεκαδικών ψηφίων).