PANKOW

De la Wikipedia, enciclopedia liberă

Acest articol are nevoie de ajutorul dumneavoastră!
Puteţi contribui la dezvoltarea şi îmbunătăţirea lui apăsând butonul "modifică pagina".


Succesul Webului Semantic este dependent de existenţa unor ontologii corespunzătoare si de proliferarea paginilor web adnotate cu metadate conforme acestor ontologii. Obţinerea metadatelor prin definirea manuala a unuor reguli de extracţie a informaţiei necesită o munca titanică, timp si expertiza de înalt nivel. PANCOW (Anotare prin similaritate utilizind informaţia incorporată de Web), reprezintă o metodă de auto anotare bazată pe numararea paginilor Web ce includ anumite şabloane lingvistice specificate. Este o abordare similara invăţării automate nesupravegheate a corespondenţei dintre anumiţi termeni şi categoriile unei ontologii, ce combină idea folosiri şabloanelor lingvistice în identificarea relaţiilor ontologice, precum şi a ideii de folosire a Internetului ca sursă gigantică de informaţie.

Sistemul caută, in textul HTML ce descrie paginile de internet, termeni ce ar putea constitui exemple de categorii ale ontologiei. In general aceştia sint substantive comune ce pot fi identificate cu algoritmi specifici de separare a unităţilor lexicale. Substantivele comune candidate si termenii ontologiei sint combinaţi în şabloane lingvistice ce sint apoi utilizate ca termeni de cautare in Google. In final, pentru fiecare combinaţie substantiv-categorie ontologică, sistemul rezumă rezultatele interogării la un numar total de pagini regăsite incluzînd combinaţia respectivă si atribuie termenul (substantiv comun) categoriei ontologice cele mai relevante din punct de vedere al acestui numar. PANKOW este ca performantă la nivelul sistemelor celor mai moderne in domeniu, în plus fiind mai simplu si mai intuitiv in ce priveşte anotarea paginilor internet.


Proiectul PANKOW a fost iniţiat la Universitatea Karlsuhe, Germania în 2004.

[modifică] Bibliografie

  • Philipp Cimiano, Siegfried Handschuh, Steffen Staab, Towards the Self-Annotating Web In Proceedings of the 13th WWW Conference, pp. 462-471. ACM, New York, May 2004. ISBN: 1-58113-844-X
În alte limbi