Google

Iz Wikipedije, proste enciklopedije

Logotip podjetja.
Povečaj
Logotip podjetja.

Google je ameriško podjetje ustanovljeno leta 1998, njihov najbolj znan izdelek je istoimenski spletni iskalnik Google. Poleg tega pa razvija tudi druge storitve in izdelke kot Google Maps in Gmail.

Google je nastal leta 1996 kot projekt spletnega iskalnika, ki sta ga razvijala stanfordska študenta Larry Page in Sergey Brin. Iskalnik je deloval na naslovu http://google.stanford.edu, leta 1997 pa je bila registrirana domena google.com. Leto kasneje pa je bilo ustanovljeno istoimensko podjetje.

Vsebina

[uredi] Delovanje iskalnika

Google vsebuje tri dele, vsak del posebej je del distribucijske mreže tisočih poceni računalnikov in lahko hkrati opravljajo vzporedno procesiranje, to pomeni metodo v kateri je mnogo izračunavanj opravljenih vzporedno, kar omogoča hitrejše procesiranje.

  •  »Googlebot«, spletni iskalec, ki samodejno išče nove spletne strani.
  •  »Indexer«, ki shrani vsako besedo na vsaki strani kar posledično naredi ogromno podatkovno bazo.
  •  »Query processor«, ki primerja naše želeno iskanje s svojo podatkovno bazo in izpiše zadetke dokumentov, v katerih je našel omenjene ali podobne izraze.

[uredi] Googlebot, spletni iskalec

Googlebot je iskalni robot, ki poišče strani na svetovnem spletu in jih preda Google Indexer-ju. Po navadi si Googlebot predstavljamo kot majhnega pajka, ki pleza po mreži svetovnega spleta, ampak v resnici Googlebot deluje podobno kot naš spletni brskalnik, se pravi pošilja pakete z zahtevami strežniku, na katerem je spletna stran, shrani celotno stran ter jo preda Google Indexer-ju. Googlebot z velikim številom računalnikov išče spletne strani veliko hitreje kakor naš internetni iskalnik. Hkrati lahko pregleduje tudi več tisoč strani. Googlebot si zapiše strani na dva načina: preko spletnega naslova, www.google.com/addurl.html, ter preko iskalca.

[uredi] Google Indexer

Googlebot preda indekserju popolna besedila ter naslove strani, kjer jih je našel. Ta besedila indekser shrani v podatkovno bazo. Ta indeks je razvrščen po abecedi. Za izboljšanje iskanja, Google ne upošteva (ne dodaja v indeks) pogostih besed ali stop words (kot so the, is, on, or, of, how, why, kot tudi enomestne številke ali znaki). Stop words so tako pogoste, da skoraj nič ne pripomorejo k iskanju, zato jih lahko izključimo že mi. Indexer tudi ignorira odvečne presledke ter velike in male črke zaradi hitrejšega delovanja.

[uredi] Google Query Processor

Query processor ima več različnih delov; vključuje uporabniški vmesnik (iskalnik) - sistem preveri naš vpis in vpise v podatkovni bazi. Google vsebuje preko sto faktorjev, s katerimi ugotavlja kateri dokumenti so najbolj primerni za prikaz, kakšna je njihova obiskanost ter jih razvrsti po strani od najbolj podobnih do manj podobnih. Google si naše vpise zapisuje in s tem nadgrajuje svoj sistem. Tako nam lahko ponudi rezultate, kakršne so iskali tudi ljudje pred nami, ki so vnesli enako ali podobno besedo. Internetni strežnik pošlje naš vpis index serverju. Vsebina v index strežnikih je podobna kazalu na koncu knjige - pove, katera stran vsebuje določene besede. Naš vpis potuje do strežnika dokumentov, kateri dejansko vrne shranjene dokumente. Generira se kratek povzetek, ki opisuje vsako iskanje.

[uredi] Glej tudi

[uredi] Zunanje povezave