Скенер
Из пројекта Википедија
Na svom najosnovnijem nivou, skener je samo još jedan od uređaja za ulaz, slično tastaturi ili mišu, izuzev što je taj njegov ulaz u grafičkom obliku. Te slike mogu biti fotografije za retuširanje, popravku ili upotrebu u stonom izdavaštvu. One mogu biti i rukom crtani logotipi koji su potrebni za zaglavlja dokumenata. One čak mogu biti i stranice teksta koje bi pogodan softver mogao da pročita i memoriše kao datoteku teksta za dalje uredjivanje.
Spisak primena skenera je gotovo beskrajan i rezultovao je u proizvode za zadovoljavanje posebnih zahteva:
- vrhunski skeneri sa dobošem, koji mogu da skeniraju i refleksno umetnost i prozirno, od slajdova od 35 mm do materijala dimenzija 16 stopa x 20 inča, pri rezolucijama većim od 10000 dpi (tačaka po inču);
- kompaktni skeneri za dokumenta, projektovani isključivo za optičko prepoznavanje znakova (OCR - optical character recognition) i upravljanje dokumentima;
- namenski fotoskeneri, koji rade tako što pomeraju fotografiju preko stacionarnog izvora svetlosti;
- skeneri za slajdove/folije, koji rade tako što propuštaju svetlost kroz sliku, a ne da reflektuju svetlo sa nje;
- ručni skeneri, za tržište široke potrošnje, ili za korisnike koji nemaju mnogo raspoložive radne površine.
Međutim, najšire primenljiv i najpopularniji oblik su skeneri sa ravnom podlogom. Oni mogu da snimaju slike u boji, dokumenta, stranice iz knjiga i časopisa i, sa odgovarajućom priključnom opremom, čak da skeniraju prozirni fotografski film.
Садржај |
[уреди] Rad
Na svom najprostijem nivou, skener je uređaj koji pretvara svetlost (koju vidimo kada nešto gledamo) u jedinice i nule (što je format koji može da pročita računar). Drugim rečima, skeneri pretvaraju analogne u digitalne podatke.
Svi skeneri rade na istom principu reflektanse ili transmisije. Slika se postavlja ispred valjka koji se sastoji od izvora svetlosti i senzora, u slučaju digitalne kamere, gde izvor svetlosti može biti sunce ili veštačko svetlo. Kada su stoni skeneri bili prvi put uvedeni, mnogi proizvođači su koristili fluorescentne cevi kao izvore svetla. Mada su dovoljno dobre za mnoge svrhe, fluorescentne cevi imaju dve izrazite slabosti: one retko zrače postojanu belu svetlost u dužem vremenu i, dok su uključene, one zrače toplotu koja može da deformiše druge optičke sastavne delove. Iz tih razloga, većina proizvođača je prešla na cevi sa hladnom katodom. One se razlikuju od standardnih fluorescentnih cevi po tome što nemaju zagrevno vlakno. One zato rade na mnogo nižim temperaturama i, shodno tome, pouzdanije. Standardne fluorescentne cevi se danas uglavnom nalaze na jevtinim uredjajima i starijim modelima.
Krajem 2000. godine, kao alternativni izvor svetlosti pojavile su se ksenonske cevi. Ksenon daje veoma stabilan izvor svetlosti punog spektra koji dugo traje i brzo se uspostavlja. Međutim, ksenonski izvori svetlosti imaju veću potrošnju električne energije od cevi sa hladnom katodom.
Da bi usmerili svetlost sa cevi na senzore koji očitavaju njene vrednosti, CCD skeneri koriste prizme, sočiva i druge optičke sastavne delove. Kao što je slučaj i sa naočarima i uveličavajućim staklima, ovi delovi mogu da budu veoma različitog kvaliteta. Kvalitetan skener ima optičke elemente visokog kvaliteta, sa korekcijom boja i nanešenim slojevima za obezbedjivanje minimalne difuzije.
Jevtiniji modeli obično štede u ovoj oblasti, koristeći plastične sastavne delove da bi se smanjila cena.
Količina svetlosti koja se reflektuje od, ili prenese kroz sliku i pokupi pomoću senzora, pretvara se posle toga u napon proporcionalan intenzitetu svetlosti - što je deo slike svetliji, to se reflektuje ili prenosi više svetla, pa je rezultujući napon viši. Ta analogno-digitalna konverzija (ADC) je osetljiv proces, podložan električnim smetnjama i šumu u sistemu. Da bi se slika zaštitila od degradacije, danas najbolji skeneri na tržištu koriste električki izolovan analogno-digitalni pretvarač koji obradjuje podatke izvan glavnog električnog kola skenera. Međutim, to unosi dodatne tgroškove u proizvodnom procesu, pa zato mnogi jevtiniji modeli imaju integrisane analogno-digitalne konertore koji su ugradjeni u osnovnu elektronsku ploču skenera.
Sam senzor se implementira primenom jedne od sledeće tri vrste tehnologije:
- PMT (fotomultiplikatorska cev), tehnologija nasledjena od starijih skenera sa dobošem;
- CCD (uredjaj sa spregnutim naelektrisanjem), vrsta senzora koja se koristi u stonim skenerima;
- CIS (kontaktni senzor za sliku), novija tehnologija koja integriše skenirajuće funkcije u manjem broju sastavnih delova, što dozvoljava da skeneri budu kompaktniji po veličini.
[уреди] PMT
PMT (photomultiplier tube - cev za pojačavanje svetla) je senzorska tehnologija primenjena u vrhunskim skenerima sa dobošem, koje koriste firme za štampu u boji. Skupi i teški za rad, to su bili uređaji koji su korišćeni za smeštanje slika u računar pre pojave stonog skeniranja. Tehničari su pažljivo montirali originalne slike na stakleni valjak koji je onda rotirao velikom brzinom oko senzora smeštenog u njegovom središtu.
Kod PMT, svetlost koju detektuje senzor, deli se na tri zraka koji prolaze kroz crveni, zeleni i plavi filter, a zatim u fotomultiplikatorske cevi - gde se svetlosna energija pretvara u električni signal. PMT imaju mnogo veću osetljivost na svetlost i niže nivoe šuma od CCD skenera. Zbog toga su skeneri sa dobošem sposobni za izvanrednu tonsku rezoluciju, jer su manje osetljivi na greške refrakcije ili fokusa od njihovih rivala sa ravnom podlogom.
Medjutim, skeneri sa dobošem su spori i skupi u poredjenju sa CCD skenerima. Ovih dana, oni se koriste samo za specijalizovane vrhunske primene.
[уреди] CCD
CCD tehnologija je odgovorna za nastanak skeniranja kao stone primene i bila je godinama primenjivana u uredjajima kao što su faks mašine i digitalne kamere. Uređaj sa spregnutim naelektrisanjem je poluprovodnički elektronski uredjaj koji pretvara svetlost u naelektrisanje. Senzor stonog skenera tipično ima na hiljade CCD elemenata, poredjanih u dugačak tanak niz. Skener propušta svetlost kroz crveni, zeleni i plavi filter i reflektovana svetlost se usmerava u CCD niz preko sistema ogledala i sočiva. CCD radi kao fotometar, pretvarajući izmerenu reflektansu u analogni napon, koji onda može da se uzorkuje i pretvori u diskretne digitalne vrednosti pomoću analogno-digitalnog konvertora (ADC).
[уреди] CIS
CIS je relativno nova senzorska tehnologija koja je počela da se pojavljuje na tržištu skenera sa ravnom podlogom za široku potrošnju krajem 1990-ih godina. CIS skeneri imaju guste grupe crvenih, zelenih i plavih svetlećih dioda (LED) koje daju belu svetlost i zamenjuju ogledala i sočiva CCD skenera sa jednim redom senzora, smeštenim veoma blizu izvorne slike. Rezultat je skener koji je tanji i lakši, energetski efikasniji i jevtiniji za proizvodnju od tradicionalnog uredjaja zasnovanog na CCD tehnologiji - ali koji još uvek nije u stanju da proizvede tako dobre rezultate.
Tehnologija koju primenjuje senzorski mehanizam ipak nije jedini činilac koji upravlja nivoom performanse skenera. Ono što sledi, takodje su važni aspekti specifikacije datog uredjaja:
- rezolucija
- dubina bita
- dinamički opseg
[уреди] Rezolucija
Rezolucija se odnosi na finoću detalja koju skener može da postigne i obično se meri brojem tačaka po inču (dpi). Što više tačaka po inču skener može da raspozna, to će rezultujuća slika imati više detalja. Tipična rezolucija jevtinog stonog skenera krajem 1990-ih godina bila je 300x300.
Tipičan skener sa ravnom podlogom ima po jedan CCD element za svaki piksel, pa za stoni skener koji najavljuje horizontalnu optičku rezoluciju od 600 dpi (tačaka po inču) - što se alternativno obeležava i kao 600 ppi-} (piksela po inču) - i za maksimalnu širinu dokumenta od 8,5 inča, biće potreban niz od 5100 CCD elemenata u onom delu koji se zove glava za skeniranje.
Glava za skeniranje je montirana na transportnom mehanizmu koji se pomera preko ciljnog objekta. Mada taj proces može da izgleda kao kontinualno kretanje, glava se pokreće u delovima inča u jednom trenutku, dok se čitanje obavlja izmedju dva takva uzastopna pokreta. U slučaju skenera sa ravnom podlogom, glavu pokreće koračni motor, uredjaj koji se okreće u unapred definisanoj količini (koraku) i ne više od toga, svaki put kada mu se dovede električni impuls.
Broj fizičkih elemenata u CCD nizu određuje brzinu uzorkovanja po pravcu x-ose, a broj zaustavljanja po inču odredjuje brzinu uzorkovanja po pravcu y-ose. Mada se to uobičajeno zove "rezolucija" skenera, termin baš nije potpuno tačan. Rezolucija je sposobnost skenera da odredi detalj u objektu i definisana je kvalitetom elektronike, optike, filtara i upravljanja motorom, kao i brzinom uzorkovanja.
Aktuelna glava za skeniranje, mada sposobna da čita rastersku liniju širine 8,5 inča, biće mnogo manja od toga, odnosno tipične širine od 4 inča. Reflektovana svetlost se dovodi na glavu kroz sočiva, a kvalitet optike može da ima veći uticaj rezoluciju skeniranja od brzine uzorkovanja. Optika visoke rezolucije u skeneru od 400 dpi verovatno će proizvesti bolje rezultate od slabe optike na skeneru od 600 dpi.
Do kraja 1998. godine, fizičko ograničenje broja CCD elemenata koji bi mogli da se smeste jedan pored drugog na dužini od jednog inča, bilo je oko 600. Medjutim, moguće je povećati prividnu rezoluciju korišćenjem tehnike koja se zove interpolacija, gde se upotrebom softverskog ili hardverskog upravljanja predvidjaju medjuvrednosti i ubacuju izmedju stvarnih. Neki skeneri su u ovome mnogo bolji od drugih.
[уреди] Interpolacija
Skeneri tipično nude rezolucije od 2400, 4800 i 9600 dpi. Važno je da se shvati da skeneri prosto ne mogu da "pokupe" taj nivo detalja. Stvarna optička rezolucija CCD elemenata u većini savremenih skenera je 600 x 1200 dpi u najboljem slučaju, a sve veće cifre su zasnovane na interpolaciji.
Zapazite da specifikacija neuniformne rezolucije - na primer, 600 x 1200 dpi - obavezno nagoveštava hardversku interpolaciju, zato što akvizicija podataka od 600 dpi po jednoj i 1200 dpi po drugoj osi ne može da rezultuje "kvadratom" podataka. Na 600 x 600 dpi takav skener će interpolirati dimenziju od 1200 dpi na dole na 600 dpi (što se obično radi tako što se koračni motor koji pokreće glavu jednostavno pokrene svojom dvostrukom minimalnom brzinom), ili će na 1200 x 1200 dpi on interpolirati x-dimenziju.
U osnovi, integrisano kolo u skeneru generiše nove podatke tako što uzima tačke koje skener stvarno vidi i proračunava gde bi se najverovatnije nalazile medjutačke, koristeći algoritam da "pogodi" boju novih tačaka usrednjavajući boju susednih tačaka.
Softverska interpolacija može da poveća rezoluciju čak i više od hardverske interpolacije. Nju izvršava procesor PC računara pod kontrolom skenerovog TWAIN upravljačkog softvera. Problem je u tome što najbolji pogoci nikada nisu zaista tačni. Interpolirane slike će uvek izgledati suviše mekane i pomalo neoštre. To ne smeta kod crteža, gde interpolacija poravnjava nazubljene ivice. Ali za slike sa kontinualnim tonovima, kao što su fotografije, bolje je držati se skenerove stvarne optičke rezolucije.
[уреди] Skeneri u boji
Skeneri u boji imaju tri izvora svetlosti, po jedan za crvenu, zelenu i plavu osnovnu boju. Neke glave za skeniranje imaju jednu fluorescentnu cev sa tri CCD elementa sa filtrima, dok druge imaju tri obojene cevi i jedan CCD element. Prvi od njih proizvode celu sliku u boji u jednom prolazu, u kome se cilj osvetljava pomoću tri brzo izmenljiva svetla, dok drugi moraju da se vraćaju tamo-amo tri puta.
Jednoprolazni skeneri imaju probleme sa stabilnošću nivoa svetlosti kada se brzo uključuju i isključuju. Stariji troprolazni skeneri su imali probleme sa registrovanjem, a bili su i spori. Sada je više troprolaznih uredjaja poboljšano i sposobno da budu uporedivi sa nekim jednoprolaznim po brzini. Medjutim, do poznih 1990-ih godina, većina skenera u boji bili su jednoprolazni uredjaji.
Ovi skeneri koriste jedan od sledeća dva metoda za očitavanje vrednosti svetla: delitelj zraka ili CCD elemente sa slojevima. Kada se koristi delitelj zraka, svetlost prolazi kroz prizmu i deli se u tri osnovne boje za skeniranje, koje svaku posebno očitava drugi CCD element. To se obično smatra najboljim načinom za obradu reflektovane svetlosti, ali, da bi oborili cenu, mnogi proizvodjači koriste tri CCD elementa, od kojih je svaki presvučen filmom, tako da očitava samo jednu od osnovnih boja za skeniranje sa nepodeljenog ulaznog zraka. Mada tehnički ne tako tačan, ovaj drugi metod obično proizvodi rezultate koje je teško razlikovati od onih koje daje skener sa deliteljem zraka.
[уреди] Dubina bitova
Kada skener pretvara nešto u digitalni oblik, on gleda na sliku piksel po piksel i registruje ono što vidi. Taj deo procesa je dovoljno jednostavan, ali različiti skeneri registruju različite količine informacija o svakom pikselu. Pomoću dubine bitova se meri koliko informacija dati skener registruje.
Najprostija vrsta skenera registruje samo crno i belo, što se ponekad zove 1-bitnim skenerom, jer svaki bit može da iskaže samo dve vrednosti - uključeno i isključeno. Da bi se videlo mnogo tonova izmedju crnog i belog, skener mora da bude najmanje 4-bitni (za do 16 tonova), ili 8-bitni (za do 256 tonova). Što je veća dubina bitova skenera, to tačnije on može da opiše ono što vidi kada gleda na dati piksel. To, sa svoje strane, daje bolji kvalitet skeniranja.
Većina savremenih skenera u boji su najmanje 24-bitni, što znači da oni mogu da prikupe 8 bitova informacija za svaku od osnovnih boja skeniranja: crvenu, plavu i zelenu. Uredjaj od 24 bita može teoretski da registruje preko 16 miliona različitih boja, mada je u praksi taj broj dosta manji. To je gotovo fotografski kvalitet i zato se proces naziva skeniranjem u "pravoj boji".
Od nedavno, sve veći broj proizvodjača nudi 30-bitne i 36-bitne skenere koji teoretski mogu da registruju milijarde boja. Jedini problem je u tome što mali broj grafičkih softverskih paketa može da radi sa bilo čim što je bolje od 24-bitnog skeniranja, zbog ograničenja u konstrukciji personalnih računara. Ipak, vredi imati dodatne bitove. Kada softverski program otvori 30-bitnu ili 36-bitnu sliku, on može da koristi dodatne podatke da bi ispravio šum u procesu skeniranja i da bi rešio druge probleme koji utiču na kvalitet skeniranja. Kao rezultat, skeneri sa većim dubinama bitova teže da proizvedu bolje slike u boji.
[уреди] Dinamički opseg
Dinamički opseg je nešto slično dubini bitova po tome što on meri koliko je širok opseg tonova koje skener može da registruje. To je funkcija skenerovog analogno-digitalnog konvertora - uz čistoću svetla za osvetljavanje i obojenih filtera i bilo kakvog šuma u sistemu.
Dinamički opseg sxe meri na skali od 0,0 (savršeno belo) do 4,0 (savršeno crno), a jeda broj je dat za svaki pojedinačni skener da kaže koliko od tog opsega uredjaj može da razlikuje. Većina skenera u boji sa ravnom podlogom ima teškoće da primeti fine razlike izmedju tamnih i svetlih boja na bilo kom kraju opsega i teži da ima dinamički opseg od oko 2,4. To je dosta ograničeno, ali obično dovoljno za projekte u kojima savršena boja nije toliko značajna. Za veći dinamički opseg, sledeći korak je skener u boji sa ravnom podlogom vrhunskog kvaliteta, sa većom dubinom bitova i poboljšanom optikom. Ovi bolji uredjaji obično imaju dinamički opseg izmedju 2,8 i 3,2 i pogodni su za zahtevnije zadatke, kao što je standardna štampa u boji. Za vrhunac u dinamičkom opsegu, jedina alternativa je skener sa dobošem. Ovi uredjaji često imaju dinamički opseg od 3,0 do 3,8 i daju sav kvalitet boje koji se može tražiti od stonog skenera. Mada su obično isuviše dobri za većinu projekata, skeneri sa dobošem zaista nude kvalitet u zamenu za svoju visoku cenu.
U teoriji, 24-bitni skener nudi 8-bitni opseg (256 nivoa) za svaku osnovnu boju - razlika izmedju 256 nivoa se obično prihvata kao neprimetna za ljudsko oko. Na nesreću, nekoliko najlakših bitova se gubi u šumu, dok bilo koje ispravljanje tonova posle skeniranja još smanjuje opseg. Zbog toga je najbolje da se bilo kakve ispravke sjajnosti i boja obave u jednom prolasku upravljačkog programa skenera pre samog krajnjeg skeniranja. Skuplji skeneri sa dubinama bitova od 30 ili 36 mogu da počnu sa mnogo širim opsegom, dajući bolje detalje u osenčenim i osvetljenim delovima slike, što dozvoljava da se urade tonske ispravke i još uvek završi sa pristojnih 24 bita na kraju. Skener od 30 bita prikuplja 10-bitne podatke za svaku crvenu, zelenu i plavu komponentu boje, dok 36-bitni skener prikuplja 12 bita za svaku od njih. Upravljački program skenera dozvoljava operatoru da kontroliše kojih 24 od tih 30 ili 36 bitova se zadržavaju, a koji se odbacuju - ovo podešavanje se vrši pomoću menjanja Gama-krive kojoj se pristupa preko komande Tonal Adjustment (podešavanje tonova) upravljačkog programa TWAIN. Rezolucija skeniranja
Pre skeniranja bilo kakve slike, treba odrediti kojom rezolucijom će ona da se skenira. Kako su nas savremene reklame naučile da mislimo da je više uvek i bolje, nije teško razumeti zašto mnogi korisnici imaju sklonost da skeniraju sa suviše visokom rezolucijom. Rezolucija skeniranja bi uvek trebalo da se odredi prema mogućnostima izlaznog uredjaja - a za sve praktične namene, retko je potrebno da se skenira sa više od 240 dpi.
Štampane slike koriste tehniku koja se zove poluton za reprodukovanje različitih nivoa boje. U ilustrovanim časopisima se koristi uredjeni poluton, gde pravilno rasporedjene tačke različitih veličina daju različite nijanse boja. Većina ink-jet štampača koristi umekšavanje, gde se tačke rasprše po području svakog piksela. Na manjim rezolucijama to proizvodi rezultate koji bolje izgledaju. Upotreba medjutonova znači da je broj piksela po inču koje štampač može da reprodukuje manji nego što je njegova deklarisana "dpi" rezolucija.
Praktično pravilo za štampanje 24-bitnom bojom je da je broj piksela po inču 16 puta manji od rezolucije. To znači da za štampač od 600 dpi zadovoljava rezolucija od 40 piksela po inču. Slovoslagači u ofset litografiji - tehnologiji koja se koristi za štampanje sjajnih ilustrovanih časopisa - mogu da štampaju 133 linije po inču. Ova tehnologija nije baš ista kao tehnologija laserskih ili ink-jet štampača i opšte pravilo ovde je da se skenira 1,5 puta većom rezolucijom od one za štampanje - što je ekvivalent od 200 dpi.
Kada se skenira za izlaz na ink-jet štampaču, uobičajeno praktično pravilo je da se to radi na 1/3 rezolucije kojom se namerava štampanje. Tako, za tipičan savremeni ink-jet štampač sa maksimalnom rezolucijom od 720 dpi, odgovara rezolucija skeniranja od 240 dpi. Medjutim, ne preporučuje se pokušaj štampanja maksimalnom rezolucijom štampača na običnom papiru. U tom slučaju, pogodnija je rezolucija od 360 dpi - i, prema tome, rezolucija skeniranja od 120 dpi. Ako se skeniraju nijanse sivog ili crteži, bolje je koristiti punu rezoluciju štampača, bez deljenja sa tri.
Kada se skeniraju slike za uključivanje u WEB stranice, ili za prikazivanje direktno na monitoru PC računara, rezolucija skeniranja se bira na osnovu željene veličine slike za prikazivanje. Grafičke kartice mogu da rade sa različitim režimima prikazivanja - 640x480, 800x600, 1024x768 itd. - a monitori su sa više različitih veličina ekrana.
Medjutim, kao opšte praktično pravilo, slike za kasnije prikazivanje na monitoru PC računara bi trebalo da se skeniraju sa rezolucijom od oko 72 dpi.
[уреди] Načini skeniranja
PC računari predstavljaju slike na više načina - najčešći metodi su crtež, poluton, nijanse sivog i boja:
- Crtež (line art) je najmanji od svih formata slika. Kako se pamti samo crna i bela informacija, računar predstavlja crno sa 1, a belo sa 0. Potreban je samo 1 bit podataka da se zapamti informacija o svakoj tački crno i belo skenirane slike. Ova tehnika je najpogodnija za skeniranje teksta ili crteža. Slike se ne skeniraju dobro na ovaj način.
- Dok računari mogu da pamte i prikazuju slike sa nijansama sivog, većina štampača ne može da štampa različite senke u sivom. Oni zato koriste trik koji se zove polutoniranje (halftone). Polutonovi koriste uzorke sa tačkama da bi prevarili oko kako bi ono poverovalo da vidi informaciju o nijansama sivog.
- Slike sa nijansama sivog (gray scale) su najjedostavnije od slika koje računar može da memoriše. Ljudi mogu da zapaze oko 255 različitih nijansi sivog - što se u PC računaru predstavlja jednim bajtom podataka, sa vrednošću od 0 do 255. Slika sa nijansma sivog može da se zamisli kao ekvivalent crno-bele fotografije.
- Slike u pravoj boji (true colour) su najveće i najsloženije za memorisanje, jer PC računari koriste 8 bitova (1 bajt) da predstave svaku od osnovnih boja (crvenu, zelenu i plavu), pa je zato potrebno ukupno 24 bita da bi se predstavio ceo spektar boja.
[уреди] Formati datoteka
Format u kome se memoriše skenirana slika može da ima značajan uticaj na veličinu datoteke - a veličina datoteke je važna stvar na koju treba da se obrati pažnja kada se skenira, jer visoke rezolucije koje podržavaju mnogi savremeni skeneri mogu da rezultuju datotekama slika koje idu i do 30 Mbajta za stranicu formata A4.
Najveće su datoteke formata Windows bitmape (BMP), jer se u njima slika memoriše u punoj boji, bez kompresije ili u 256 boja sa jednostavnom kompresijom RLE. Slike koje će se koristiti kao Windows tapeti treba da budu memorisane u BMP formatu, ali u većini drugih slučajeva to se izbegava.
Datoteke u format označene slike (TIFF - tagged image file format) su najfleksibilnije, jer su u njima memorisane slike u RGB (crveno-zeleno-plavo) načinu za prikaz na ekranu, ili CMYK (tirkiznoplavo-purpurnocrveno-žuto-crno) za štampanje. Format TIFF podržava takodje i LZW kompresiju, koja može značajno da smanji veličinu datoteke bez ikakvog gubitka na kvalitetu. Ona je zasnovana na dve tehnike koje su uveli Jacob Ziv i Abraham Lempel 1977. godine i koje je kasnije usavršio Terry Welch, zaposlen kao istraživač u firmi Unisys. LZ77 postavlja pokazivače na podatke koji se ponavljaju, a LZ78 pravi rečnik ponavljajućih fraza sa pokazivačima na te fraze.
Grafički format za razmenu (GIF) firme Compuserve memoriše slike služeći se indeksiranom bojom. Ukupno je raspoloživo 256 boja na svakoj slici, mada neke od tih boja mogu da se menjaju od slike do slike. Tabela RGB vrednosti za svaku indeksiranu boju je memorisana na početku datoteke slike. Datoteke u GIF formatu su sklone da budu manje od većine datoteka u drugim formatima zbog te smanjene dubine boja, što ih čini dobrim izborom za upotrebu u materijalu za objavljivanje na WWW (world wide web).
Format PCX (PC Paintbrush prestao da se upotrebljava, ali nudi komprimovani format dubine boje od 24 bita. Format datoteka JPEG (Joint Photographic Experts Group) koristi kompresiju sa gubicima i može da postigne male datoteke sa dubinom boja od 24 bita. Nivo kompresije može da se izabere - odatle gubici podataka - ali čak i postavljanje JPEG na maksimalni kvalitet žrtvuje nešto od detalja i zato je to format pogodan samo za onlajn gledanje slika. Broj raspoloživih nivoa kompresije zavisi od softvera za uredjivanje slika koji se koristi.
Ako nema potrebe da se sačuva informacija o bojama originalnog dokumenta, najbolje je da se slike koje se memorišu radi kasnijeg optičkog prepoznavanja znakova (OCR - optical character recognition) skeniraju u režimu nijansi sivog. To zauzima trećinu prostora potrebnog za RGB skeniranje u boji. Alternativa je da se skenira u režimu crteža - crno i belo bez nijansi sivog - ali tada se obično gube detalji, što smanjuje tačnost predstojećeg procesa optičkog prepoznavanja znakova.
Sledeća tabela ilustruje relativne veličine datoteka koje se postižu upotrebom različitih formata datoteka prilikom memorisanja "prirodne" slike od 1 Mbajta, a takodje prikazuje i podržavane dubine boja:
Format datoteke | Veličina slike | Broj boja |
---|---|---|
BMP - RGB | 1MB | 16,7 miliona |
BMP - RLE | 83KB | 256 |
GIF | 31KB | 256 |
JPEG - minimalna kompresija | 185KB | 16,7 miliona |
JPEG - minimalna progresivna kompresija | 150KB | 16,7 miliona |
JPEG - maksimalna kompresija | 20KB | 16,7 miliona |
JPEG - maksimalna progresivna kompresija | 16KB | 16,7 miliona |
PCX | 189KB | 16,7 miliona |
TIFF | 1MB | 16,7 miliona |
TIFF - LZW kompresija | 83KB | 16,7 miliona |
[уреди] TWAIN upravljački program (drajver)
Na opšte iznenadjenje, TWAIN nije nekakva skraćenica, nego veoma važan standard za akviziciju slika koji su razvile firme Hewlett-Packard, Kodak, Aldus, Logitech i Caere i koji propisuje kako skeneri, digitalne kamere i drugi uredjaji za akviziciju slika prenose podatke do softverskih aplikacija. TWAIN dozvoljava softverskim aplikacijama da rade sa uredjajima za akviziciju slika bez ikakvog znanja o samim tim uredjajima. Ako su uredjaj i softverska aplikacija u saglasnosti sa standardom TWAIN, oni mogu zajedno da rade bez obzira na to da li je softver bio zapakovan sa uredjajem za akviziciju slika kada je on bio kupljen.
Moguće je da se priključi više od jednog uredjaja za akviziciju slika koji su saglasni sa TWAIN standardom na PC računar u isto vreme, kao što je prikazano na slici. Svaki od tih uredjaja imaće svoj sopstveni TWAIN modul. To traži od softverske aplikacije saglasne sa TWAIN standardom da obezbedi način za krajnjeg korisnika da odabere koji TWAIN uredjaj će da koristi za vreme rada. U praksi, bila bi odabrana opcija "acquire" u meniju File aplikacije kao što je na primer PhotoShop. Od korisnika bi se tražilo da odabere pogodan TWAIN izvor koji bi onda pokrenuo sopstveni uredjajev upravljački program, sve to bez napuštanja glavne aplikacije. Posle skeniranja, upravljački program se automatski zatvara, prepuštajući skeniranu sliku glavnoj aplikaciji. Nema nepotrebnog napuštanja, pokretanja ili memorisanja potencijalno velikih i možda beskorisnih datoteka.
Proizvodjači sve češće isporučuju skenere sa dva TWAIN upravljačka programa. Prvi od njih je osnovni, pojednostavljeni drajver, namenjen početnicima. Sa njima, skeniranje je u osnovi posao u kome se "koristi jedno dugme". Pritisne se dugme za prethodno sagledavanje i mali prethodni prikaz slike se pojavljuje na ekranu u odgovarajućem okviru za pregled. Odatle, površina za skeniranje može da se podesi, zajedno sa rezolucijom i dubinom piksela. Kada je korisnik potpuno zadovoljan sa rezultatima prethodnog pregleda, on pritisne na dugme za skeniranje, da bi započeo stvarni proces skeniranja. Za naprednije korisnike, u prvom upravljačkom programu bi trebalo da postoji i dugme za opcije naprednijeg skeniranja. To će otvoriti drugi drajver, onaj koji nudi veći stepen ukupnog podešavanja slike, kao što su komande podešavanja za sjajnost, kontrast i gama-korekciju. To dozvoljava da se podese specifični opsezi tonskih vrednosti, bilo u celini ili za svaku osnovnu boju posebno.
[уреди] Kalibracija boja
Jedan od problema upotrebe stonih skenera je što skenirana slika može da izgleda drugačije na ekranu nego kada se štampa, a obe mogu prilično da se razlikuju od originala. Rešenje tog problema je u kalibraciji (ili uskladjenju) boja sistema. Takav softver vredi jedino za skeniranja vrlo kvalitetnih slika (folija, otisaka profesionalnog kvaliteta itd.) koji treba da odgovore strogim standardima - jer za većinu ljudi koji koriste stoni skener, tačnost nije toliko važna kao što je brzo dobijanje dopadljivih boja. To je dobro, jer su složenost boja i ljudske percepcije stvorile od kalibracije zastrašujući izazov - kao posledica, postoji nekoliko različitih rešenja koja su već raspoloživa i još više njih koja su na vidiku.
Jedan od najsvestranijih sistema je Kodakov sistem za upravljanje bojama (CMS), koji koristi sopstvene definicije boja zajedno sa profilima za svaki različit skener, monitor i štampač u sistemu, da bi preveo i standardizovao boje. Elementi Kodakovog sistema su uvezani sa Adobe PhotoShop i drugim softverom, a CMS brzo postaje najpopularniji medju grafičkim umetnicima i drugim korisnicima koji zavise od dobro uskladjenih boja.
Druge sisteme su razvili pojedini proizvodjači skenera i izdavači softvera. Ovi vlasnički zasnovani sistemi takodje mogu da obave posao, ako se obezbedi da uključuju profili za sve različite uredjaje koji se koriste za skeniranje, pregledanje, uredjivanje i izlaz krajnje slike.
Poslednji pristup je poznat kao korekcija zasnovana na izlazu, a obuhvata skeniranje i izlaz standardnog kalibracionog cilja, a zatim podešavanja profila boja da bi se one standardizovale. To je manje usavršen proces, verovatno nedogovarajući za korisnike koji žele da stalno ponovno kalibrišu svoje sisteme radi dobijanja optimalnih rezultata. Za osnovno skeniranje u boji, korekcija zasnovana na izlazu je često dovoljna.
Kada se stranica teksta skenira u PC računar, ona se memoriše kao elektronska datoteka koja se sastoji od malih tačaka, ili piksela; nju računar ne vidi kao tekst, nego pre kao "sliku teksta". Procesori teksta nisu u stanju da uredjuju bitmape slika. Da bi se grupa piksela pretvorila u reči koje se mogu uredjivati, slika mora da prodje kroz složen proces koji se zove optičko prepoznavanje znakova (OCR - Optical Character recognition).
OCR se pojavio krajem 1950-ih godina i otada se ta tehnologija stalno razvijala i usavršavala. U 1970-im i ranim 1980-im godinama, OCR softver je još uvek ograničenih mogućnosti - može da radi samo sa odredjenim štamparskim pismima i njihovim veličinama. U današnje vreme, OCR softver daleko inteligentniji i može da prepozna praktično sve tipove slova, kao i ozbiljno oštećene slike dokumenata.
Jedna od prvih OCR tehnika bila je nešto što se zvalo usaglašavanje matrice ili uzorka. Većina tekstova su sa Times, Courier ili Helvetica štamparskim pismom, u veličini izmedju 10 i 14. OCR programi koji korste metod uskladjivanja sa uzorkom imaju memorisane bitmape za svaki znak svakog različitog fonta i veličine slova. Poredjenjem baze podataka memorisanih bitmapa sa bitmapama skeniranih slova, program pokušava da prepozna slova. Ovaj rani sistem bio je stvarno uspešan samo kada je koristio neproporcionalne fontove kao što je Courier, gde su slova ravnomerno rasporedjena i lakša za identifikovanje. Složeni dokumenti sa više fontova su bili daleko van njegovog domašaja, a ozbiljno ograničenje tog metoda je da je on koristan samo za memorisane fontove i njihove veličine.
Sledeći korak u razvoju OCR bila je ekstrakcija karakteristika. Tu se pokušava prepoznavanje znakova pomoću identifikacije njihovih univerzalnih karakteristika, sa ciljem da se OCR učuni nezavisnim od fontova. Ako bi svi znakovi mogli da se identifikuju upotrebom pravila koja definišu način na koji su petlje i linije spojene jedne sa drugima, tada bi pojedinačna slova mogla da se prepoznaju bez obzira na oblik njihovog štamparskog pisma. Na primer: slovo "a" se pravi od jednog kruga, linije na desnoj strani i jednog luka nad sredinom. Luk na d sredinom je opcionalan. Tako, ako skenirano slovo ima ove "karakteristike", njega bi OCR program ispravno prepoznao kao slovo "a".
U pogledu napretka u istraživanju, ekstrakcija karakteristika bila je korak napred u odnosu na usaglašavanje matrice, ali na stvarne rezultate je loše uticao slab kvalitet štampe. Dodatne oznake na stranici, ili mrlje na papiru su imale dramatičan učinak na tačnost. Odstranjivanje takvog "šuma" je samo za sebe postalo područje za istraživanje, u pokušaju da se odredi koji bitovi štampe nisu deo pojedinačnih slova. Jednom kada se šum identifikuje, pouzdani delovi slova mogu da se da se rekonstruišu u najverovatnije oblike slova.
Nijedan OCR softver nikada ne prepoznaje 100% skeniranih slova. Neki OCR programi koriste usaglašavanje matrice/uzorka i/ili ekstrakciju karakteristika da prepoznaju što je moguće više znakova - i komplemetiraju ove metode sa primenom provere ispravnosti pisanja na slova koja dotle nisu prepoznata. Na primer: ako OCR program nije bio u stanju da prepozna slovo "e" u reči "th~ir", pomoću programa za proveru ispravnosti pisanja, moglo bi se ustanoviti da je slovo koje nedostaje "e" (da bi se dobila reč "their").
Novija tehnologija OCR je daleko usavršenija od starih tehnika. Umesto samo da pokušavaju da prepoznaju pojedinačne znakove, moderne tehnike su u stanju da identifikuju cele reči. Ova tehnologija, koju je razvila firma Caere, zove se POWR (Predictive Optical Word Recognition - predividivo optičko prepoznavanje reči).
Koristeći više nivoe analize konteksta, POWR je u stanju da prividno odstrani probleme koje prouzrokuje šum. Ova tehnika omogućava da računar pregleda hiljade ili milione različitih načina na koje tačke u reči mogu da se slože u njene znakove. Svakoj mogućoj interpretaciji se onda dodeli verovatnoća i izabere se ona najveća. POWR koristi usavršene matematičke algoritme koji dozvoljavaju računaru da se usredsredi na najbolju interpretaciju, bez pojedinačnog ispitivanja svake moguće verzije.
Kada se verovatnoće dodeljuju pojedinačnim rečima, uzimaju se u obzir sve vrste informacija o kontekstu. Tehnologija koristi neuralne mreže i tehnike prediktivnog modelovanja, preuzete iz istraživanja u oblasti veštačke inteligencije i nauke o saznanju. To omogućava POWR da identifikuje reči na način koji je vrlo sličan ljudskom vizuelnom prepoznavanju. U praksi, tehnika značajno poboljšava tačnost prepoznavanja reči u svim tipovima dokumenata. Sve moguće interpretacije reči procenjuju se kombinovanjem svih izvora dokaza, od informacija niskog nivoa zasnovanih na pikselima, do kontekstnih značenja visokog nivoa. Onda se bira najverovatnija interpretacija.
Mada su sistemi za OCR prisutni već duže vreme, koristi od njih tek počinju da se cene. Prve ponude bile su izuzetno skupe, kako u pogledu softvera tako i hardvera, a bile su i neprecizne i teške za upotrebu. Zbog toga su se mnogi od prvih korisnika prepali od tehnologije. Medjutim, posle nekoliko godina, OCR se potpuno transformisalo. Savremeni softver za OCR je vrlo tačan, lako se koristi, nije mnogo skup i po prvi put izgleda da se OCR prihvata u svim vrstama radnog okruženja u masovnom obimu.
Ako nema potrebe da se sačuva informacija o bojama originalnog dokumenta, najbolje je da se dokumenti za OCR skeniraju u režimu nijansi sivog. To zauzima trećinu prostora potrebnog za RGB skeniranje u boji. Alternativa je da se skenira u režimu crteža - crno i belo bez nijansi sivog - ali tada se obično gube detalji, što smanjuje tačnost predstojećeg procesa optičkog prepoznavanja znakova.
[уреди] Retuširanje fotografija
Mada skeneri obezbedjuju efikasan način za registrovanje slika u boji, to je često samo početak. Jednom kada je fotografija, na primer, digitalizovana, njen izgled može dramatično da se izmeni upotrebom programa za uredjivanje bitmape ili paketa za slikanje.
U oglašavanju i publicistici, koristi se veoma malo "sirovih" slika - osobine modela se "prečišćavaju", bore peglaju, oči uoštravaju i boje, a neuredna kosa doteruje. Postoji takodje i težnja da se prave slike koje privlače pažnju, izobličavanjem i montiranjem odredjenih elemenata fotografija.
Onaj ko se bavi retuširanjem fotografija obično pokušava da uradi jednu od dve stvari - da promeni neke elemente slike na prirodan način koji ne može da se otkrije (na primer, da promeni nekome boju očiju), ili da napravi nešto što izgleda nestvarno i nemoguće. U oba slučaja, potezi ruke retušera ne smeju da se vide.
Najveći deo ove vrste rada može da se postigne koristeći Adobe Photoshop, ali čak i najprostiji paketi za slikanje dozvoljavaju ovu vrstu promena. Medjutim, mada se dosta toga može postići jevtinijim paketima, kao što su PaintShop Pro i PC Paintbrush, složeni efekti se mnogo lakše postižu upotrebom softvera kao što su PhotoShop, Xres i Corel PhotoPaint.