Kako pretraživači funkcioniraju?
Svatko tko koristi internet redovito koristi nekakav pretraživač kako bi pronašao odgovor na vlastiti upit ( search query) koji se unosi u pretraživač ili tražilicu. Zaista su pretraživači poput Googla , Opere, Mozzile i slično omogućili da naši svakodnevni životi budu uvelike olakšani štedeći nam vrijeme.
No, jeste li se ikad pretražujući internet zapitali kako pretraživač radi, funkcionira te kako on uspije pronaći točno ono što nas zanima, a upisali smo samo jednu riječ?
Jel to magija, nekakvo čitanje misli ili nešto treće? Zapravo, odgovor je poprilično jednostavan, kvaka je u strojnom učenju ( machine learning). Pretraživači su s vremenom poprilično evoluirali te se kontinuirano unaprjeđuju. Za potrebe ovoga bloga, primjer će nam biti Google tražilica te jednostavan primjer riječi “špageti”.
Svakodnevno tisuće ljudi pretražuje internet o svakakvim stvarima, među njima zasigurno je Google i njegova primjena. Sami pristup istraživanju tema, pitanja i riješenja se promjenio kao i korisničko putovanje ljudi.
To je tema o kojoj je napisano, snimljeno i objavljeno mnoštvo knjiga, članaka, filmova i emisija dok paralelno nastavlja biti predmet znatiželje i istraživanja.
Primjerice, bliži se vrijeme večere i Vama se jedu špageti. Nakon što ste upisali riječ “špageti” Google Vam je dao nekoliko desetina stranica o špagetima i receptima.
Od samih početaka, Google je kontinuirano “mapirao” cijeli web koji obuhvaćao na tisuće stranica kako bi stvorio nešto što se zove “index” !. Zamišljena je kao jedna velika knjižnica u kojoj možete potražiti odgovor na bilo koje Vaše pitanje ili pojam kao primjerice “špageti”.
Riječ “špageti” često se pojavljuje na internetu te su njihova povijest i različiti recepti vrlo prisutni ali grupirani, što bi mogao biti problem ako ste gladni jer nasumično klikanje kroz tisuće linkova nije zabavno. Upravo u tome trenutku Googleovi algoritmi dolaze do izražaja. Prvo pokušavaju razumjeti što tražite tako da Vam pomognu iako ne znate što točno tražite ili ako Vam je gramatika netočna.
Zatim pretražuju milijune mogućih točnih odgovora iz “indexa” te automatski pronalaze stranice koje bi vam trebale pružiti relevantne informacije koje ste tražili te Vam pruža mogućnost odabira i pomoći.
Kako algoritmi odlučuju što ide na prvu stranicu?
Postoje stotine faktora koji utječu na rangiranje rezultata pretraživanja. Do sada, stranice koje imaju riječi za koje ste tražili će završiti više pri vrhu pretraživanja. No, jeste li znali i da lokacija riječi na stranici igra ulogu u rangiranju? Primjerice, u naslovu, opisi slika i slično, ima ipak nešto više u rangiranju od samih riječi.
U prošlosti kad je Google krenuo, gledalo se da stranice budu što bolje međusobno povezane kako bismo bolje razumjeli o čemu su stranice i koliko su vjerodostojne i istinite. Danas je još “linkanje stranice” ( broj linkova na Vašoj stranici koji vode na drugu stranicu i obrnuto) važan faktor, ali je na važnosti dobila i geografska lokacija pretrage.
Primjerice, boraveći u Italiji upisujete u tražilicu “špagete” jer Vas zanima pravi recept, no ako googlate u Texasu veća je vjerojatnost da Vas nije zanimao recept i to Google uzima u obzir
Datum objave internet stranica također je važan faktor jer novije stranice koje su imaju novije informacije te su samim time vjerodostojne i relevantnije za upite, a pogotovo u slučaju brzog razvoja novih stvari, vijesti te informacija.
Scam
Naravno ne žele sve stranice na internetu biti vjerodostojne i od pomoći, baš kao što je slučaj i s e-mailovima. Postoji jako puno stranice namijenjenu scamu a svaki dan scameri prave na tisuće i tisuće novih takvih stranica.
Samo zato sto ste na stranici instantvirus.download našli recept za najbolje špagete to ne znači da će vam to pomoći napraviti najbolje špagete.
Google provodi puno vremena kako bi spriječio takve stranice kako se ne bi pojavila nama u rezultatima pretraživanju. Google takve stranice prvo skenira pomoću svojih algoritama te ih “označi” kako bi ih izolirao da se ne pojavljuju pri rezultatima pretraživanja.
Više milijuna puta dnevno, kada god netko potraži špagete ili bilo što drugo, Googleov software pronalazi sav relevantan sadržaj na internetu, uklanja spam te ih rangira na temelju faktora ( riječi, linkovi ,lokacija, starost stranice itd) .
Kako je Google unaprijedio svoj način pretraživanja?
Od 1998. godine kada je Google postao online, ljudi ga puno koriste kako bi pronašli odgovore na svoja pitanja. Web se jako brzo mijenja i ljudi uvijek traže nešto novo, toliko novo da je zapravo 1 od 7 pretraga novi upit koji apsolutno NIKAD nije upisan u Google. Zato on konstantno traži “update” ( novosti) pri pretraživanju i to na tisuće puta godišnje.
Kako onda odlučuju je li’ promjena pomogla?
Jedan od načina je tako što “pitaju” ljude koji koriste Google. Svaki dan tisuće zaposlenih ( “search quality” ) u Google pregledavaju uzorke pretraživanja te daju povratnu informaciju o važnosti tražene informacije. Kako bi se uvjerili da su procjene dosljednije , prate upute ( search quality evaluator guidance ) kako bi procijenili što dobar rezultat čini dobrim rezultatom. Na temelju njihovog posla procjenjuju se promjene ali njihov posao ne utječe direktno na rangiranje rezultata pretraživanja.
Ukratko to je to. Svaki put kada kliknete pretraži algoritmi analiziraju značenje riječi koju tražite, traže odgovarajući sadržaj na netu, pokušava razumjeti koji sadržaj će biti koristan i relevantan za vas upit te automatski sastavlja sve skupa na organiziranim internet stranicama koje su dizajnirane da dobijete što prije informaciju. I da, to sve za samo 0.37 sekundu
Oko 2.290.000 rezultata (0,37 sek)
Google je uspio nešto što nije nitko do sada, on je “brendirao” internet i to je hvale vrijedno, svi nešto možemo naučiti!
Imate li bilo kakvih pitanja, nešto za dodati ili želite li nam nešto reći kontaktirajte nas!
Matko Dragičević