Google'i otsing koosneb reast lokaliseeritud veebisaitidest. Neist suurim, google.com, on maailma kõige külastatavam veebisait. Mõned selle funktsioonid hõlmavad enamiku otsingute, sealhulgas sõnaraamatusõnade definitsioonilinki, otsingu tulemuse arvu, linke teistele otsingutele (nt sõnade puhul, mida Google peab valesti kirjutatud olevat, annab ta lingi otsingutulemustele, milles kasutatakse tema pakutud õigekirja) ja palju muud.
Otsingu süntaks
Google'i otsingumootor võtab tavaliselt päringuid vastu lihtsa tekstina ja jaotab kasutaja teksti otsinguterminite jadaks, mis tavaliselt on sõnad, mis peavad tulemustes esinema, kuid võib kasutada ka booletseid operaatoreid, näiteks: jutumärgid (") fraasi jaoks, eesliide nagu "+", "-" kvalifitseeritud terminite jaoks või üks mitmetest täiustatud operaatoritest, näiteks "site:". Veebilehed "Google Search Basics" kirjeldavad kõiki neid täiendavaid päringuid ja võimalusi (vt allpool: Search options).
Google'i täiustatud otsingu veebivorm annab mitu lisavälja, mida saab kasutada otsingute kvalifitseerimiseks selliste kriteeriumide alusel nagu esimese otsingu kuupäev. Kõik täiustatud päringud muutuvad tavalisteks päringuteks, tavaliselt koos täiendavate kvalifitseeritud terminitega.
Päringu laiendamine
Google kohaldab esitatud otsingupäringu suhtes päringu laiendamist, muutes selle päringuks, mida tegelikult tulemuste saamiseks kasutatakse. Nagu ka lehekülgede järjestamise puhul, on Google'i kasutatava algoritmi täpsed üksikasjad tahtlikult varjatud, kuid kindlasti kuuluvad järgmiste teisenduste hulka:
- Terminite ümberjärjestamine: teabe otsimisel on see standardne tehnika, et vähendada tulemuste otsimisega seotud tööd. See muutmine on kasutajale nähtamatu, sest tulemuste järjestamisel kasutatakse asjakohasuse määramiseks algset päringu järjekorda.
- Stemmingut kasutatakse otsingu kvaliteedi tõstmiseks, säilitades otsingusõnade väikesed süntaktilised variandid.
- Võimalike kirjavigade parandamise võimalus päringutes on piiratud.
"Ma tunnen end õnnelikuna"
Google'i avalehel on nupp "I'm Feeling Lucky". Kui kasutaja klõpsab nupule, viiakse ta otse esimesele otsingutulemusele, möödudes otsingumootori tulemuste lehest. Mõte on selles, et kui kasutaja "tunneb end õnnelikuna", siis annab otsingumootor esimesel korral tagasi täiusliku vastuse, ilma et ta peaks otsingutulemusi läbi lehitsema. Tom Chavezi (Rapt) uuringu kohaselt maksab see funktsioon Google'ile 110 miljonit dollarit aastas, kuna 1% kõigist otsingutest kasutab seda funktsiooni ja läheb mööda kogu reklaamist.
30. oktoobril 2009 eemaldati mõnede kasutajate jaoks Google'i avalehelt nupp "I'm Feeling Lucky" koos tavalise otsingunupuga. Mõlemad nupud asendati väljaga, kus on kirjas: "See koht on tahtlikult tühjaks jäetud". See tekst hääbus, kui hiirt lehel liigutati, ja tavaline otsingufunktsioon saavutatakse, kui täidetakse otsinguvälja soovitud terminid ja vajutatakse enterit. Google'i pressiesindaja selgitab: "See on vaid test ja viis, kuidas me saame hinnata, kas meie kasutajatele meeldib veelgi lihtsam otsinguliides." Personaliseeritud Google'i avalehel jäid alles nii nupud kui ka nende tavapärased funktsioonid.
21. mail 2010, Pac Mani 30. aastapäeval, asendati nupp "I'm Feeling Lucky" nupuga, millel oli kirjas "Insert Coin". Pärast nupu vajutamist algas Google'i teemaline Pac-Mani mäng piirkonnas, kus tavaliselt oleks olnud Google'i logo. Kui nuppu teist korda vajutada, algab sama mängu kahe mängija versioon, mis sisaldab Ms. Pacmani 2. mängijale. See versioon on kättesaadav aadressil http://www.google.com/pacman, kus on püsiv link leheküljele.
Rich Snippets
12. mail 2009 teatas Google, et nad hakkavad analüüsima hCard, hReview ja hProduct mikroformaate ning kasutavad neid otsingutulemuste lehekülgede täitmisel nn "Rich Snippets" abil.
Eriomadused
Lisaks põhilisele otsingumootori funktsioonile, milleks on teksti otsimine, on Google Search'il rohkem kui 22 "erifunktsiooni" (mis aktiveeritakse kümnete käivitavate sõnade sisestamisega):
- ilm - paljude linnade ilmaolusid, temperatuuri, tuult, õhuniiskust ja prognoosi saab vaadata, kui sisestada "ilm" koos linnaga suuremate linnade puhul või linna ja osariigi, USA postiindeksi või linna ja riigi puhul väiksemate linnade puhul (näiteks: Lawrence, Kansas; ilm Pariis; ilm Bremen, Saksamaa).
- börsikursid - konkreetse ettevõtte või fondi turuandmeid saab vaadata, sisestades börsikurssi sümboli (või lisades "aktsia"), näiteks: CSCO; MSFT; IBM aktsia; F aktsia (loetleb Ford Motor Co. ); või AIVSX (fond). Tulemused näitavad päevasiseseid muutusi või 5-aastast graafikut jne. See ei tööta aktsianimede puhul, mis on ühe tähe pikkused, nagu Citigroup (C) või Macy's (M) (erandiks on Ford), või on tavalised sõnad, nagu Diamond Offshore (DO) või Majesco (COOL).
- time - praegust aega paljudes linnades (kogu maailmas) saab vaadata, kui sisestada "time" ja linna nimi (näiteks: time Cairo; time Pratt, KS).
- sporditulemused - spordimeeskondade tulemusi ja ajakavasid saab kuvada, kui sisestada meeskonna nimi või liiga nimi otsingukasti.
- ühikute teisendamine - mõõtmisi saab teisendada, sisestades iga fraasi, näiteks: või 90 km miilides.
- valuuta konverteerimine - raha või valuuta konverteri saab valida, sisestades nimed või valuutakoodid (loetletud ISO 4217 järgi): 6789 eurot USA dollariks; 150 GBP USA dollariks; 5000 jeeni USA dollariks; 5000 jüaani liiriks (USA dollar võib olla USD või "US$" või "$", Kanada aga CAD jne).
- kalkulaator - arvutustulemusi saab määrata, nagu arvutatakse otse, sisestades valemi numbrites või sõnades, näiteks: 6*77 +pi +sqrt(e^3)/888 pluss 0,45. Kasutajale antakse võimalus pärast arvutust valemit otsida. Kalkulaator kasutab ka ühiku- ja valuutavahetuse funktsioone, et võimaldada ühikuga arvestamist. Näiteks "(3 EUR/liter) / (40 miili/gallon) USD / miil" arvutab dollarite maksumuse miili kohta 40 mpg auto puhul, mille bensiin maksab 3 eurot liitri kohta. Tähis "^" tõstab arvu eksponendipotentsiaaliks ja lubatud on protsentide kasutamine ("40% 300-st").
- numbrilised vahemikud - numbrite komplekti saab sobitada, kasutades topeltpunkti vahemiku numbrite vahel (70..73 või 90..100), et sobitada mis tahes positiivset arvu vahemikus, kaasa arvatud. Negatiivseid numbreid käsitletakse, kasutades välistavat kriipsu, et mitte sobitada numbrit.
- sõnastiku otsing - sõnale või fraasile saab leida definitsiooni, sisestades "define", millele järgneb koolon ja sõna(d), mida otsida (näiteks "define:philosophy").
- kaardid - mõned seotud kaardid saab kuvada, kui sisestada asukoha nimi või USA postiindeks ja sõna "kaart" (näiteks: New Yorgi kaart; Kansase kaart või Pariisi kaart).
- filmide näitamisajad - Arvustused või filmide näitamisajad on võimalik loetleda kõigi lähedal mängivate filmide kohta, kui sisestada otsingukasti "filmid" või mis tahes praeguse filmi nimi. Kui konkreetne asukoht on eelmises otsingus salvestatud, kuvatakse ülemises otsingutulemuses selle filmi lähedal asuvate kinode näitamisajad. Need nimekirjad on aga mõnikord täiesti ebaõiged ja Google'ile ei ole võimalik neid parandada; näiteks 25. juulil on Google'i showtimes El Capitani teatri puhul nimekirjas Up, kuid El Capitani veebisaidi andmetel on ainus film, mida sel päeval mängitakse, G-Force. []
- avalikud andmed - rahvaarvu (või töötuse määra) suundumusi saab leida USA osariikide ja maakondade kohta, kui sisestada "population" või "unemployment rate", millele järgneb osariigi või maakonna nimi.
- kinnisvara ja elamispinnad - Kodunimekirjad konkreetses piirkonnas saab kuvada, kasutades käivitussõnu "housing", "home" või "real estate", millele järgneb linna või USA postiindeksi nimi.
- reisiandmed/lennuväljad - saabuvate või väljuvate USA lendude lennustaatust saab kuvada, kui sisestada otsingukasti lennufirma nimi ja lennunumber (näiteks: American airlines 18). Samuti saab vaadata hilinemisi konkreetses lennujaamas (sisestades linna nime või lennujaama kolmetähelise koodi ja sõna "lennujaam").
- paki jälgimine - pakiposti saab jälgida, sisestades Royal Maili, UPSi, Fedexi või USPSi paki jälgimisnumbri otse otsingukasti. Tulemused sisaldavad kiirlinke iga saadetise staatuse jälgimiseks.
- patendi numbrid - USA patente saab otsida, sisestades otsingukasti sõna "patent", millele järgneb patendi number (näiteks: Patent 5123123).
- piirkonnakood - Geograafilise asukoha (mis tahes USA telefonipiirkonna kood) saab kuvada, sisestades kolmekohalise piirkonnakoodi (näiteks: 650).
- sünonüümide otsing - otsing võib leida sõnu, mis on sarnased määratud sõnadega, asetades tilde-märgi (~) vahetult otsingusõna ette, nt: Näiteks: ~kiiretoit.
- USA valitsuse otsing - USA valitsuse veebisaitide otsingut saab teha veebilehelt: www.google.com/unclesam.
Otsinguvõimalused
Google'i abikeskuse hallatavatel veebilehtedel on tekst, mis kirjeldab rohkem kui 15 erinevat otsinguvõimalust. Google'i operaatorid:
- VÕI - Otsi ükskõik kumba, näiteks "price high OR low" otsib "price" koos "high" või "low".
- "-" - Otsing, välistades sõna, näiteks "apple -tree" otsib, kus sõna "tree" ei kasutata.
- "+" - sunnib lisama sõna, näiteks "nimi +mängu +mängu", et nõuda sõnade "of" ja "the" ilmumist vastaval leheküljel.
- "*" - Wildcard-operaator, et sobitada mis tahes sõnu teiste konkreetsete sõnade vahel.
Mõned päringuvõimalused on järgmised:
- define: - päringu eesliide "define:" annab pärast seda loetletud sõnade määratluse.
- stocks: - Pärast "stocks:" käsitletakse päringu termineid otsingu jaoks kui aktsiate märgusõnu.
- kohas: - Piirake tulemused antud domeenis asuvatele veebisaitidele, näiteks site:www.acmeacme.com. Valik "site:com" otsib kõiki domeeni URL-aadresse, mille nimeks on ".com". (ilma tühikuta pärast "site:").
- allintitle: - Otsitakse ainult lehekülje pealkirju (mitte iga veebilehe ülejäänud teksti).
- intitle: - Esileht, mida otsida veebilehe pealkirjas, näiteks "intitle:google search" loetleb lehekülgi, mille pealkirjas on sõna "google" ja sõna "search" kuskil (tühikut pärast "intitle:" ei ole).
- allinurl: - Ainult lehekülje URL-aadressi read otsitakse (mitte tekst iga veebilehe sees).
- inurl: - Iga URL-is leiduva sõna eesliide; teised sõnad sobivad ükskõik kus, näiteks "inurl:acme search" sobib "acme" URL-is, kuid sobib "search" ükskõik kus (tühikut pärast "inurl:" ei ole).
Lehekülje kuvamise valikud (või päringu tüübid) on järgmised:
- cache: - Rõhutab otsingusõnu vahemällu salvestatud dokumendis, näiteks "cache:www.google.com xxx" näitab vahemällu salvestatud sisu koos sõnaga "xxx" rõhutatult.
- link: - Eesliide "link:" loetleb veebilehti, millel on lingid määratud veebilehele, näiteks "link:www.google.com" loetleb veebilehti, mis viitavad Google'i kodulehele.
- seotud: - Eesliide "related:" loetleb veebilehed, mis on "sarnased" määratud veebilehega.
- info: - kuvatakse taustinformatsiooni ühe määratud veebilehe kohta, näiteks info:www.google.com. Tavaliselt on info esimene tekst (160 baiti, umbes 23 sõna), mis sisaldub lehel ja mida kuvatakse tulemuse kirje stiilis (ainult 1 lehe puhul, mis vastab otsingule).
- failitüüp: - tulemused näitavad ainult soovitud tüüpi faile (nt filetype:pdf annab tagasi pdf-failid)
Pange tähele, et Google otsib veebilehe sees olevat HTML-koodi, mitte ekraani väljanägemist: ekraanil kuvatavad sõnad ei pruugi olla HTML-koodis samas järjekorras.
Veateated
Mõned otsingud annavad 403 Forbidden vea tekstiga
"Meil on kahju...
... kuid teie päring sarnaneb arvutiviiruse või nuhkvara rakenduse automaatsete päringutega. Meie kasutajate kaitsmiseks ei saa me praegu teie päringut töödelda.
Me taastame teie juurdepääsu nii kiiresti kui võimalik, seega proovige varsti uuesti. Vahepeal, kui kahtlustate, et teie arvuti või võrk on nakatunud, võiksite käivitada viirusetõrje programmi või nuhkvara eemaldaja, et veenduda, et teie süsteemid on vabad viirustest ja muust kahjulikust tarkvarast.
Vabandame ebamugavuste pärast ja loodame, et kogu Google'i meeskond näeb teid veel kord."
millele mõnikord järgneb CAPTCHA-kõne.
Ekraanist teatati esmakordselt 2005. aastal ja see oli vastus sellele, et otsingumootori optimeerimisega tegelevad ettevõtted kasutasid Google'i intensiivselt, et kontrollida nende poolt optimeeritavate saitide ridu. Sõnum käivitub suure hulga päringute korral ühelt IP-aadressilt. Google kasutab ilmselt Google'i küpsist osana teenuse keeldumise määramisest.
2009. aasta juunis, pärast popi superstaari Michael Jacksoni surma, ilmus see sõnum paljudele internetikasutajatele, kes otsisid Google'ist lauljaga seotud uudiseid, ning Google pidas seda DDoS-rünnakuks, kuigi paljud päringud olid esitatud õiguspärase otsingu tegijate poolt.
Jaanuar 2009 pahavara viga
Google märgistab otsingutulemused sõnumiga "See sait võib kahjustada teie arvutit", kui on teada, et sait installib taustal või muul viisil salaja pahatahtlikku tarkvara. Google teeb seda selleks, et kaitsta kasutajaid selliste saitide külastamise eest, mis võivad nende arvutit kahjustada. Umbes 40 minutit 31. jaanuaril 2009 liigitati kõik otsingutulemused ekslikult pahavara hulka ja seetõttu ei saanud neile klikata; selle asemel kuvati hoiatussõnum ja kasutaja pidi soovitud URL-i käsitsi sisestama. Viga tulenes inimlikust eksimusest. URL "/" (mis laieneb kõigile URL-dele) lisati ekslikult pahavara mustrite faili.
Doodle Google'ile
Teatud juhtudel muutub Google'i veebilehe logo eriversiooniks, mida nimetatakse "Google Doodle'iks". Doodle'ile klõpsates avanevad lingid Google'i teemakohaste otsingutulemuste jadale. Esimene oli viide 1998. aastal toimunud BurningMan festivalile ning teisi on toodetud selliste märkimisväärsete inimeste nagu Albert Einstein sünnipäevade, ajalooliste sündmuste nagu Lego klotside 50. aastapäeva ja pühade nagu sõbrapäeva puhul.
Google kofeiin
2009. aasta augustis teatas Google uue otsinguarhitektuuri kasutuselevõtust, mille koodnimetus on "Caffeine". Uue arhitektuuri eesmärk oli anda tulemusi kiiremini tagasi ja tulla paremini toime kiiresti ajakohastatud teabega, mis pärineb muu hulgas Facebooki ja Twitteri teenustest. Google'i arendajad märkisid, et enamik kasutajaid ei märka kohe muutusi, kuid kutsusid arendajaid uut otsingut oma liivakastis katsetama. Otsingumootori optimeerimisele mõju avaldavate erinevuste puhul märgiti, et märksõnade kaalumine on suurem ja domeeni vanus on olulisem. Mõnel pool tõlgendati seda sammu kui vastust Microsofti hiljutisele Microsofti enda otsinguteenuse uuendatud versiooni, mis nimetati ümber Bingiks. Google teatas Caffeine'i valmimisest 8. juunil 2010, väites, et tänu indeksi pidevale uuendamisele on tulemused 50% värskemad. Caffeine'i abil viis Google oma back-end indekseerimissüsteemi MapReduce'ilt üle ettevõtte hajutatud andmebaasiplatvormile BigTable. Caffeine põhineb samuti Colossusel ehk GFS2-l, mis on GFS-i hajutatud failisüsteemi uuendamine.
Krüpteeritud otsing
2010. aasta mais võttis Google kasutusele SSL-krüpteeritud veebiotsingu. Krüpteeritud otsingule pääseb ligi aadressil: https://encrypted.google.com.
Kohene otsing
Google Instant, täiustus, mis kuvab soovitatud tulemusi kasutaja sisestamise ajal, võeti Ameerika Ühendriikides kasutusele alates 8. septembrist 2010. Üks mure on see, et inimesed võivad valida ühe soovitatud tulemustest, selle asemel et lõpetada oma päring, ning et selline praktika võib tekitada eelarvamusi tuttavate ettevõtete või muude otsinguterminite suhtes. Pornograafilised või muul viisil solvavad otsingusõnad on soovitatud tulemustest välja jäetud. Pikafunktsioon ilmub ainult Google'i põhisaidil, mitte iGoogle'i erilehekülgedel. Google loodab, et Google Instant säästab kasutajatele 2 kuni 5 sekundit iga otsingu puhul, mis nende sõnul on kokku 11 miljonit sekundit tunnis. Otsingumootoriturunduse asjatundjad spekuleerisid, et Google Instantil on suur mõju kohalikule ja tasulisele otsingule.
Koos Google Instant'i käivitamisega keelas Google kasutajatele võimaluse valida, kas nad soovivad näha rohkem kui 10 otsingutulemust lehekülje kohta. Instant Search'i saab keelata Google'i "eelistuste" menüü kaudu, kuid automaatsete otsingusoovituste stiilis otsingut ei saa nüüd keelata. Google'i esindaja teatas: "See on kooskõlas meie nägemusega ühtsest Google'i otsingukogemusest, et muuta populaarsed ja kasulikud funktsioonid vaikimisi kogemuse osaks, selle asemel, et säilitada erinevaid Google'i versioone. Kuna Autocomplete'i kvaliteet on paranenud, leidsime, et on asjakohane, et see oleks alati kõigi meie kasutajate jaoks sisse lülitatud."