I sammenheng med Internett -teknologier er en søkemotor (på engelsk : søkemotor ) et automatisk system som analyserer et sett med data (ofte samlet inn av seg selv) og returnerer en indeks over tilgjengelig innhold [1] , og klassifiserer dem automatisk basert på statistisk-matematiske formler som angir graden av relevans gitt en bestemt søkenøkkel . Et av feltene der søkemotorer finner større bruk, er informasjonsinnhenting og på nettet . De mest brukte søkemotorene i 2017 var: Google , Bing , Baidu , Qwant , Yandex, Ecosia , DuckDuckGo [2] [3] .
Konseptuelt er en søkemotor et system som ligner veldig på en nettapplikasjon eller et klient - serversystem , gjennom Internett , hvor klienten er representert av brukerens nettleser som på forespørsel fra samme kobler til en server som igjen utfører et søk , ved hjelp av passende søkealgoritmer , på databaser ( distribuerte databaser ). I analysen av resultatene som er gitt, er en viktig komponent den såkalte crawler eller edderkopp. En god søkemotor er den som klarer å finne det største antallet innhold i tråd med typen forespørsel, sortert etter viktighet og relevans i henhold til søkespesifikasjonen [4] .
Arbeidet til søkemotorer er hovedsakelig delt inn i tre faser [5] :
Etter analysen av sidene, i henhold til kriterier som varierer fra motor til motor, blir noen av dem satt inn i databasen og i indeksen til søkemotoren.
Tekstdelen som er lagret i analysefasen vil deretter bli analysert for å gi svar på brukersøk. Mange nettsøkemotorer gjør også tilgjengelig en kopi av tekstdataene til hver arkivert side for når den opprinnelige ressursen ikke er tilgjengelig: denne funksjonen kalles caching [6] [7] [8] .
SvarÅ svare på brukerforespørsler innebærer behovet for å liste nettstedene i rekkefølge av relevans i forhold til den mottatte forespørselen.
For å fastslå relevansen til et nettsted, søkes dokumenter som inneholder nøkkelordet [9] angitt av brukeren i databasen, hvoretter hver søkemotor bruker sine egne algoritmer for å klassifisere sidene, og kontrollerer for eksempel hvor mange ganger nøkkelordene er gjentatt, hvor mange lenker det dokumentet mottar, i hvilke punkter på siden søkeordene er plassert, hvor mange nettsteder i databasen som inneholder lenker til den siden, eller hvor mange ganger en bruker har besøkt dette nettstedet etter et søk [10] .
SøkeavgrensningMuligheten til å avgrense søket varierer fra motor til motor, men de fleste av dem lar deg bruke boolske operatorer : for eksempel kan du søke etter " Ganymede AND satellite NOT cupbearer " for å søke etter informasjon om Ganymedes som en planet og ikke som en mytologisk figur .
På Google og på de mest moderne motorene er det mulig å avgrense søket i henhold til språket i dokumentet, ordene eller frasene som er tilstede eller fraværende, filformatet ( Microsoft Word , PDF , PostScript , etc.), avhengig av datoen av den siste oppdateringen og mer. Du kan også søke etter innhold på et bestemt nettsted, for eksempel vil " Ganymedes nettsted: nasa.gov " søke etter informasjon om Ganymedes på NASAs nettsted .
På Exalead er det en spesiell del for å avgrense søket mer intuitivt.
Indeksering refererer til innsetting av et nettsted i databasen til en søkemotor. Indeksering av et nettsted er med andre ord måten nettstedet blir anskaffet og tolket på av søkemotorer og derfor vises på deres svarsider på nettbrukeres spørsmål.
For å indeksere må et nettsted gjennomsøkes av en crawler. Dette kan skje naturlig takket være rutineskanning utført av søkemotorer, eller gjennom en eksplisitt forespørsel. For Google kan du be om en gjennomgang gjennom Search Console som er koblet til det aktuelle nettstedet.
Begrepet posisjonering betyr anskaffelse av synlighet blant resultatene til søkemotorer. Mer spesifikt er det operasjonen som siden er optimalisert for å vises i resultatene i en posisjon som er så gunstig og relevant som mulig [11] .
Begrepet søkemotoroptimalisering betyr, på internetts språk, alle de aktivitetene som tar sikte på å forbedre synligheten til et nettsted på søkemotorer (som for eksempel Google, Yahoo! osv.) for å forbedre (eller opprettholde) plassering på svarsidene til nettbrukeres spørsmål. I sin tur er den gode posisjoneringen av en nettside på responssidene til søkemotorer funksjonell for synligheten til produktene/tjenestene som selges [12] .
Søkemotorer gir også sponsede resultater, det vil si at de vises mer fremtredende på SERP -er ( Search Engine Result Pages ) nettsteder til selskaper som betaler for å være blant de beste resultatene når de søker etter termer (kalt nøkkelord . ) som er i forhold til området til kompetansen til selskapet selv [13] . Sponsede motorresultater kan også vises på nettsteder som deltar i deres tilknyttede program. Spesielt tillater Google at betalte resultater kjøpt med AdWords-programmet vises på resultatsidene deres (klart forskjellig fra "naturlige" resultater). I tillegg til dette tilbyr den også en sponsortjeneste som henvender seg til alle nettsteder som har visse krav, kalt AdSense. Google AdSense (ofte forkortet til Google AS) bruker søkemotorens evne til å tolke temaet på siden der den aktuelle koden er plassert for å levere temaannonser [14] . Yahoo! Search har annonsert ankomsten av et lignende program kalt Panama [15] .
Søkemotorene med størst internasjonal relevans i 2020 er [16] [17] :
Disse 4 søkemotorene er utstyrt med proprietær teknologi.
Andre viktige nevner er:
Blant de sistnevnte er de eneste som delvis er utstyrt med en proprietær indeks Qwant og delvis DuckDuckGo
År | Motor | Begivenhet | Motor | Nåværende tilstand |
---|---|---|---|---|
1993 | W3-katalog | Lansering | Tomgang | |
Aliweb | Lansering | Tomgang | ||
JumpStation | Lansering | Tomgang | ||
WWW Orm | Lansering | Tomgang | ||
1994 | WebCrawler | Lansering | Bing | Aktiv |
Go.com | Lansering | Tomgang | ||
Infosøk | Lansering | Tomgang | ||
Lycos | Lansering | Bing | Aktiv | |
Spenki | Fundament | Tomgang | ||
1995 | AltaVista | Lansering | Inaktiv, omdirigert til Yahoo! | |
Daum | Lansering | Aktiv | ||
Magellan | Lansering | Tomgang | ||
Spennende | Lansering | Inaktiv, kun nyheter | ||
JEG VET | Lansering | Inaktiv, kun nyheter | ||
Yahoo! | Lansering | Inaktiv (ble Yahoo! Search) | ||
1996 | Dogpile | Lansering | Aggregator | Aktiv |
Inktomi | Fundament | Inaktiv, kjøpt opp av Yahoo! | ||
HotBot | Fundament | Aktiv | ||
Arianna | Fundament | Inaktiv, innlemmet i Libero | ||
Multisoft | Fundament | Tomgang | ||
Virgil | Fundament | Aktive, Google-resultater | ||
Spør Jeeves | Fundament | Inaktiv (omdannet til ask.com) | ||
1997 | Nordlys | Lansering | Tomgang | |
Yandex | Lansering | Eieren | Aktiv | |
1998 | Lansering | Eieren | Aktiv | |
Ixquick | Lansering | Aggregator | Også aktiv som startside | |
MSN-søk | Lansering | Inaktiv, bli Bing | ||
empas | Lansering | Inaktiv (slått sammen med NATE) | ||
1999 | Alltheweb | Lansering | Inaktiv (URL omdirigert til Yahoo! ) | |
GenieKnows | Lansering | Tomgang | ||
Naver | Lansering | Aktiv | ||
Theoma | Fundament | Spørre | Aktiv | |
Vivísimo | Fundament | Inaktiv, IMB | ||
superEva | Lansering | Inaktiv, kun trendanalyse | ||
2000 | Baidu | Fundament | Eieren | Aktiv |
Exalead | Lansering | Eieren | Aktiv | |
Gigablast | Lansering | Eieren | Aktiv | |
2001 | Kartoo | Lansering | Tomgang | |
2003 | Info.com | Lansering | Bing | Aktiv |
Scroogle | Lansering | Tomgang | ||
2004 | Yahoo! Søk | Endelig lansering | Bing | Aktiv |
A9.com | Lansering | Tomgang | ||
Sogou | Lansering | Aktiv | ||
2005 | Windows Live Search | Endelig lansering | Tomgang | |
GoodSearch | Lansering | Tomgang | ||
Søk meg | Lansering | Tomgang | ||
2006 | Så så | Lansering | Aktiv | |
Quaero | Fundament | Tomgang | ||
Search.com | Fundament | Eieren | Aktiv (bare søk CBS) | |
Ask.com | Lansering | Aktiv | ||
Windows Live Search | Lansering | Tomgang | ||
ChaCha | Beta lansering | Tomgang | ||
Guruji.com | Beta lansering | Tomgang | ||
2007 | Wikiseek | Lansering | Tomgang | |
Sproose | Lansering | Tomgang | ||
Wikia-søk | Lansering | Tomgang | ||
2008 | Cuil | Lansering | Tomgang | |
Powerset | Lansering | Tomgang | ||
Pikollator | Lansering | Tomgang | ||
Viewzi | Lansering | Tomgang | ||
Boogami | Lansering | Tomgang | ||
LeapFish | Lansering | Tomgang | ||
Forestle | Lansering | Tomgang | ||
Ecocho | Lansering | Tomgang | ||
DuckDuckGo | Lansering | Bing + proprietære algoritmer | Aktiv | |
2009 | Wolfram Alpha | Lansering | Eieren | Aktiv |
Bing | Lansering | Eieren | Aktiv | |
Yebol | Lansering | Tomgang | ||
Mugurdy | Lansering | Tomgang | ||
Speider (Goby) | Lansering | Tomgang | ||
Coozila! | Lansering | Tomgang | ||
Ecosia | Lansering | Bing + proprietære algoritmer | Aktiv | |
NATE | Lansering | Aktiv | ||
2010 | iAlger | Lansering | Aktiv | |
Blekko | Lansering | Inaktiv (solgt til IBM) | ||
Cuil | Lansering | Tomgang | ||
Yandex (versjon
på engelsk) |
Lansering | Aktiv | ||
2011 | YaCy | Lansering | Inaktiv (selvdrevet programvare) | |
2012 | Volunia | Lansering | Tomgang | |
Idé | Lansering | Tomgang | ||
2013 | Istella | Lansering | Eieren | Tilgjengelig, inaktiv |
Qwant | Lansering | Bing + proprietære algoritmer | Aktiv | |
Aoohe | Lansering | Tomgang | ||
Coc Coc | Lansering | Aktiv | ||
Egerin | Lansering | Aktiv, kurdisk / sorani søkemotor | ||
2014 | Searx | Lansering | Aggregator | Aktiv |
Sveitser | Lansering | Bing | Aktiv | |
2015 | Klikk | Lansering | Eieren | Tomgang |
2017 | Xaphir | Beta | Eieren | Inaktiv, kjøpt opp av Qwant [19] |
De fleste søkemotorene som opererer på nettet drives av private selskaper som bruker proprietære algoritmer og databaser som holdes hemmelige. Det er imidlertid flere forsøk på å lage søkemotorer basert på gratis programvare , noen eksempler er:
Andre søkemotorer som er aktive fra mars 2020 er: Metager (for personvern), Serch Encrypt, SearX, Gibiru, YaCy (desentralisert), Yippi, Lukol og Boardreader.
De siste nyvinningene innen produksjon av algoritmer og informasjonsgjenvinningssystemer er basert på semantisk analyse av termer og den påfølgende opprettelsen av semantiske nettverk . Google har selv tatt i bruk systemer for feilforebygging og kontekstualisering av resultater [20] [21] .
Det er rimelig å forutsi at søkemotorer innen få år vil basere sine teknologier både på den kvantitative analysen av innholdet (selve ordene), og fremfor alt på den kvalitative (sansen av ordene). Søkemotorer vil for eksempel være i stand til å skille betydningen av ordet " fersken " i henhold til konteksten ordet er inneholdt i (for å forstå om det er frukten, sporten eller annet). For å bevege seg i denne retningen kjøpte Google Oingo (tidligere kjent som "konseptmotoren") og teknologien til selskapet som skapte den, Applied Semantics [22] .
Den nye grensen for søkemotorer er web 2.0 . Ved å ta i bruk denne logikken, sikter mange internasjonale motorer og kataloger på større deltakelse fra brukere i opprettelsen av søkemotorinnhold, for å eliminere all bruk av edderkopper eller sponsede lenker. Med denne logikken kan brukere rapportere koblingene selv og bestemme om de vil gi popularitet til de rapporterte nettstedene.
Web 2.0 tar også sikte på en raskere, raskere og mer intuitiv brukervennlighet takket være bruken av Metasearch- motorer (eller flere søkemotorer) som [23] [24] :