Søkemotor

I sammenheng med Internett -teknologier er en søkemotor (på engelsk : søkemotor ) et automatisk system som analyserer et sett med data (ofte samlet inn av seg selv) og returnerer en indeks over tilgjengelig innhold [1] , og klassifiserer dem automatisk basert på statistisk-matematiske formler som angir graden av relevans gitt en bestemt søkenøkkel . Et av feltene der søkemotorer finner større bruk, er informasjonsinnhenting og på nettet . De mest brukte søkemotorene i 2017 var: Google , Bing , Baidu , Qwant , Yandex, Ecosia , DuckDuckGo [2] [3] .

Beskrivelse

Konseptuelt er en søkemotor et system som ligner veldig på en nettapplikasjon eller et klient - serversystem , gjennom Internett , hvor klienten er representert av brukerens nettleser som på forespørsel fra samme kobler til en server som igjen utfører et søk , ved hjelp av passende søkealgoritmer , på databaser ( distribuerte databaser ). I analysen av resultatene som er gitt, er en viktig komponent den såkalte crawler eller edderkopp. En god søkemotor er den som klarer å finne det største antallet innhold i tråd med typen forespørsel, sortert etter viktighet og relevans i henhold til søkespesifikasjonen [4] .

Driftstrinn

Arbeidet til søkemotorer er hovedsakelig delt inn i tre faser [5] :

Katalogisering

Etter analysen av sidene, i henhold til kriterier som varierer fra motor til motor, blir noen av dem satt inn i databasen og i indeksen til søkemotoren.

Tekstdelen som er lagret i analysefasen vil deretter bli analysert for å gi svar på brukersøk. Mange nettsøkemotorer gjør også tilgjengelig en kopi av tekstdataene til hver arkivert side for når den opprinnelige ressursen ikke er tilgjengelig: denne funksjonen kalles caching [6] [7] [8] .

Svar

Å svare på brukerforespørsler innebærer behovet for å liste nettstedene i rekkefølge av relevans i forhold til den mottatte forespørselen.

For å fastslå relevansen til et nettsted, søkes dokumenter som inneholder nøkkelordet [9] angitt av brukeren i databasen, hvoretter hver søkemotor bruker sine egne algoritmer for å klassifisere sidene, og kontrollerer for eksempel hvor mange ganger nøkkelordene er gjentatt, hvor mange lenker det dokumentet mottar, i hvilke punkter på siden søkeordene er plassert, hvor mange nettsteder i databasen som inneholder lenker til den siden, eller hvor mange ganger en bruker har besøkt dette nettstedet etter et søk [10] .

Søkeavgrensning

Muligheten til å avgrense søket varierer fra motor til motor, men de fleste av dem lar deg bruke boolske operatorer : for eksempel kan du søke etter " Ganymede AND satellite NOT cupbearer " for å søke etter informasjon om Ganymedes som en planet og ikke som en mytologisk figur .

Google og på de mest moderne motorene er det mulig å avgrense søket i henhold til språket i dokumentet, ordene eller frasene som er tilstede eller fraværende, filformatet ( Microsoft Word , PDF , PostScript , etc.), avhengig av datoen av den siste oppdateringen og mer. Du kan også søke etter innhold på et bestemt nettsted, for eksempel vil " Ganymedes nettsted: nasa.gov " søke etter informasjon om Ganymedes på NASAs nettsted .

På Exalead er det en spesiell del for å avgrense søket mer intuitivt.

Indeksering

Indeksering refererer til innsetting av et nettsted i databasen til en søkemotor. Indeksering av et nettsted er med andre ord måten nettstedet blir anskaffet og tolket på av søkemotorer og derfor vises på deres svarsider på nettbrukeres spørsmål.

For å indeksere må et nettsted gjennomsøkes av en crawler. Dette kan skje naturlig takket være rutineskanning utført av søkemotorer, eller gjennom en eksplisitt forespørsel. For Google kan du be om en gjennomgang gjennom Search Console som er koblet til det aktuelle nettstedet.

Posisjonering

Begrepet posisjonering betyr anskaffelse av synlighet blant resultatene til søkemotorer. Mer spesifikt er det operasjonen som siden er optimalisert for å vises i resultatene i en posisjon som er så gunstig og relevant som mulig [11] .

Optimalisering

Begrepet søkemotoroptimalisering betyr, på internetts språk, alle de aktivitetene som tar sikte på å forbedre synligheten til et nettsted på søkemotorer (som for eksempel Google, Yahoo! osv.) for å forbedre (eller opprettholde) plassering på svarsidene til nettbrukeres spørsmål. I sin tur er den gode posisjoneringen av en nettside på responssidene til søkemotorer funksjonell for synligheten til produktene/tjenestene som selges [12] .

Sponsede resultater

Søkemotorer gir også sponsede resultater, det vil si at de vises mer fremtredende på SERP -er ( Search Engine Result Pages ) nettsteder til selskaper som betaler for å være blant de beste resultatene når de søker etter termer (kalt nøkkelord . ) som er i forhold til området til kompetansen til selskapet selv [13] . Sponsede motorresultater kan også vises på nettsteder som deltar i deres tilknyttede program. Spesielt tillater Google at betalte resultater kjøpt med AdWords-programmet vises på resultatsidene deres (klart forskjellig fra "naturlige" resultater). I tillegg til dette tilbyr den også en sponsortjeneste som henvender seg til alle nettsteder som har visse krav, kalt AdSense. Google AdSense (ofte forkortet til Google AS) bruker søkemotorens evne til å tolke temaet på siden der den aktuelle koden er plassert for å levere temaannonser [14] . Yahoo! Search har annonsert ankomsten av et lignende program kalt Panama [15] .

Populære søkemotorer

Søkemotorene med størst internasjonal relevans i 2020 er [16] [17] :

Disse 4 søkemotorene er utstyrt med proprietær teknologi.

Andre viktige nevner er:

Blant de sistnevnte er de eneste som delvis er utstyrt med en proprietær indeks Qwant og delvis DuckDuckGo

I Italia

Liste

År Motor Begivenhet Motor Nåværende tilstand
1993 W3-katalog Lansering Tomgang
Aliweb Lansering Tomgang
JumpStation Lansering Tomgang
WWW Orm Lansering Tomgang
1994 WebCrawler Lansering Bing Aktiv
Go.com Lansering Tomgang
Infosøk Lansering Tomgang
Lycos Lansering Bing Aktiv
Spenki Fundament Tomgang
1995 AltaVista Lansering Inaktiv, omdirigert til Yahoo!
Daum Lansering Aktiv
Magellan Lansering Tomgang
Spennende Lansering Inaktiv, kun nyheter
JEG VET Lansering Inaktiv, kun nyheter
Yahoo! Lansering Inaktiv (ble Yahoo! Search)
1996 Dogpile Lansering Aggregator Aktiv
Inktomi Fundament Inaktiv, kjøpt opp av Yahoo!
HotBot Fundament Aktiv
Arianna Fundament Inaktiv, innlemmet i Libero
Multisoft Fundament Tomgang
Virgil Fundament Aktive, Google-resultater
Spør Jeeves Fundament Inaktiv (omdannet til ask.com)
1997 Nordlys Lansering Tomgang
Yandex Lansering Eieren Aktiv
1998 Google Lansering Eieren Aktiv
Ixquick Lansering Aggregator Også aktiv som startside
MSN-søk Lansering Inaktiv, bli Bing
empas Lansering Inaktiv (slått sammen med NATE)
1999 Alltheweb Lansering Inaktiv (URL omdirigert til Yahoo! )
GenieKnows Lansering Tomgang
Naver Lansering Aktiv
Theoma Fundament Spørre Aktiv
Vivísimo Fundament Inaktiv, IMB
superEva Lansering Inaktiv, kun trendanalyse
2000 Baidu Fundament Eieren Aktiv
Exalead Lansering Eieren Aktiv
Gigablast Lansering Eieren Aktiv
2001 Kartoo Lansering Tomgang
2003 Info.com Lansering Bing Aktiv
Scroogle Lansering Tomgang
2004 Yahoo! Søk Endelig lansering Bing Aktiv
A9.com Lansering Tomgang
Sogou Lansering Aktiv
2005 Windows Live Search Endelig lansering Tomgang
GoodSearch Lansering Tomgang
Søk meg Lansering Tomgang
2006 Så så Lansering Aktiv
Quaero Fundament Tomgang
Search.com Fundament Eieren Aktiv (bare søk CBS)
Ask.com Lansering Aktiv
Windows Live Search Lansering Tomgang
ChaCha Beta lansering Tomgang
Guruji.com Beta lansering Tomgang
2007 Wikiseek Lansering Tomgang
Sproose Lansering Tomgang
Wikia-søk Lansering Tomgang
2008 Cuil Lansering Tomgang
Powerset Lansering Tomgang
Pikollator Lansering Tomgang
Viewzi Lansering Tomgang
Boogami Lansering Tomgang
LeapFish Lansering Tomgang
Forestle Lansering Tomgang
Ecocho Lansering Tomgang
DuckDuckGo Lansering Bing + proprietære algoritmer Aktiv
2009 Wolfram Alpha Lansering Eieren Aktiv
Bing Lansering Eieren Aktiv
Yebol Lansering Tomgang
Mugurdy Lansering Tomgang
Speider (Goby) Lansering Tomgang
Coozila! Lansering Tomgang
Ecosia Lansering Bing + proprietære algoritmer Aktiv
NATE Lansering Aktiv
2010 iAlger Lansering Aktiv
Blekko Lansering Inaktiv (solgt til IBM)
Cuil Lansering Tomgang
Yandex (versjon

på engelsk)

Lansering Aktiv
2011 YaCy Lansering Inaktiv (selvdrevet programvare)
2012 Volunia Lansering Tomgang
Idé Lansering Tomgang
2013 Istella Lansering Eieren Tilgjengelig, inaktiv
Qwant Lansering Bing + proprietære algoritmer Aktiv
Aoohe Lansering Tomgang
Coc Coc Lansering Aktiv
Egerin Lansering Aktiv, kurdisk / sorani søkemotor
2014 Searx Lansering Aggregator Aktiv
Sveitser Lansering Bing Aktiv
2015 Klikk Lansering Eieren Tomgang
2017 Xaphir Beta Eieren Inaktiv, kjøpt opp av Qwant [19]

De fleste søkemotorene som opererer på nettet drives av private selskaper som bruker proprietære algoritmer og databaser som holdes hemmelige. Det er imidlertid flere forsøk på å lage søkemotorer basert på gratis programvare , noen eksempler er:

Andre søkemotorer som er aktive fra mars 2020 er: Metager (for personvern), Serch Encrypt, SearX, Gibiru, YaCy (desentralisert), Yippi, Lukol og Boardreader.

Utviklingsutsikter

De siste nyvinningene innen produksjon av algoritmer og informasjonsgjenvinningssystemer er basert på semantisk analyse av termer og den påfølgende opprettelsen av semantiske nettverk . Google har selv tatt i bruk systemer for feilforebygging og kontekstualisering av resultater [20] [21] .

Det er rimelig å forutsi at søkemotorer innen få år vil basere sine teknologier både på den kvantitative analysen av innholdet (selve ordene), og fremfor alt på den kvalitative (sansen av ordene). Søkemotorer vil for eksempel være i stand til å skille betydningen av ordet " fersken " i henhold til konteksten ordet er inneholdt i (for å forstå om det er frukten, sporten eller annet). For å bevege seg i denne retningen kjøpte Google Oingo (tidligere kjent som "konseptmotoren") og teknologien til selskapet som skapte den, Applied Semantics [22] .

Web 2.0 og fremtiden til søkemotorer

Den nye grensen for søkemotorer er web 2.0 . Ved å ta i bruk denne logikken, sikter mange internasjonale motorer og kataloger på større deltakelse fra brukere i opprettelsen av søkemotorinnhold, for å eliminere all bruk av edderkopper eller sponsede lenker. Med denne logikken kan brukere rapportere koblingene selv og bestemme om de vil gi popularitet til de rapporterte nettstedene.

Web 2.0 tar også sikte på en raskere, raskere og mer intuitiv brukervennlighet takket være bruken av Metasearch- motorer (eller flere søkemotorer) som [23] [24] :

Merknader

  1. ^ Alta Vista , s. 6 .
  2. ^ ( NO ) Hva er søkemotor? - Definisjon fra Techopedia , på Techopedia.com . Hentet 26. oktober 2021 .
  3. ^ Hva er en søkemotor ? , på computerhope.com . Hentet 26. oktober 2021 .
  4. ^ Hva er en søkemotordatabase ? , på Redis . Hentet 26. oktober 2021 .
  5. ^ Hvordan fungerer en søkemotor? Noen trender for fremtiden. , på Alkimedia , 2. februar 2017. Hentet 26. oktober 2021 .
  6. ^ Søkemotorer og databaser | DataCenter , på datacenter.org . Hentet 26. oktober 2021 .
  7. ^ Jonathan Gray, Liliana Bounegru og Lucy Chambers, The Data Journalism Handbook , "O'Reilly Media, Inc.", 2012, ISBN  978-1-4493-3006-4 . Hentet 26. oktober 2021 .
  8. ^ Robots metatag-spesifikasjon | Google Search Central , på Google Developers . Hentet 26. oktober 2021 .
  9. ^ SEO-nøkkelord: Slik finner du nøkkelord for nettstedet ditt | WordStream , på wordstream.com . Hentet 26. oktober 2021 .
  10. ^ Answer Searching & Answer Search Engines , on Search Engine Watch , 14. september 2005. Hentet 26. oktober 2021 .
  11. ^ SEO: hva det er og hva er de mest effektive optimaliseringsteknikkene | Italiaonline , på bloggen Italiaonline . Hentet 26. oktober 2021 .
  12. ^ Hva er SEO / søkemotoroptimalisering? , på søkemotorland . Hentet 26. oktober 2021 .
  13. ^ Hva er en SERP? Definisjon, betydning, eksempler - Studio Samo , su studiosamo.it . Hentet 26. oktober 2021 .
  14. ^ Hva er Google AdSense og hvordan tjene penger med det , på Semrush- bloggen . Hentet 26. oktober 2021 .
  15. ^ Welcome to the Panama Jungle : En brukerveiledning til Yahoo!s nye grensesnitt , ppchero.com . Hentet 26. oktober 2021 .
  16. ^ Topp 12 beste søkemotorer i verden , på inspire.scot . Hentet 26. oktober 2021 .
  17. ^ Topp 10 søkemotorer i verden ( 2021 - oppdatering) , på påliteligsoft.net , 15. desember 2016. Hentet 26. oktober 2021 .
  18. ^ Istella, den italienske anti-Google fokuserer på sosiale medier , på CorCom , 19. mars 2013. Hentet 26. oktober 2021 .
  19. ^ ( FR ) Qwant representerer Xilopix, skaperen av moteur Xaphir - Le Monde Informatique , i LeMondeInformatique . Hentet 15. januar 2018 .
  20. ^ faculty.ist.psu.edu ( PDF ).
  21. ^ Informasjonsinnhenting: hva det er, modeller, hvordan det gjelder SEO , på Digital-coach.it . Hentet 26. oktober 2021 .
  22. ^ Today in History: Google Buys Applied Semantics , Digiday , 23. april 2013. Hentet 26. oktober 2021 .
  23. ^ Google Books , på books.google.com . Hentet 26. oktober 2021 .
  24. ^ researchgate.net .
  25. ^ Winner tinooo.com en søkemotor - Winner tinooo.com en søkemotor som med noen få klikk kan tilpasses for å finne hva som helst på nettet.

Bibliografi

Relaterte elementer

Andre prosjekter

Eksterne lenker