En virtuell assistent er en programvare som tolker naturlig språk (Natural Language Processing) og, hvis den er riktig opplært, kan dialog med menneskelige samtalepartnere for å gi informasjon eller utføre visse operasjoner. Begrepet Chat-bot brukes også for å referere til virtuelle assistenter generelt eller spesifikt tilgjengelig via en chat . I andre tilfeller brukes meldingsprogrammene utelukkende til underholdende formål. Noen virtuelle assistenter kan tolke menneskelig språk og svare gjennom syntetiserte stemmer. Brukere _de kan stille spørsmål til assistentene sine, kontrollere hjemmeautomatiseringsenheter , spille av multimedieinnhold via stemmen, administrere daglige aktiviteter som e-post, lister og kalendere med talekommandoer. [1] Et lignende konsept brukes på dialogsystemer, med noen forskjeller fra sistnevnte. [2]
Siden 2017 har funksjonene og bruken av virtuelle assistenter ekspandert raskt, nye produkter kommer på markedet og en sterk vekt på e-post og talebrukergrensesnitt. Google og Apple har implementert sine respektive stemmeassistenter på sine smarttelefoner for sine kunder. Microsoft har implementert sin Windows -baserte stemmeassistent for personlige datamaskiner , telefoner og smarthøyttalere . Amazon implementerte i stedet sin assistent i smarthøyttalere. [3] Conversica har nådd over 100 millioner forpliktelser gjennom sin virtuelle assistent for bedrifter . [4]
Den virtuelle assistenten kan brukes på ulike områder, for eksempel på internettsider for å lette brukernavigasjon eller som personlig assistent på mobile enheter .
Begrepet Virtual Assistant eller VA (fra engelsk Virtual Assistant ) refererer også til en person som utfører oppgavene til en sekretær eller assistent eksternt, hjemmefra eller et kontor, men som ikke er fysisk tilstede på den personens kontor den yter slike tjenester til .
Det er en innovativ arbeidsform, født i USA på nittitallet og som vokser frem spesielt i de sammenhenger hvor det er nødvendig å redusere kostnader og derfor ikke har en sekretær innrammet som fast ansatt, men samtidig kunne å dra nytte av sekretærtjenester på forespørsel, kun betale for tjenestene som faktisk leveres.
Den virtuelle assistenten gir profesjonelle støttetjenester (i administrasjon, regnskap, databehandling, forskning, utarbeidelse av presentasjoner, telefonsvarer, organisering av forretningsreiser osv.) eller spesialiserte profesjonelle tjenester (i web 2.0-promotering, kundeassistanse, utvikling av nettsider, grafisk design, forskning og valg av personell etc.) til bedrifter, bedrifter og fagfolk via internett, telefon eller faks.
Radio Rex , utgitt i 1911, var det første leketøyet som brukte en talekommando. Det var en hund som kom ut av kennelen sin da navnet ble nevnt. [5]
I 1952 introduserte Bell Labs Audrey , en maskin for automatisk siffergjenkjenning. Den okkuperte 6 stativer , strømforbruket var betydelig, selv om det hadde en god flyt av kabler, hadde det mange problemer på vedlikeholdssiden på grunn av komplekse ventilkretser. Han var i stand til å gjenkjenne taler og fonemer . Han var begrenset av den nøyaktige og presise gjenkjennelsen av tallene som ble talt av talerne . Den kunne også brukes i taleoppringing, men i de fleste tilfeller ble den brukt i pulsoppringing, sistnevnte er billigere og raskere. [6]
I 1962 ble et annet verktøy som muliggjorde talegjenkjenning IBM Shoebox , en datamaskin som ble aktivert vokalt, presentert på Expo 1962 av IBM , etter sitt første forsøk på å bryte seg inn på markedet et år tidligere. Denne datamaskinen var i stand til å gjenkjenne 16 ord mens sifrene 0 til 9, den ble utviklet nesten 20 år før introduksjonen av IBM Personal Computer i 1981. [7] [8]
Det første programmet for naturlig språkbehandling eller chat-bots er ELIZA , utviklet av professor Joseph Weizenbaum på 1960-tallet . Den ble laget for å demonstrere at kommunikasjonen mellom menneske og maskin var overfladisk. [9] ELIZA brukte mønstertilpasning og en surrogatmetodikk, simulerte en samtale og ga en illusjon om at programmet forsto. [10]
Weizenbaums sekretær ba Joseph om å forlate rommet slik at hun og ELIZA kunne ha en ekte samtale. Weizenbaum ble så overrasket over dette at han senere skrev " Jeg skjønte ikke ... at ekstremt korte eksponeringer for en relativt enkel maskin kunne indusere kraftig vrangforestillinger hos vanlige mennesker ." [11]
Denne hendelsen tok navnet ELIZA-effekten , tendensen til ubevisst å anta datamaskinatferd analogt med menneskelig atferd; det vil si antropomorfisering, et fenomen som finnes i moderne virtuelle assistenter. [12] [13]
Den neste betydelige milepælen i utviklingen av talegjenkjenning ble oppnådd på 1970-tallet ved Carnegie Mellon University i Pittsburgh i Pennsylvania , med støtte fra USAs forsvarsdepartement og dets DARPA - byrå med ansvar for å utvikle nye militærteknologier. Forskningen på språklig forståelse varte i fem år, med mål om å oppnå et minimumsvokabular på 1000 ord. Noen amerikanske selskaper og akademier, inkludert IBM og Stanford University, deltok i prosjektet.
På nittitallet ble talegjenkjenningsteknologi en integrert del av den personlige datamaskinen, takket være selskapene IBM og Philips . Markedslanseringen av historiens første smarttelefon, Simon , la grunnlaget for de fremtidige virtuelle assistentene vi kjenner i dag. [14] [15] [16]
I 2001 ga Colloquis ut en chat-bot kalt SmarterChild , på plattformer som AOL Instant Messenger og MSN Messenger . Selv om SmarterChild var fullstendig tekstbasert, var den i stand til å kjøre spill, sjekke været, slå opp fakta og snakke med andre brukere. [17]
Den første moderne virtuelle assistenten installert på en smarttelefon var Siri , integrert i iPhone 4S som ble avduket 4. oktober 2011. [18] Apple utviklet Siri etter 2010-oppkjøpet av Siri Inc. , en spin-off av SRI International, et forskningsinstitutt og utvikling finansiert av DARPA og USAs forsvarsdepartement. [19] I utgangspunktet var assistentens oppgaver enkle handlinger som å sende en melding, ringe, sjekke været eller sette en alarm. Over tid ble aktivitetene og funksjonene assistenten kunne utføre forbedret og utvidet for å gi restaurantanbefalinger, søke på internett eller gi veibeskrivelse. [20]
I november 2014 annonserte Amazon sin Echo -smarthøyttaler, med sin Alexa virtuelle assistent integrert . [21] [22] I april 2017 ga Amazon ut Lex , en tjeneste for å bygge samtalegrensesnitt for alle typer applikasjoner. [23] [24]
De fleste virtuelle assistenter er i stand til:
Noen virtuelle assistenter er tilgjengelige på forskjellige måter: på Google Allo gjennom en spesiell chat, mens på Google Home med din egen stemme. For å aktivere en virtuell assistent, må et spesifikt ord eller et sett med ord snakkes med stemmen, for eksempel: " Hei Siri ", " OK Google ", " Alexa " og " Hei Microsoft ". [28] Assistenter behandler naturlig språk for å matche brukerens stemme eller tekst til kjørbare kommandoer. Maskinlæring gjennomføres kontinuerlig for å holde assistenten oppdatert. [29]
Virtuelle assistenter kan integreres i forskjellige typer plattformer:
Virtuelle assistenter kan tilby en rekke tjenester, inkludert: [37]
Samtalehandel er en variant av elektronisk handel , ved hjelp av ulike meldingsmetoder. Blant de ulike metodene en nettchat på bedriftens nettsteder, eller en chat fokusert på direktemeldingsapplikasjoner som Wechat, Facebook Messenger eller Whatsapp . [41]
Amazon tilbyr en tjeneste kalt Alexa Skills , en serie spesifikke funksjoner som den virtuelle assistenten kan gjøre med brukeren sin. [42] [43] Samme type tjeneste tilbys også av Google Actions . [44] [45]
Virtuelle assistenter har mange personvernproblemer . Noen funksjoner som stemmeaktivering, som krever at enheten alltid lytter, noe som kompromitterer personvernet ditt. [46] Flere metoder har blitt foreslått for å bevare personvernet til andre, for eksempel sikkerhetsknappen for å lage flerlags autentisering for å få tilgang til virtuelle assistenter. [47]
Google Assistant lagrer ikke dataene dine uten ditt samtykke. For å lagre lyden må du aktivere en bestemt funksjon. De lagrede lydfilene sendes til skyen og brukes av Google til å forbedre Google Assistant, men bare ved å aktivere funksjonen. [48]
Alexa er bare i stand til å høre lyd når den er vokalt aktivert, ved å bruke det spesifikke ordet ( Alexa ). Opptaket av samtalen etter at den er aktivert. Opptaket avsluttes etter 8 sekunders stillhet. Alexa vil sende den innspilte samtalen til skyen din , du kan slette opptaket fra skyen fra Alexa-innstillingene (i personvern). Det er mulig å forhindre at Alexa lytter til brukernes samtaler ved å bruke «mute»-funksjonen, etter at enheten er lydløs vil den ikke lenger kunne ta opp samtaler, selv etter nøkkelordet. [49]
For å forbedre Siri bruker ikke Apple lydopptak, men heller transkripsjoner. Kun data som anses som viktige for analyse sendes, hvis Siri blir bedt om å lese en melding, vil den ikke bli lagret i skyen. Brukere kan aktivere og deaktivere sending av transkripsjoner når som helst. [50]
Virtuelle assistenter er en ny merverdi for menneske-maskin-grensesnittet . [51]
I følge en fersk studie er de to grunnene som presser forbrukere til å bruke virtuelle assistenter nytten og den opplevde gleden av dem.
Denne forskningen viser hvilke faktorer som påvirker forbrukernes integrering av virtuelle assistenter mest. [54]
Virtuelle assistenter motsier filterboblen : Når det gjelder sosiale medier , er assistentens algoritmer basert på valg av relevante data, og forkaster unødvendige data, avhengig av aktiviteten utført av forbrukeren. Relevant data er det som interesserer eller tilfredsstiller forbrukeren. Som et resultat blir den virtuelle assistenten isolert fra resten av de andre dataene, i sin egen intellektuelle boble som imidlertid forsterker hans egne meninger. Denne typen fenomener kalles falske nyheter og ekkokamre . [55]
Virtuelle assistenter blir noen ganger kritisert for å være overvurdert. I følge Antonio Casilli, en fransk professor i sosiologi , mener han at den kunstige intelligensen til virtuelle assistenter verken er intelligent eller kunstig av to grunner:
Assistentenes kunstige intelligens trenes opp gjennom kunstige nevrale nettverk , som krever en enorm mengde merkede data . I teorien må data merkes gjennom en menneskelig prosess, ofte kalt mikroarbeid.
De mest populære utviklingsplattformene for virtuelle assistenter er:
I tidligere generasjoner var virtuelle assistenter basert på en tekstchat, assistenten ble representert av en avatar (en interaktiv online karakter ).
De digitale opplevelsene som er muliggjort av virtuelle assistenter regnes som blant de største nyere teknologiske fremskritt og er også blant de 5 mest lovende forbrukertrendene de siste årene. Bransjeeksperter hevder at digitale opplevelser vil nå en status som kan sammenlignes med virkelige opplevelser, og muligens til og med bli mer ettertraktet og verdsatt av forbrukere. [61] Fra midten av 2017 er antallet hyppige brukere av virtuelle assistenter anslått til å være rundt 1 milliard på verdensbasis. [62] Det kan bemerkes at virtuelle assistenter ikke lenger er begrenset til smarttelefonapplikasjoner , men er også utbredt i andre sektorer som bilindustrien , telekommunikasjon , detaljhandel , helsevesen og utdanning . [63] Stilt overfor de betydelige forsknings- og utviklingsutgiftene til selskaper i alle sektorer og med den økende spredningen av mobile enheter, forventes det teknologiske markedet for enheter med integrert stemmegjenkjenning å se en eksponentiell vekst i bruken av denne enheten med 34,9 % over hele verden, i en periode mellom 2016 og 2024, forutsatt en samlet verdi av det globale markedet som tilsvarer 7,5 milliarder dollar innen 2024. [63] I følge forskning utført av Ovum , vil virtuelle assistenter installert i de ulike enhetene overstige verdensbefolkningen innen 2021, og nå en samlet andel på 7,5 milliarder virtuelle assistenter. [64] [65] [66] Ovum rapporterer også at siden den nåværende tiden da Google Assistant dominerer stemmegjenkjenningsmarkedet, med 23,3 % markedsandel [64]
Virtuelle assistenter, i tillegg til å være en dings for forbrukere, kan tilby en betydelig tjeneste for bedrifter. For eksempel er en virtuell assistent lett tilgjengelig med omfattende encyklopedisk kunnskap for å svare brukeren. Blant funksjonene kan den organisere møter, sjekke inventar eller verifisere forretningsdokumenter. Virtuelle assistenter, takket være deres raske spredning i små og mellomstore bedrifter, representerer et lite skritt mot en global tilpasning, også takket være bruken av tingenes internett , en teknologi som av mellomstore og små bedrifter oppfattes som et skritt mot fremtiden men for øyeblikket er det for komplisert, risikabelt og dyrt å trene regelmessig. [67]
I mai 2018 publiserte forskere fra University of California, Berkeley , en artikkel der de viste lydkommandoer som ikke kunne oppdages av det menneskelige øret skjult i et musikkstykke eller i en vokaltekst, for å løse denne typen problemer de manipulerte en virtuell assistent slik at den kunne utføre noen handlinger uten at brukeren noterte det. [68] Forskerne gjorde små endringer i lydfilene, og slettet lydmønstrene som talegjenkjenningssystemet oppdaget. Denne endringen ble implementert i 2016, i de virtuelle assistentene til Apple, Amazon og Google. [69]
I tillegg til stemmeopptak er en annen sikkerhetsfeil i virtuelle assistenter ondsinnede talekommandoer. For eksempel kan brukeren be om å låse opp en elektronisk dørlås, krenke andres hjem uten å ha spesifikk kunnskap fra brukerens side. I noen virtuelle assistenter er det imidlertid en blokkering for å forhindre ulovlige handlinger, men det er fortsatt vanskelig for systemet å nøyaktig identifisere de forskjellige menneskestemmene. [70]