Klyngedatamaskin

I informatikk er en datamaskinklynge , eller mer enkelt en klynge (fra engelsk cluster ), et sett med datamaskiner koblet til hverandre via et telematisk nettverk . Formålet med en klynge er å distribuere svært kompleks prosessering mellom de forskjellige datamaskinene, øke datakraften til systemet og/eller sikre større tilgjengelighet av tjenester , på bekostning av en høyere kostnad og kompleksitet ved å administrere infrastrukturen: å ha løst problem som krever mye prosessering, er det faktisk brutt ned i separate delproblemer som hver løses parallelt.

Historie

Historien til cluster computing er best oppsummert i et notat i Greg Pfisters In Search of Clusters :

"Nesten hver eneste DEC -setning som nevner klynger sier: DEC, hvem oppfant klynger ... . IBM oppfant dem heller ikke. Brukere oppfant klynger, siden de ikke kunne gjøre alt arbeidet på én datamaskin, eller de trengte en sikkerhetskopi. Datoen for oppfinnelsen er ukjent, men jeg tror det er på 1960-tallet, eller til og med slutten av 1950-tallet."

Grunnlaget for cluster computing-teknologi som å utføre parallelt arbeid ble uten tvil introdusert av Gene Amdahl fra IBM , som i 1967 publiserte en artikkel med det som ville bli ansett som grunnlaget for parallell databehandling: Amdahl's Law , som matematisk beskriver ytelsesøkningen som kan oppnås. ved å utføre en operasjon i en parallell arkitektur.

Artikkelen skrevet av Amdhal definerer det tekniske grunnlaget for både multiprosessordatabehandling og klyngedatabehandling. den vesentlige forskjellen mellom de to ligger i det faktum at interprosessorkommunikasjon støttes inne i datamaskinen (for eksempel med en tilpasset intern kommunikasjonsbuss eller nettverk), i stedet foregår klyngeberegningen utenfor datamaskinen, på et kommersielt nettverk.

Følgelig er historien til de første datamaskinklyngene mer eller mindre direkte inkludert i historien til de første nettverkene, gitt at en av de første årsakene til utviklingen av et nettverk var muligheten for å koble sammen dataressurser, og effektivt skape en klynge av datamaskiner .

Pakkesvitsjede nettverk ble konseptuelt oppfunnet av RAND -selskapet i 1962 . Ved å bruke konseptet med et pakkesvitsjet nettverk, lyktes ARPANET -prosjektet i å skape i 1969 det som kanskje var den første dataklyngen basert på et kommersielt nettverk ved å koble sammen fire forskjellige datasentre (som hver var nesten en "klynge", men sannsynligvis ikke en kommersiell klynge).

ARPANET-prosjektet utviklet seg dermed som Internett , som kan betraktes som mor til alle klyngedatamaskiner; Internett representerer dagens paradigme for klyngen av alle datamaskiner i verden.

Beskrivelse

Klynger har følgende egenskaper: de ulike datamaskinene resulterer som en enkelt beregningsressurs og de ulike komponentene er ressurser dedikert til funksjonen til helheten; Klyngeserveren er derfor en server med svært høy ytelse siden den, i stedet for å veie på en enkelt frittstående maskin , deler arbeidsbelastningen (derfor, for eksempel funksjonene til e- postserver , webserver , databaseserver og filserver ) på tvers av flere maskiner som blir i faktisk en form for distribuert system .

Foreløpig består klynging i å koble sammen, bedre via optisk fiber , X fysiske servere, nesten alltid av bladtypen , som deler Y -lagringsenheter , muligens utstyrt med SSD - disker , alt gjennom ytelsesbrytere , og for å gi brukerne de nødvendige tjenestene. i form av Z virtuelle forekomster , inkludert eksterne ressurser. Dette er den typiske situasjonen for skylogikken så vel som for geografisk distribuerte nettverk (tenk på kontorene som ligger på territoriet til et selskap eller en institusjon som åpenbart må ha et enkelt selskapsnettverk) . Logisk sett er de to situasjonene ikke usammenhengende: det er nå normalt for et bedriftsnettverk med flere nettsteder å bruke klyngen også inkludert ressurser i skyen. Spesiell og kompleks virtualiserings- og nettverksprogramvare lar administratoren styre konsolideringen optimalt og automatisk betjene balanseringen, og er faktisk uunnværlig i de hyppige tilfellene av forskjellige merker og modeller av nettverksmaskinvaren som skal integreres, så vel som for de forskjellige serveroperativsystemene (domenekontroller, nettverkstjenester, applikasjonsprogrammer).

Mainframes , både for produksjon og for overvåking, er de typiske typene maskiner som danner en klynge.

I klyngearkitekturen er en node en prosesseringsmaskin eller en fysisk eller virtuell server som tar del i klyngen. For brukeren eller klientene er klyngen absolutt gjennomsiktig: all den betydelige maskinvare- og programvarekompleksiteten er maskert; tjenestene tilbys, dataene gjøres tilgjengelige og applikasjonene behandles som om de alle kom fra en enkelt mega sentral datamaskin.

Typer

Det er tre typer klynger (de to første er de vanligste):

Krav

For å få et datasystem til å fungere som en klynge trenger du:

  1. nettverksmaskinvare med høy ytelse
  2. et distribuert operativsystem som er i stand til å kjøre datamaskiner som klynger (f.eks. GNU/Linux , ved bruk av OpenMosix )
  3. en parallelliserbar algoritme .

Fordeler

Fordelene ved å bruke dette systemet er:

Ulemper

De viktigste ulempene er:

Implementeringer

MPI er et allment tilgjengelig bibliotek med datakommunikasjonsprogrammer som gjør det mulig å skrive parallelle programmer i C , Fortran , Python , OCaml og mange andre programmeringsspråk.

Linux-verdenen støtter ulike typer klyngeprogramvare , for eksempel:

Linux er for tiden det mest brukte systemet for klynging: ifølge TOP500 i 2006 var det det mest brukte systemet noensinne.

Microsoft Windows Compute Cluster Server 2003 - plattformen basert på Windows Server 2003 Standard x64 Edition gir elementer for databehandling med høy ytelse, for eksempel " Jobbplanlegger ", MSMPI-biblioteker og andre administrative verktøy.

Lincoln, nylig installert i NCSA , er en klynge med 450 Dell PowerEdge 1855-bladservere som kjører Windows Compute Cluster Server 2003 . Denne klyngen debuterte på 130. plass i TOP500 i juni 2006 , selv om den for tiden er den eneste representanten for denne teknologien.

DragonFly BSD , en gaffel av FreeBSD 4.8 har blitt redesignet i sin kjerne for å muliggjøre naturlige klyngefunksjoner. Det gir også mulighet for enkeltsystems bildefunksjoner .

Programvareklynger (gratis / åpen kildekode-programvare)

Kommersielle produkter som lar deg implementere " clustering "


High Performance Cluster Computing Application

TOP500 -organisasjonen lister opp de 500 raskeste datamaskinene i verden hvert halvår, og vanligvis er mange klynger inkludert i denne listen.

TOP500 er et samarbeid mellom University of Mannheim , University of Tennessee og National Energy Research Science Processing Center ved Lawrence Berkeley National Laboratory .
Fra november 2006 var den raskeste superdatamaskinen det amerikanske energidepartementets IBM Blue Gene/L -system med en ytelse på 280,6 TeraFLOPS .

Bruk av klynger kan gi betydelige ytelsesgevinster samtidig som kostnadene holdes nede.
System X , Virginia Techs superdatamaskin , var den 28. kraftigste superdatamaskinen på jorden i juni 2006 [1] . Det er en 12,25 TeraFLOPS- klynge som består av 1100 Apple XServe G5 doble 2,3 gigahertz -prosessorer ( 4 GB RAM , 80 GB HD SATA ) med macOS - operativsystem og sammenkoblet via InfiniBand . Klyngen besto opprinnelig av Power Mac G5 som deretter ble solgt. XServes er stablebare og mindre omfangsrike enn stasjonære Mac-er, noe som gir en mer kompakt klynge. Den totale kostnaden for den nevnte Power Mac-klyngen var 5,2 millioner dollar, en tidel av kostnadene for de tregere enkeltdatamaskinen ( stormaskin ) superdatamaskiner.

Kjernekonseptet til Beowulf - klyngen er bruken av kommersielle datamaskiner for å produsere et rimelig alternativ til en tradisjonell superdatamaskin. Et prosjekt som tok dette konseptet til det ekstreme var Stone Soupercomputer .

SETI @ home- prosjektet ser ut til å være den største distribuerte klyngen som finnes. Den bruker rundt tre millioner personlige datamaskiner rundt om i verden for å analysere data fra Arecibo-radioteleskopet for å finne bevis på eksistensen av utenomjordisk intelligens.

Bibliografi

Relaterte elementer

Andre prosjekter

Eksterne lenker