Hva er de viktigste terminologiene i Hadoop Security?



Denne Edureka-bloggen hjelper deg med detaljert og omfattende kunnskap om hadoop-sikkerhet som implementeres i sanntid.

er en stor bekymring når det gjelder håndtering av konfidensielle data. å være overlegen i datahåndteringsoperasjoner står også overfor samme problem. Den har ikke sin egen dedikerte sikkerhet. La oss forstå hvordan problemet ble løst gjennom dette Hadoop Security artikkel.

Hvorfor trenger vi Hadoop Security?

hadoop-sikkerhet-hvorfor er hadoop-sikkerhet viktig





er det mest kraftfulle, robuste og svært skalerbare rammeverket for databehandling som er i stand til å knase petabytes med data enkelt. På grunn av sine uovertrufne evner, da begynte alle næringslivssektorer, helse-, militær- og finansavdelinger å bruke Hadoop.

Hadoop begynte å få popularitet. Dette er da Hadoop-utviklerne fant en monumental feilberegning. Hadoop manglet en dedikert sikkerhetsprogramvare inni det. Dette berørte mange områder der Hadoop var i bruk.



  • Flere næringssektorer

  • Nasjonal sikkerhet

  • Helse- og medisinsk avdeling



  • Sosiale medier

  • Militær

Ovennevnte områder er de største brukerne av Hadoop. Nå, Sikkerhet er det store spranget som Hadoop må ta.

Hva er Hadoop Security?

Hadoop Security er generelt definert som en prosedyre for sikre Hadoop Data Storage-enheten, ved å tilby en tilnærmet ugjennomtrengelig vegg av sikkerhet mot enhver potensiell cybertrussel. Hadoop oppnår denne høykalibre sikkerhetsmuren ved å følge nedenfor sikkerhetsprotokoll.

Godkjenning

Godkjenning er det første trinnet der brukerens legitimasjon blir bekreftet. Påloggingsinformasjonen inkluderer vanligvis brukerens dedikerte Brukernavn og en hemmelig passord. Angittlegitimasjon vil bli sjekket mot tilgjengelige detaljer i sikkerhetsdatabasen. Hvis gyldig, vil brukeren være det autentisert.

Autorisasjon

Autorisasjon er det andre trinnet der systemet får bestemme om det skal gis tillatelse til brukeren, tilgang til data eller ikke. Den er basert på den forhåndsdefinerte tilgangskontrollisten. The Confidentialinformasjonen holdes sikker og bare autorisert personell kan få tilgang til den.

Revisjon

Revisjon er den siste fasen, holder den ganske enkelt oversikt over operasjonene som utføres av den autentiserte brukeren i løpet av perioden han var logget inn i klyngen. Dette erutelukkende gjort for sikkerhet bare formål.

Typer Hadoop-sikkerhet

  • Kerberos sikkerhet

Kerberos er en av de ledende Network Authentication Protocol designet for å tilby kraftige autentiseringstjenester til begge Server og Klient-ender gjennom Secret-Key kryptografiteknikker. Det er bevist at den er veldig sikker siden den bruker krypterte servicebilletter gjennom hele økten.

  • HDFS-kryptering

HDFS-kryptering er en formidabel fremgang som Hadoop noen gang omfavnet. Her er dataene fra kilde til destinasjon (HDFS) blir helt kryptert. Denne prosedyren krever ingen endringer i den opprinnelige Hadoop-applikasjonen som gjør klient å være det eneste autoriserte personellet som adgang dataen.

  • Trafikkryptering

Trafikkryptering er ingen ringere enn HTTPS (HyperText Transfer Protocol Secure). Denne prosedyren brukes til å sikre dataoverføringen, fra nettstedet i tillegg til dataoverføring til nettstedet . Mange nettbankportaler bruker denne metoden for å sikre transaksjoner over en Sikkerhetssertifikat

HDFS-filkatalogstillatelser arbeid i en enkel POSIX format. De Lese og Skrive tillatelser gis som r og s henholdsvis. Tillatelsene til Superbruker og Klient er annerledes basert på konfidensialiteten til filen.

Kerberos

Kerberos er et av de enkleste og sikreste nettverkene godkjenningsprotokoll brukt av Hadoop for data- og nettverkssikkerhet. Det ble oppfunnet av MED. Hovedmålet med Kerberos er å eliminere behovet for å utveksle passord over et nettverk, og også å sikre nettverket mot ethvert potensial cyber snusing.

For å forstå Kerberos terminologi, må vi først lære om komponentene som er involvert i Kerberos-programvaren.

KDC eller Key Distribution Center er hjertet av Kerberos. Den består hovedsakelig av tre komponenter. Nemlig:

  • Database

De database lagrer brukerlegitimasjonen som brukernavn og dens respektive passord. Den lagrer også tilgangsrettigheter gitt til brukeren. Kerberos KDC-enhet lagrer også tilleggsinformasjon som Krypteringsnøkkel, billettgyldighet etc.

Brukerlegitimasjonen som er oppgitt blir kryssjekket. Hvis det er gyldig, Autentiseringsserver vil gi TGT eller Ticket Generation Ticket. En TGT kan bare genereres hvis brukeren går inn gyldig legitimasjon.

  • Ticket Granting Server

Den neste fasen er TGS eller Ticket Granting Server. Det er i utgangspunktet en applikasjonsserver av KDC som vil gi deg Servicebillett. Servicebilletten kreves av brukeren for å samhandle med Hadoop og få tjenesten han trenger eller for å utføre en operasjon på Hadoop.

Du kan installere Kerberos med følgende kommando:

sudo apt-get install krb5-kdc krb5-admin-server

La oss anta at du ønsker å få tilgang til en Kerberos-sikret Hadoop-klynge. Du må gå gjennom følgende trinn for å få tilgang til Hadoop-klyngen som beskrevet i trinnene nedenfor:

  • Du må skaffe deg godkjenning av Hadoop-klyngen. Du kan bli godkjent ved å utføre Kinit kommandoen på Hadoop-klyngen.

kinit root / admin
  • De Kinit Kommandokjøring vil omdirigere deg til Påloggingsinformasjon siden der du forventes å legge inn din brukernavn og passord.

  • De Kinit vil sende en Autentiseringsforespørsel til Autentiseringsserver.

  • Hvis legitimasjonen din er gyldig, så vil Authentication Server svare med a Ticket Generation Ticket (TGT).

  • De Kinit vil lagre TGT i legitimasjonen din Cache Hukommelse. Følgende kommando vil hjelpe deg med å lese legitimasjonen din

klist
  • Nå er du vellykket godkjent i KDS.

  • Før du får tilgang til Hadoop-klyngen, må du konfigurere Kerberos-klienter. for å gjøre det, bruk følgende kommando.

sudo apt-get install krb5-bruker libpam-krb5 libpam-ccreds auth-client-config
  • Nå prøver du å utføre en Hadoop Command. Det er en Hadoop-klient.

  • De Hadoop-klient vil bruke din TGT og forespørsler TGS til godkjenning.

  • De TGS vil godkjenne forespørselen, og den vil gi deg en Servicebillett.

  • Dette Servicebillett vil bli bufret av Hadoop-klient.

  • Dette Servicebillett vil bli brukt av Hadoop-klienten til kommunisere med Hadoop Namenode.

  • De Namenode vil identifisere seg med sine Billett.

  • Begge Namenode-billett og Hadoop-klient Servicebilletter vil bli kryssjekket av hverandre.

  • Begge er sikre på at de kommuniserer med en godkjent enhet.

  • Dette kalles Gjensidig godkjenning.

  • Neste trinn er Autorisasjon. Namenode vil gi deg den service som du har mottatt autorisasjon.

  • Endelig er den siste fasen Revisjon. Her din aktivitet vil være logget til sikkerhetsformål.

Med dette kommer vi til en slutt på denne artikkelen . Jeg håper jeg har kastet litt lys over din kunnskap på en Hadoop Security.

Nå som du har forstått Hadoop og dets sikkerhet, sjekk ut av Edureka, et pålitelig online læringsfirma med et nettverk med mer enn 250 000 fornøyde elever spredt over hele verden. Edureka Big Data Hadoop-sertifiseringskurs hjelper elever å bli eksperter på HDFS, Garn, Kart reduksjon , Pig, Hive, HBase, Oozie, Flume og Sqoop ved bruk av sanntidsbruk på Retail, Social Media, Aviation, Tourism, Finance domain.

Hvis du har spørsmål relatert til dette “Hadoop Security” artikkel, så skriv til oss i kommentarfeltet nedenfor, så svarer vi deg så tidlig som mulig.