Kolonnefamilien
En kolonnefamilie er lik en tabell i RDBMS eller Relational Database Management System og er en logisk inndeling som knytter lignende data. I utgangspunktet har du en tendens til å lagre noen slags data som er av lignende emner.
er hadoop vanskelig å lære
For eksempel lagres en ordredata i en enkelt kolonnefamilie, slik at du kan ha en ordre-ID som en radnøkkel, så vel som forskjellige kolonner, for eksempel typen produkt ble brakt som en del av den ordren som skal lagres i den bestemte ordrefamilien . For å gi visse eksempler består en brukerkolonnefamilie av en bruker-ID som nøkkel. Derfor står man fritt til å velge ID og kolonnene kan være ‘name = Kunal’. Og kolonneverdiene er Kunal og Bangalore. Det er en andre kolonnefamilie kalt Cricketer-kolonnefamilien som muliggjør lagring av cricketerstatistikk i en kolonnefamilie. For eksempel kan du ha Sachin Tendulkar i en kolonne og antall århundrer i en annen. Derfor kan det være et hvilket som helst antall kolonner.
Typer kolonner
Kolonnefamilien er ingenting annet enn en tabell som er analog med en tabell i en RDBMS-verden. Det er visse typer til det, nemlig
Statisk kolonne Familie - Statisk kolonnefamilie er der navnene og datatypene er definert. Så når kolonnefamilien er opprettet, er muligheten til å navngi kolonnenavnet og datatypene tilgjengelig. Det kalles statisk fordi kolonnene forblir statiske og antall tilgjengelige kolonner vil være kjent.
Dynamisk kolonnefamilie - En dynamisk kolonnefamilie definerer derimot ikke kolonnenavnene foran, og Cassandras evne til å bruke vilkårlige applikasjons- og kolonnenavn for å lagre data er tilgjengelig. Så dynamisk hjelper på en måte fordi dynamiske kolonnefamilier ofte hjelper til med å ta vare på nye felt som kan ha blitt lagt til senere, i ustrukturerte data.
Hvis du har en statisk kolonnefamilie og du vil legge til en dynamisk kolonnefamilie i koden din mens du laster inn dataene, kan den når som helst legges til en statisk kolonnefamilie. Cassandra gir frihet til å velge kolonnenavn.
Forskjell med RDBMS
Cassandra-kolonnefamilien er skjemafri og er mye skalerbar. Cassandra-kolonnefamilien har to attributter - Navn og komparator. Så når du har en Cassandra-kolonnefamilie, blir det obligatorisk å gi det et navn, og Comparator er i utgangspunktet en datatype for kolonnenavn. Hvis du ikke spesifiserer komparatoren, vil den anta at den er en standardkomparator.
Cassandra har også en kolonne med superkolonnefamilier. Den vil bruke en superkolonne internt. Det er en logisk gruppering og et annet nivå av gruppering av kolonner. Så i en brukerkolonnefamilie kan du ha to superkolonner der vi kan ha brukernes personlige informasjon og produktinformasjon.
Kolonner
En kolonne er den minste økningen av data i Cassandra. Den har 3 komponenter:
- Navn
- Verdi
- Tidsstempel - Brukt i konfliktløsning og tidsstempelet kan ikke redigeres. Det er en intern mekanisme for å se når disse dataene eller kolonnen ble oppdatert.
- Utløper kolonner - En utløpsdato kan gis til en kolonne for å vite at kolonnen vil utløpe.
- Motkolonner - Motkolonner er ikke annet enn å vedlikeholde kolonnene, slik at du kan øke og redusere disse motkolonnene.
Superkolonner
Superkolonner er gruppering av alle kolonnene helt avhengig av forretningsbehov og logisk gruppering. Det legger til et annet nivå av hekking til den vanlige kolonnefamiliestrukturen. De består av en superkolonnefamiliestruktur.
Det primære tilfellet for superkolonner er å denormalisere flere rader fra andre kolonnefamilier til en enkelt rad, slik at du kan hente materialiserte visningsdata.
Fibonacci algoritme c ++
Bruk tilfeller
Begrensninger for superkolonner
En begrensning er at alle underkolonner i en superkolonnefamilie må avserialiseres for å lese en enkelt underkolonnefamilie. En annen begrensning er at vi ikke kan lage sekundære indekser på underkolonnene til en superkolonne.
Kolonnedatatyper
På bildet over er det forskjellige datatyper. Datatypen for en kolonneverdi kalles en validator. Og komparator er datatypen for en kolonne. Navnet og adressen blir et kolonnenavn. Så du kan ha en dato i tilfelle kolonnenavn. Du kan også ha tidsseriedata ved å ha datoen som kolonnenavn.
Rader
Det kan være brede rader og flere rader. Det kan være millioner av kolonner og rader tilgjengelig.
Tynne rader har lite antall kolonner som har muligheten til å ha bare begrensede rader.
Komposittnøkkel
Den består av ett eller flere primære nøkkelfelt. Anta at navnet på en by er angitt som en radnøkkel, det er kanskje en by med navn i to forskjellige stater, så du må nevne hvilken by og hvilken stat. Dette betyr ganske enkelt at nøkkelen må oppgis. I stedet for å ha en enkel kolonnenøkkel av en type, kan du samle flere verdier som også kalles komponenter av flere typer for å danne en unik kolonnøkkel.
Har du et spørsmål til oss? Nevn dem i kommentarfeltet, så kommer vi tilbake til deg.
Relaterte innlegg:
Introduksjon til snitches i Cassandra
hva gjør iterator i java