Hive-datamodeller



Hive-datamodellene inneholder følgende komponenter som databaser, tabeller, skillevegger og bøtter eller klynger.

Hive er et datalagersystem for Hadoop som gjør det enkelt å oppsummere data, ad hoc-spørsmål og analysere store datasett lagret i Hadoop-kompatible filsystemer. Hive strukturer data i godt forståte databasekonsepter som tabeller, rader, kolonner og partisjoner. Den støtter primitive typer som heltall, flyter, dobler og strenger. Hive støtter også Associative Arrays, Lists, Structs, og Serialize og Deserialized API brukes til å flytte data inn og ut av tabeller.





La oss se på Hive-datamodeller i detalj

Hive-datamodeller:

Hive-datamodellene inneholder følgende komponenter:



tilfeldig klasse i java eksempel
  • Databaser
  • Tabeller
  • Skillevegger
  • Skuffer eller klynger

Skillevegger:

Partisjon betyr å dele en tabell i en grovkornet del basert på verdien av en partisjonskolonne, for eksempel ‘data’. Dette gjør det raskere å utføre spørsmål på data deler

hva er span tag i html

Hive-datamodeller

Så, hva er funksjonen til Partisjon? Partisjonstastene bestemmer hvordan data lagres. Her definerer hver unike verdi av partisjonsnøkkelen en partisjon av tabellen. Partisjonene er oppkalt etter datoer for bekvemmelighet. Det ligner på 'Block Splitting' i HDFS.



Skuffer:

Skuffer gir ekstra struktur til dataene som kan brukes til effektive spørsmål. En sammenføyning av to tabeller som er lagt i de samme kolonnene, inkludert sammenføyningskolonnen, kan implementeres som en Map-Side-sammenføyning. Bucketing etter brukt ID betyr at vi raskt kan evaluere et brukerbasert spørsmål ved å kjøre det på et randomisert utvalg av det totale settet med brukere.

hvordan lage dynamisk matrise i java

Har du et spørsmål til oss? Vennligst nevn dem i kommentarfeltet, så kommer vi tilbake til deg.

Relaterte innlegg:

Nyttige bikupekommandoer