Hive er et datalagersystem for Hadoop som gjør det enkelt å oppsummere data, ad hoc-spørsmål og analysere store datasett lagret i Hadoop-kompatible filsystemer. Hive strukturer data i godt forståte databasekonsepter som tabeller, rader, kolonner og partisjoner. Den støtter primitive typer som heltall, flyter, dobler og strenger. Hive støtter også Associative Arrays, Lists, Structs, og Serialize og Deserialized API brukes til å flytte data inn og ut av tabeller.
La oss se på Hive-datamodeller i detalj
Hive-datamodeller:
Hive-datamodellene inneholder følgende komponenter:
tilfeldig klasse i java eksempel
- Databaser
- Tabeller
- Skillevegger
- Skuffer eller klynger
Skillevegger:
Partisjon betyr å dele en tabell i en grovkornet del basert på verdien av en partisjonskolonne, for eksempel ‘data’. Dette gjør det raskere å utføre spørsmål på data deler
hva er span tag i html
Så, hva er funksjonen til Partisjon? Partisjonstastene bestemmer hvordan data lagres. Her definerer hver unike verdi av partisjonsnøkkelen en partisjon av tabellen. Partisjonene er oppkalt etter datoer for bekvemmelighet. Det ligner på 'Block Splitting' i HDFS.
Skuffer:
Skuffer gir ekstra struktur til dataene som kan brukes til effektive spørsmål. En sammenføyning av to tabeller som er lagt i de samme kolonnene, inkludert sammenføyningskolonnen, kan implementeres som en Map-Side-sammenføyning. Bucketing etter brukt ID betyr at vi raskt kan evaluere et brukerbasert spørsmål ved å kjøre det på et randomisert utvalg av det totale settet med brukere.
hvordan lage dynamisk matrise i java
Har du et spørsmål til oss? Vennligst nevn dem i kommentarfeltet, så kommer vi tilbake til deg.
Relaterte innlegg: