Hvordan kjøre bikupeskript?



Dette er en veiledning om hvordan du kjører Hive Scripts. Å kjøre dette skriptet vil redusere tiden og krefter vi legger på å skrive og utføre hver kommando manuelt.

Apache Hive blir en Data Warehousing-pakke bygget på toppen av Hadoop, og blir stadig mer vant til dataanalyse, data mining og prediktiv modellering. Organisasjoner leter etter fagpersoner med et fast grep . I dette innlegget, la oss se på hvordan du kjører Hive Scripts. Generelt bruker vi skriptene til å utføre et sett med utsagn samtidig. Hive-skript brukes ganske mye på samme måte. Det vil redusere tiden og krefter vi legger på å skrive og utføre hver kommando manuelt.

Hive-skript støttes i Hive 0.10.0 og nyere versjoner. Siden Hive 0.90-versjonen er installert i CDH3, kan vi ikke kjøre Hive Scripts i CDH3. Du kan prøve trinnene nedenfor i CDH4 da den har Hive 0.10.0-versjonen installert. Er du klar over hvordan du lager et Hive-skript? Hvis ikke, klikk for å få mer avklaring.





Master-Hive-Now

La oss nå se hvordan man skriver manusene i Hive og kjører dem i CDH4:



Trinn 1: Skrive et Hive-skript.

For å skrive Hive-skriptet, skal filen lagres med .sql-utvidelse. Åpne en terminal i Cloudera CDH4-distribusjonen og gi følgende kommando for å lage et Hive-skript.
Kommando: sudo gedit sample.sql

hvordan du bruker trimmetode i java

Når du utfører kommandoen ovenfor, åpner den filen med listen over alle Hive-kommandoene som må utføres.



I dette skriptet vil en tabell bli opprettet, beskrevet og data vil bli lastet og hentet fra tabellen.

1. Lage tabellen i bikube:

Kommando: lag tabellprodukt (produktid: int, produktnavn: streng, pris: flyt, kategori: streng) rader format avgrenset felt avsluttet med ‘,’

Her er produktet tabellnavnet og {productid, productname, price, category} er kolonnene i denne tabellen.

Felter avsluttet med ‘,’ indikerer at kolonnene i inndatafilen er atskilt med symbolet ‘,’.

Som standard er postene i inndatafilen atskilt med en ny linje.

2. Beskriv tabellen:

Kommando: beskrive produktet

3. Laste inn dataene i tabellen.

For å laste dataene i tabellen først, må vi lage en inndatafil som inneholder postene som må settes inn i tabellen.

La oss lage en inndatafil.

Kommando: sudo gedit input.txt

Rediger innholdet i filen som vist på figuren.

4. Henter dataene:

For å hente dataene, brukes velgekommandoen.

Kommando: Velg * fra produktet

Ovennevnte kommando brukes til å hente verdien til alle kolonnene i tabellen. Skriptet skal være som det er vist i bildet nedenfor.

Nå er vi ferdige med å skrive Hive-skriptet. Filen sample.sql kan nå lagres.

ring med referanse c ++

Trinn 2: Kjøre Hive-skriptet

Følgende er kommandoen for å kjøre Hive-skriptet:

Kommando: bikube –f /home/cloudera/sample.sql

Mens du kjører skriptet, må du sørge for at hele banen til skriptfilen er til stede.

Vi kan se at alle kommandoene er utført vellykket.

Slik kjøres og kjøres Hive-skript i CDH4.

Hive er en kritisk komponent i Hadoop, og din ekspertise innen Hive kan gi deg topp betalte Hadoop-jobber! Edureka har et spesielt kuratert Hadoop-kurs som hjelper deg med å mestre konsepter som MapReduce, Garn, Pig, Hive, HBase, Oozie, Flume og Sqoop. Klikk på knappen nedenfor for å komme i gang.

Har du et spørsmål til oss? Vennligst nevn dem i kommentarfeltet, så kommer vi tilbake til deg.

Relaterte innlegg:

Hive-kommandoer

Hive-datamodeller

hva gjør tostring i java