Hvorfor bør du blande deg når du allerede kan delta på tabletten?



Datablanding i tablett - en metode som brukes når det er relaterte data i flere datakilder, som du vil analysere sammen i en enkelt visning.

I en verden som genererer og bruker 2,5 kvm byte data om dagen, er organisasjoner nødt til å lete etter nye metoder for å transformere og kombinere data for å oppnå optimal effektivitet. En slik metode for å kombinere data er Datablanding i tablett .

Nå, fordi dette tjener et så viktig formål i datasyklusen til en gitt organisasjon, gir det en veldig viktig modul i de fleste . I denne bloggen skal vi diskutere følgende begreper:





informatica tutorial for nybegynnere pdf gratis nedlasting

Hvorfor trenger du datablanding i Tableau?

Anta at du er en Utviklerbord som har transaksjonsdata lagret i Salesforce og kvotedata lagret i Access. Dataene du vil kombinere, lagres i forskjellige databaser, og granulariteten til dataene som er fanget i hver tabell er forskjellig i de to datakildene, så datablanding er den beste måten å kombinere disse dataene på.

Datablanding er nyttig under følgende forhold:



  1. Du vil kombinere data fra forskjellige databaser som ikke støttes av kryss i databaser.

    Tverrdatabase-sammenkoblinger støtter ikke tilkoblinger til kuber (for eksempel Oracle Essbase) eller til noen ekstrakoblinger (for eksempel Google Analytics). I dette tilfellet konfigurerer du individuelle datakilder for dataene du vil analysere, og bruker deretter datablanding for å kombinere datakildene på ett ark.

  2. Data er på forskjellige nivåer av detaljer.

    Noen ganger fanger et datasett data ved hjelp av forskjellige nivåer av detaljer dvs. større eller mindre granularitet enn det andre datasettet.

    Anta for eksempel at du analyserer transaksjonsdata og kvotedata. Transaksjonsdata kan registrere alle transaksjoner. Imidlertid kan kvotedata samle transaksjoner på kvartalsnivå. Fordi transaksjonsverdiene blir registrert på forskjellige detaljnivåer i hvert datasett, bør du bruke datablanding for å kombinere dataene.



Hva er datablanding i Tableau?

Data Blending er en veldig kraftig funksjon i Borde . Den brukes når det er relaterte data i flere datakilder, som du vil analysere sammen i en enkelt visning. Det er en metode for å kombinere data som supplerer en datatabell fra en datakilde med kolonner med data fra en annen datakilde.

Vanligvis bruker du joins for å utføre denne typen datakombinering, men det er tider, avhengig av faktorer som datatypen og granulariteten, når det er bedre å bruke datablanding.

Hvordan er det forskjellig fra datasammenslåing?

Datablanding simulerer en tradisjonell venstre sammenføyning. Hovedforskjellen mellom de to er når sammenføyningen utføres med hensyn til aggregering.

Venstre blir med

Når du bruker venstre sammenkobling for å kombinere data, sendes et spørsmål til databasen der sammenkoblingen utføres. Ved å bruke en venstre sammenføyning returneres alle rader fra venstre tabell og eventuelle rader fra høyre tabell som har en tilsvarende radmatch i venstre tabell. Resultatene av sammenføyningen sendes deretter tilbake til og aggregeres av Tableau.

Anta for eksempel at du har følgende tabeller. Hvis de vanlige kolonnene er bruker-ID , tar en venstre sammenføyning alle dataene fra venstre tabell, så vel som alle dataene fra høyre tabell, fordi hver rad har en tilsvarende radmatch i venstre tabell.

Data Joining - Data Blending in Tableau - EdurekaDatablanding

Når du bruker datablanding for å kombinere data, sendes et spørsmål til databasen for hver datakilde som brukes på arket. Resultatene av spørsmålene, inkludert aggregerte data, sendes tilbake og kombineres av Tableau. Visningen bruker alle rader fra den primære datakilden, den venstre tabellen og de samlede radene fra den sekundære datakilden, den høyre tabellen, basert på dimensjonen til koblingsfeltene.

Du kan endre koblingsfeltet eller legge til flere koblingsfelt for å inkludere forskjellige eller flere rader med data fra den sekundære datakilden i blandingen, og endre de samlede verdiene.

Anta for eksempel at du har følgende tabeller. Hvis koblingsfeltene er bruker-ID i begge tabellene blander dataene dine alle dataene fra venstre tabell, og supplerer venstre tabell med dataene fra høyre tabell. I dette tilfellet kan ikke alle verdier være en del av den resulterende tabellen på grunn av følgende:

  • En rad i venstre tabell har ikke tilsvarende radmatch i høyre tabell, som indikert av nullverdien.
  • Det er flere tilsvarende verdier i radene i høyre tabell, som indikert med stjernen (*).

Anta at du har de samme tabellene som ovenfor, men den sekundære datakilden inneholder et nytt felt kalt Formål . Igjen, hvis koblingsfeltet er bruker-ID , blander dataene dine tar alle dataene fra venstre tabell, og supplerer dem med data fra høyre tabell. I dette tilfellet ser du den samme nullverdien og stjernene i forrige eksempel i tillegg til følgende:

  • Fordi det Formål feltet er et mål, ser du radverdiene forFormålfelt samlet før dataene i høyre tabell kombineres med dataene i venstre tabell.
  • Som med forrige eksempel har ikke en rad i den venstre tabellen den tilsvarende raden for Formål felt, som angitt av den andre nullverdien.

Når skal jeg erstatte å bli med Blanding

1. Data må rengjøres.

Hvis tabellene dine ikke stemmer overens med hverandre riktig etter en sammenkobling, kan du sette opp datakilder for hver tabell, foreta nødvendige tilpasninger (det vil si endre navn på kolonner, endre kolonnedatatyper, opprette grupper, bruke beregninger osv.), Og bruk deretter datablanding for å kombinere dataene.

2. Sammenføyninger forårsaker duplikatdata.

Dupliserte data etter en sammenkobling er et symptom på data på forskjellige detaljnivåer. Hvis du merker duplikatdata, i stedet for å opprette en sammenkobling, bruk datablanding for å blande en felles dimensjon i stedet.

3. Du har mange data.

Vanligvis anbefales joins for å kombinere data fra samme database. Joins håndteres av databasen, som gjør det mulig for joins å utnytte noen av databasens innfødte muligheter. Men hvis du jobber med store datasett, kan sammenkoblinger sette en belastning på databasen og påvirke ytelsen betydelig. I dette tilfellet kan datablanding hjelpe. Fordi Tableau håndterer å kombinere dataene etter at dataene er samlet, er det færre data å kombinere. Når det er færre data å kombinere, forbedres ytelsen generelt.

Blanding av data i Tableau

Du kan bruke datablanding når du har data i separate datakilder som du vil analysere sammen på et enkelt ark. Tableau har to innebygde datakilder navngitt Eksempel-superbutikk og Eksempel på kaffekjede.mdb som skal brukes til å illustrere datablanding.

Trinn 1: Koble til dataene dine og sett opp datakildene

  • Koble til et datasett og sett opp datakilden på datakildesiden. Et inbuilt datakilde Eksempel på kaffekjede.mdb ,som er en MS Access-databasefil, vil bli brukt til å illustrere datablanding.
  • Gå til Data > Ny datakilde, koble til det andre datasettet.Dette eksemplet bruker Eksempel - Superstore datakilde. Tda satte opp datakilden.
  • Klikk på arkfanen for å begynne å bygge visningen.

Trinn 2: Angi en primær datakilde

  • Dra minst ett felt fra den primære datakilden til visningen for å angi det som den primære datakilden. I Data Klikk på datakilden du vil betegne som den primære datakilden. I dette eksemplet, Eksempel på kaffekjede er valgt.
  • Følgende skjermbilde viser de forskjellige tabellene og koblingene som er tilgjengelige i filen.

Trinn 3: Angi en sekundær datakilde

  • Felt som brukes i visningen fra datakilder som ikke er den primære datakilden eller aktive lenker, betegner automatisk påfølgende datakilder som den sekundære datakilden. I dette tilfellet Sample Superstore.

Trinn 4: Bland data

hvordan du setter opp Java-banen
  • Nå kan du integrere dataene fra begge kildene basert på en felles dimensjon ( Stat , i dette tilfellet). Merk at et lite lenkebilde vises ved siden av dimensjonen - Stat. Dette indikerer den vanlige dimensjonen mellom de to datakildene.
  • Anta at du lager et søylediagram med Resultatforhold i kolonnehyllen og Stat i radhyllen viser diagrammet hvordan fortjenesteforholdet varierer for hver stat i både supermarked og kaffekjedebutikker.

Begrensninger for datablanding i tablett

  1. Det er noen datablandingsbegrensninger rundt ikke-tilsetningsstoffer, for eksempel MEDIAN , og RAWSQLAGG .
  2. Datablanding kompromitterer spørringshastigheten i høy granularitet.
  3. Når du prøver å sortere etter et beregnet felt som bruker blandede data, vises ikke det beregnede feltet i rullegardinlisten Felt i dialogboksen Sorter.
  4. Kubedatakilder kan bare brukes som den primære datakilden for blanding av data i Tableau. De kan ikke brukes som sekundære datakilder.

Jeg håper dere alle nå har en god ide om Datablanding i tablett fra denne bloggen. Sulten etter mer kunnskap? Ikke bekymre deg, denne videoen gir deg en bedre forståelse av konseptet.