Målet med ethvert BI-verktøy er å gi Dataanalyse en bedre flyt. Hvis man som profesjonell står overfor vanskeligheter med å bruke verktøyet mens man løser et problem, er strømningsstatusen ødelagt. En vanlig årsak til dette problemet er behovet for å jobbe med data som er samlet til forskjellige Detaljnivå i tablett (LOD) .
Tableau som plasseres på toppen av bunken for 6. gang på rad, på Gartners Magic Quadrant, sier definitivt noe om sin etterspørsel i markedet. Dette er trolig den beste tiden å .
Denne bloggen vil hjelpe deg med å forstå LOD-uttrykk og diskutere følgende emner:
forutsetninger for kunstig intelligens kurs
- Hvorfor trenger du detaljnivå i Tableau?
- Hva er detaljnivået i tabletten?
- Radnivå og visningsnivåuttrykk
- Typer av LOD-uttrykk
- Aggregering og LOD-uttrykk
- Filtre og LOD-uttrykk
- Opprette LOD-uttrykk
- Datakilder som støtter detaljnivå i tablett
- Tabellberegninger vs detaljnivå i tablett
- Begrensninger for detaljnivå i tablett
Tableau LOD: Hvorfor trenger du LOD?
Det er ofte spørsmål som man kommer til å komme over når man analyserer data. Disse spørsmålene er ofte enkle å stille, men vanskelige å svare på. De høres ofte ut som:
For å adressere denne typen spørsmål ble det introdusert en ny syntaks kalt Detaljnivå i Tableau 9.0. Denne nye syntaksen både forenklet og utvidet Tableaus beregningsspråk ved å gjøre det mulig å adressere disse spørsmålene direkte.
Tableau LOD: Hva er LOD?
LOD-uttrykk representerer en elegant og kraftig måte å svare på spørsmål som involverer flere nivåer av granularitet i en enkelt visualisering.
Detaljnivå i Tableau- eller LOD-uttrykk lar deg beregne verdier på datakildenivå og visualiseringsnivå. Imidlertid gir LOD-uttrykk deg enda mer kontroll på granularitetsnivået du vil beregne. De kan utføres på en mer granulær nivå (INCLUDE Calculation), a mindre granulær nivå (EXCLUDE Calculation), eller et helt uavhengig mild l (FAST beregning).
Tableau LOD: Radnivå og visningsnivåuttrykk
Radnivå
I Tableau, uttrykk som refererer til uaggregerte datakildekolonner beregnes for hver rad i den underliggende tabellen. I dette tilfellet er uttrykkets dimensjonalitet radnivå . Et eksempel på et radnivåuttrykk er:
[Salg] / [Profitt]
Denne beregningen vil bli evaluert i hver rad i databasen. Salgsverdien i hver rad blir delt av fortjenesteverdien i den raden, og produserer en ny kolonne med resultatet av multiplikasjonen (et fortjenesteforhold).
Hvis du lager en beregning med denne definisjonen, lagrer du den med navnet [ProfitRatio], og dra den deretter fra Datarute til en hylle, Tableau skal vanligvis samle det beregnede feltet for visningen:
SUM [ProfitRatio]
Visningsnivå
Derimot uttrykk som refererer til samlet datakildekolonner blir beregnet med dimensjonaliteten definert av dimensjonene i visningen. I dette tilfellet er uttrykkets dimensjonalitet visningsnivå. Et eksempel på et visningsnivåuttrykk er:
SUM (salg) / SUM (fortjeneste)
Hvis du drar denne beregningen til en hylle (eller skriver den direkte på en hylle som en ad-hoc-beregning), legger Tableau den i en AGG-funksjon :
AGG (SUM (salg) / SUM (fortjeneste))
Dette er det som er kjent som en Totalberegning .
utvalg sorteringsprogram i java
Tableau LOD: Aggregering og LOD-uttrykk
LOD-uttrykk er grovere enn utsiktsnivået
Et uttrykk har et grovere detaljnivå enn visningen når det refererer til a delmengde av dimensjonene i utsikten.
For eksempel for en visning som inneholdt dimensjonene [Kategori] og [Segmentet], kan du lage et detaljnivå i Tableau som bare bruker en av disse dimensjonene:
{FIXED [Segment]: SUM ([Salg])}
I dette tilfellet har uttrykket et grovere detaljnivå enn utsikten. Den baserer verdiene på en dimensjon ([Segmentet]), mens visningen baserer sitt syn på to dimensjoner ([Segmentet] og [Kategori]).
Resultatet er at bruk av detaljnivået i visningen får visse verdier til å replikeres - det vil si til vises flere ganger .
LOD-uttrykk er finere enn utsiktsnivået
Et uttrykk har et finere detaljnivå enn visningen når det refererer til a overmengde av dimensjonene i utsikten.
Når du bruker et slikt uttrykk i visningen, vil Tableau samle resultater opp til visningsnivået. Følgende detaljnivå i Tableau refererer for eksempel til to dimensjoner:
{FIXED [Segment], [Category]: SUM ([Sales])}
Når dette uttrykket brukes i en visning som bare har [Segment] som detaljnivå, blir verdiene må samles . Slik ser du hvis du drar uttrykket til en hylle:
AVG ([{FIXED [Segment]], [Category]]: SUM ([Sales]]}}])
An aggregering (i dette tilfellet gjennomsnitt) tildeles automatisk av Tableau. Du kan endre aggregasjonen etter behov.
Legge til et LOD-uttrykk i visningen
Hvorvidt et detaljnivå i tablettuttrykk er samlet eller replikert i visningen, bestemmes av uttrykkstype og detaljnivå .
- INKLUDER uttrykk vil ha enten samme detaljnivå som utsikten eller et finere detaljnivå enn utsikten. Derfor vil verdier aldri bli replikert.
- FASTE uttrykk kan ha et finere detaljnivå enn utsikten, et grovere detaljnivå eller samme detaljnivå. Behovet for å samle resultatene av et FIKTET detaljnivå avhenger av hvilke dimensjoner som er i visningen.
- EXCLUDE-uttrykk får alltid replikerte verdier til å vises i visningen. Når beregninger inkludert EXCLUDE detaljnivåuttrykk plasseres på en hylle, er Tableau som standard ATTR-aggregering i motsetning til SUM eller AVG, for å indikere at uttrykket faktisk ikke blir samlet, og at endring av aggregering ikke vil ha noen innvirkning på utsikten.
Detaljnivåuttrykk pakkes alltid automatisk sammen når de legges til en hylle i visningen, med mindre de brukes som dimensjoner.
Tableau LOD: Filtre og LOD-uttrykk
Bildet her viserrekkefølge for utførelse av filtre fra topp til bunn.Teksten til høyre viser hvor LOD-uttrykkene blir evaluert i denne sekvensen.
Pakkefiltre (i oransje) er bare relevante hvis du oppretter et tablettuttrekk fra en datakilde. Tabellberegningsfiltre (mørkeblå) brukes etter at beregningene er utført, og skjuler derfor merker uten å filtrere ut de underliggende dataene som er brukt i beregningene.
FASTE beregninger brukes før dimensjonsfiltre, så med mindre du promoterer feltene på filterhyllen din for å forbedre visningsytelsen med kontekstfiltre, blir de ignorert.
Tableau LOD: Typer av LOD-uttrykk
INKLUDERER Beregning
INCLUDE beregner verdier ved hjelp av de angitte dimensjonene i tillegg til dimensjonene som er i visningen. Dette detaljnivåuttrykket er mest nyttig når du inkluderer en dimensjon som ikke er i visningen.
gjør dobbelt til int java
For eksempel: {INCLUDE [Customer Name]: SUM ([Sales])}
EKSKLUDERING Beregning
EXCLUDE fjerner eksplisitt dimensjoner fra uttrykket - det vil si at de trekker dimensjoner fra detaljnivået. Dette detaljnivået i Tableau er mest nyttig for å eliminere en dimensjon i visningen.
For eksempel: {EXCLUDE [Region]: SUM ([Sales])}
FAST beregning
FIXED beregner verdier ved hjelp av de angitte dimensjonene uten referanse til detaljnivået på visningen - det vil si uten referanse til andre dimensjoner i visningen. Dette detaljnivåuttrykket ignorerer også alle filtrene i visningen bortsett fra kontekstfiltre, datakildefiltre og ekstraktfiltre.
For eksempel: {FIXED [Region]: SUM ([Sales])}
Tableau LOD: Opprette LOD-uttrykk
Syntaks for et LOD-uttrykk
Et detaljnivåuttrykk har følgende struktur:
INKLUDERE
Trinn 1: Sett opp visualiseringen
- Åpne Tableau Desktop og koble til Eksempel-Superstore lagret datakilde.
- Naviger til et nytt regneark.
- Fra Data ruten, under Dimensjoner, dra Region til Kolonner Hylle.
- Fra Data ruten, under Mål, dra Salg til Rader Hylle. Et søylediagram som viser summen av salget for hver region vises.
Trinn 2: Lag LOD-uttrykket
I stedet for summen av alt salg per region, vil du kanskje også se gjennomsnittlig salg per kunde for hver region. Du kan bruke et LOD-uttrykk for å gjøre dette.
- Å velge Analyse > Lag beregnet felt.
- Gjør følgende i beregningsredigeringsprogrammet som åpnes:
- Navn beregningen, salg per kunde.
- Skriv inn følgende LOD-uttrykk:
{INCLUDE [Customer Name]: SUM ([Sales])}
- Når du er ferdig, klikker du OK. Det nyopprettede LOD-uttrykket legges til i dataruten under Målinger.
Trinn 3: Bruk LOD-uttrykket i visualiseringen
- Fra Data ruten, under Mål, dra Salg per kunde til Rader og legg den til venstre for SUM (salg).
- Høyreklikk på radhyllen Salg per kunde og velg Mål (sum) > Gjennomsnitt. Du kan nå se både summen av alt salg og gjennomsnittlig salg per kunde for hver region. For eksempel kan du se at i Sentral-regionen var salget omtrent 500 000 USD med et gjennomsnittlig salg for hver kunde som er omtrent 800 USD .
Tableau LOD: Datakilder som støtter LOD-uttrykk
Datakilde | Støttet / støttes ikke |
Actian Vectorwise | Ikke støttet. |
Amazon EMR Hadoop Hive | Støttet Hive 0.13 og utover. |
Amazon Redshift | Støttet. |
Aster Database | Støttet versjon 4.5 og utover. |
Cloudera Hadoop | Støttet Hive 0.13 og utover. |
Cloudera Impala | Støttet Impala 1.2.2 og utover. |
Kuber (flerdimensjonale datakilder) | Ikke støttet. |
DataStax Enterprise | Ikke støttet. |
EXASOL | Støttet. |
Firebird | Støttet versjon 2.0 og utover. |
Generisk ODBC | Begrenset. Avhenger av datakilde. |
Google Big Query | Støttes for Standard SQL, ikke Legacy. |
IBM DB2 | Støttet versjon 8.1 og utover. |
MarkLogic | Støttet versjon 7.0 og utover. |
SAP HANA | Støttet. |
SAP Sybase ASE | Støttet. |
SAP Sybase IQ | Støttet versjon 15.1 og utover. |
Gnist SQL | Støttet. |
Splunk | Ikke støttet. |
Tabell for dataekstrakt | Støttet. |
Teradata | Støttet. |
Vertica | Støttet versjon 6.1 og utover. |
Microsoft Access | Ikke støttet. |
Microsoft Jet-baserte tilkoblinger | Ikke støttet. |
Hortonworks Hadoop Hive | Støttet Hive 0.13 og utover. På versjon 1.1 av HIVE er LOD-uttrykk som produserer kryssforbindelser ikke pålitelige. |
IBM BigInsights | Støttet. |
Microsoft SQL Server | Støttet SQL Server 2005 og utover. |
MySQL | Støttet. |
IBM PDA (Netezza) | Støttet versjon 7.0 og utover. |
Oracle | Støttet versjon 9i og utover. |
Actian Matrix (ParAccel) | Støttet versjon 3.1 og utover. |
Pivotal Greenplum | Støttet versjon 3.1 og utover. |
PostgreSQL | Støttet versjon 7.0 og utover. |
Fremgang OpenEdge | Støttet. |
Tableau LOD: Tabellberegninger vs LOD
LOD-uttrykk er ikke en ny form for tabellberegninger. Selv om de kan erstatte mange tabellberegninger, er deres hovedmål å åpne nye muligheter.LOD-uttrykk og tabellberegninger fungerer annerledes.
Tabellberegninger | LOD Uttrykk |
Tabellberegninger genereres av Spørringsresultater . | LOD-uttrykk genereres som en del av spørringen til underliggende datakilde . De uttrykkes som et nestet utvalg, så avhengig av DBMS-ytelse. |
Tabellberegninger kan bare gi resultater enten like eller mindre granulære enn nevnte LOD. | LOD kan gi resultater uavhengig av LOD . |
Dimensjoner som styrer operasjonene til en tabell er atskilt fra beregningssyntaks. | Dimensjoner som styrer operasjonene til et LOD-uttrykk er innebygd i uttrykket seg selv. |
Tabellberegninger brukes som samlede tiltak . | LOD-uttrykk kan brukes i andre konstruksjoner. |
Filtre på tabellberegninger fungerer som en GJEMME SEG . | Filtre på LOD fungerer som en UTELUKKE . |
Tableau LOD: Begrensninger av LOD
Følgende er begrensningene som gjelder for LOD-uttrykk.
- LOD-uttrykk som refererer til mål med flytende punkt, har en tendens til å oppføre seg på en pålitelig måte når de brukes i et syn som krever en sammenligning av verdiene i uttrykket.
- LOD vises ikke på datakildesiden.
- Når du refererer til en parameter i en dimensjonserklæring, bruk alltid parameternavnet, og ikke parameterverdien.
- Når data blandes, må koblingsfeltet fra den primære datakilden være i visningen før du kan bruke et detaljnivåuttrykk fra den sekundære datakilden.
I tillegg har noen datakilder kompleksitetsgrenser. Tableau vil ikke deaktivere beregninger for disse databasene, men spørringsfeil er en mulighet hvis beregninger blir for kompliserte.