SAS Tutorial: Alt du trenger å vite om SAS



Lær hva som er SAS i denne SAS-opplæringsbloggen? Hva kan den gjøre, og forstå hvorfor SAS er et av de mest populære analyseverktøyene i markedet.

Spørsmål - SAS opplæring - EdurekaHva er SAS? Hvorfor skal jeg lære SAS?Hva er fordelene med ?Leter du etter svar på spørsmålene ovenfor? Hvis ja, så detteSAS opplæringvil svare på alle spørsmålene dine.

Vi mennesker er en nysgjerrig art, ikke sant? Vi vil alltid vite mer. Dette ønsket om å få oss, får oss til å stille flere spørsmål, og i sin tur holder oss på utkikk etter flere svar.





La oss se på et enkelt problem. Hva om du vil shoppe, og du har to alternativer å velge mellom:

  • En kupong på 149 dollar
  • 25% avslag på kupongen

Du lurer kanskje på, hvilket alternativ vil hjelpe deg med å spare mer?Dette er ett scenario. Vi har mange slike spørsmål, og vi kan komme over forskjellige scenarier der vi ikke kan ta en riktig beslutning. Gjør disse spørsmålene deg nysgjerrigom å finne svar? Hvis ja, vil du like analyse og også verktøyene som hjelper deg med å analysere data. SAS er et slikt verktøy.



SAS Tutorial

Mot slutten av artikkelen bør du være kjent med følgende emner:

Din forståelse av SAS er ufullstendig uten forståelse dataanalyse.Så la oss komme i gang.

Hva er dataanalyse?

Ordet 'analytics' har trendet en stund nå, men det er ingen eneste måte å definere det på. La oss prøve å forstå analyse med et enkelt eksempel. Tenk deg, du vil kjøpe en T-skjorte. Hva ville være de mulige spørsmålene du kanskje tenker på? La meg hjelpe deg med noen vanlige:



  • Når skal jeg kjøpe en T-skjorte?
  • Hvor mye skal jeg bruke på T-skjorten?
  • Skal jeg kjøpe T-skjorten på nettet, eller skal jeg besøke en butikk?
  • Hvis jeg bestemmer meg for å kjøpe T-skjorten på nettet, fra hvilket nettsted skal jeg kjøpe den?
  • Hvis jeg bestemmer meg for å besøke en butikk, hvilken butikk skal jeg besøke?

Beslutningen kan avhenge av faktorer som tid, penger, preferanser og tidligere erfaringer. La oss fortsette med problemet ovenfor. Vurder følgende:

  • Du er fri på søndag
  • Budsjettet ditt er $ 300
  • Du foretrekker å besøke en butikk da det lar deg håndplukke en T-skjorte
  • Du bestemmer deg for å besøke en bestemt butikk fordi ditt forrige besøk i butikken ikke skuffet deg

Basert på de ovennevnte punktene, antar du at du bestemmer deg for å besøke en butikk på søndag og kjøpe en T-skjorte som koster deg rundt $ 265. Du vurderte noen få muligheter, valgte de som passet kravet og tok en beslutning.

Vel, i enkle ord gjorde du bare en slags analyse for å hjelpe deg med å kjøpe en T-skjorte. La meg forenkle det ytterligere. Hjernen din gjorde to enkle ting her:

  • Samlet informasjon i henhold til dine krav
  • Forsto dataene, og basert på den informasjonen, hjalp deg med å bestemme deg for å kjøpe T-skjorten.

Dette er hva du kan gjøre ved hjelp av analyser. Du kan samle informasjon, analysere den og ta bedre beslutninger. Ovenstående eksempel varlett, slik at du kan ta en beslutning basert på noen forutsetninger. Hva om problemet og beslutningstaking ikke var så lett?

Vurder dette problemet fra et forretningsmessig synspunkt.Anta at et e-handelsselskap ønsker å studere kjøpemønstrene til kundene sine basert på tidligere data. Selskapet vil måtte vurdere tusenvis av poster, ikke sant? Tenk deg dataene vi nettopp snakket om, eller permutasjoner og kombinasjoner selskapet kan vurdere for forskjellige preferanser som folk kan ha.

Det kan også hende at selskapet ikke har alle dataene. For eksempel, hvis en kunde ikke kjøpte en T-skjorte, hvilke faktorer førte da til at kunden bestemte seg for å ikke kjøpe T-skjorten? Disse manglende dataene kan skape problemer. Hvordan takler vi disse problemene? Hvordan håndterer vi slike data? Vi vil,disse problemene blir lettere når vi bruker analyser. Ved å bruke analyser kan du eliminere unødvendige data og optimalisere relevant informasjon for å finne mønstre som kan hjelpe deg med å ta bedre beslutninger.

Vi har mange verktøy til rådighet for analyse og for å forenkle slike problemer.Et fremtredende verktøy er SAS. Denne SAS-veiledningen vil hjelpe deg med å forstå SAS og hvordan den kan brukes til å løse våre problemer.

Abonner på youtube-kanalen vår for å få nye oppdateringer ..!

Behov for SAS

Analysemarkedet har vokst enormt de siste årene. Dette har resultert i en økning i antall verktøy som brukes. Alle disse er gunstige på en eller annen måte. Så la oss gå videre med SAS-opplæringen og se på noen av de mest brukte verktøyene i markedet.

  • SAS: Det er det mest brukte verktøyet i markedet for kommersiell analyse. Med en mengde statistiske funksjoner og god GUI (Enterprise Guide & Miner), fører det absolutt markedet.
  • R: Det er en programvare med åpen kildekode. Det er lett å lære R fordi det er godt dokumentert. Det er kostnadseffektivt og har sterke statistiske evner.
  • Python er et annet skriptspråk med åpen kildekode som er mye brukt. Python-bruk har vokst over tid.I dag er det sportsbiblioteker som Numpy, Scipy og MatPlotLib. Du kan utføre nesten hvilken som helst statistisk operasjon eller bygge en hvilken som helst modell ved hjelp av disse bibliotekene.

SAS mot R Vs. Python

La oss sammenligne disse tre verktøyene i denne SAS-opplæringen, og jeg skal bruke følgende parametere for sammenligning.

1) Jobber

Å være et viktig verktøy for forskning og analyse, har det sikkert generert mye krav til SAS-trente ressurser. SAS eier 70% av markedsandelen. R har 15% og python holder minst, noe som er mindre enn 10%.

2) Enkel forståelse

SAS er et av de enkleste verktøyene å lære. Selv personer med begrenset kunnskap om SQL kan lære det enkelt. Python er ikke så praktisk som SAS er for analyse. R krever at du skriver kjedelige og lange koder, og dermed gir SAS en fordel.

3) Fjerde generasjons språk

SAS er et fjerde generasjons programmeringsspråk. Et fjerde generasjons programmeringsspråk er 'et programmeringsspråk designet med et bestemt formål i tankene, for eksempel utvikling av kommersiell forretningsprogramvare.' Den er designet for å redusere programmeringsinnsatsen og minimere tiden og kostnadene det tar å utvikle en programvare. R og Python er ikke fjerde generasjons språk.

4) Fleksibel

SAS holder seg oppdatert etter markedets behov. Den enkle integrasjonen gjør den mer fleksibel og brukbar. Dette betyr også at det smelter godt sammen med andre teknologier. Gjør det fleksibelt i sann forstand.

Ovennevnte årsaker støtter sterkt påstanden om at SAS holder sin øverste posisjon i markedet.Så nå som vi har sett sammenligningen av disse tre analytiske verktøyene. Når vi går videre i denne SAS-opplæringen, kan vi forstå SAS litt mer detaljert.

SAS Tutorial: Hva er SAS ?

La oss nå prøve å forstå hva det er SAS og hva den gjør?

SAS står for Statistical Analysis System. Det er en programvaresuite utviklet av SAS Institute.

SAS-applikasjoner

Bildet nedenfor viser noen få applikasjoner av SAS:

Med enkle ord kan SAS behandle komplekse data og generere meningsfull innsikt som vil hjelpe organisasjoner å ta bedre beslutninger eller forutsi mulige resultater i nær fremtid.

SAS lar deg utvinne, endre, administrere og hente data fra forskjellige kilder og analysere dem.Det grafiske pek-og-klikk-brukergrensesnittet til SAS hjelper ikke-tekniske brukere til å bruke funksjonene til grafiske operasjoner og avanserte alternativer.

hvordan du installerer formørkelsesvinduer

SAS opplæring | SAS Tutorial for dataanalyse | Edureka

SAS-komponenter

La oss gå videre med SAS-veiledningen og se på noen viktige SAS-komponenter:

  • SAS Base: Det er den mest brukte komponenten. Den har datastyringsanlegg. Du kan gjøre dataanalyse ved hjelp av Base SAS.
  • SAS / GRAFIK: Med bruk av SAS / Graph kan du representere data som grafer. Dette gjør datavisualisering enkel.
  • SAS/STAT: Den lar deg utføre statistisk analyse, for eksempel varians, regresjon, multivariat, overlevelse og psykometrisk analyse.
  • SAS / ETS: Det er egnet for tidsserieanalyse.

Siden dette er en innledende artikkel, vil vi fokusere på Base SAS, og jeg er sikker på at det skal være lett for alle å forstå.

Interessert i å lære SAS fra eksperter? Meld deg på nå

SAS som et programmeringsspråk

De fleste programmeringsmiljøer er enten menydrevne (pek-og-klikk) eller kommandostyrt (skriv inn og utfør kommandoer). Imidlertid er SAS verken meny- eller kommandostyrt. Dette er fordi den bruker en serie instruksjoner eller uttalelser kjent som SAS-program. Dette programmet er en skildring av hva du vil gjøre og er skrevet på SAS-språk.

Data

Data er sentralt i hvert datasett. I SAS er data tilgjengelig i tabellform der variabler opptar kolonneplassen, og observasjoner opptar radplassen.

Datatyper:

SAS behandler tall som numeriske data, og alt annet faller inn under tegndata. Derfor har SAS to datatyper, numeriske og tegn. Enkelt, ikke sant?

DATA-trinn og PROC-trinn utgjør de grunnleggende byggesteinene i et SAS-program. Hva gjør disse byggesteinene er hva vi skal diskutere i denne SAS-opplæringen.

Byggesteiner fra SAS

Vi starter et program med et DATA-trinn for å opprette et SAS-datasett og deretter overføre dataene til et PROC-trinn. PROC-trinnet behandler dataene. For å forstå hvordan DATA- og PROC-trinn fungerer, la oss se på eksemplet nedenfor.

Anta at jeg ønsket å konvertere et tall som er i tommer til centimeter og lagre resultatet i en variabel kalt ‘størrelse’ og skrive det ut, så konverterer DATA-trinnet tallet i tommer til centimeter, og PROC-trinn vil skrive ut resultatet.

Bildet nedenfor viser en kodebit for ovennevnte problem:

Uttalelsene utgjør DATA- og PROC-trinn. Lengden på et trinn kan variere fra ett til mer enn hundre utsagn. Det er viktig at du husker at DATA-trinn brukes til å lese og endre data, mens PROC-trinn brukes til å analysere data, utføre verktøyfunksjoner eller skrive ut rapporter.

DATA-trinn begynner med nøkkelordet DATA, etterfulgt av et navn du velger for SAS-datasettet. Det er tydelig at ovennevnte DATA-trinn produserer et datasett som heter størrelse. DATA-trinn leser data fra eksterne datafiler og kan også brukes til å inkludere sløyfer og saksuttalelser. Den kan brukes til å slå sammen, sortere, kombinere og sammenkoble data.

Tilsvarende starter prosedyrer med en PROC-setning der nøkkelordet PROC følger navnet på prosedyren som brukes (for eksempel kan navnet på prosedyren være PRINT, SORT, eller MEAN). SAS-prosedyrer har stort sett en håndfull mulige uttalelser.

Hver gang SAS kommer over et nytt trinn (markert med en DATA- eller PROC-uttalelse), avslutter eller avslutter det forrige trinn og begynner med et nytt trinn.

Mens et typisk program starter med et DATA-trinn for å legge inn eller endre data, og deretter overføre dataene til et PROC-trinn, er det absolutt ikke det eneste mønsteret for å blande DATA- og PROC-trinn. Akkurat som du kanstable byggesteineri hvilken som helst rekkefølge, kan du ordne DATA- og PROC-trinn i hvilken som helst rekkefølge. Et program kan til og med inneholde bare DATA-trinn eller bare PROC-trinn.

Likevel vil du finne det mye lettere å skrive SAS-programmer hvis du forstår disse grunnleggende funksjonene. Ovennevnte er få grunnleggende hver SAS-nybegynner bør vite. Fortsett til neste del av SAS-opplæringen, la oss forstå hvordan du installerer SAS universitetsutgave.

Nå kan nybegynnere lære og øve SAS, som SAS Institute Inc. har gitt ut SAS University Edition som er tilgjengelig gratis. Alle funksjonene som trengs for å lære Base SAS er tilgjengelige her. Learning Base SAS vil gjøre det enkelt for deg å lære andre komponenter.

Følgende trinn hjelper deg med å installere SAS University Edition.Det er en programvare som du kan øve på SAS-programmering i.

SAS Tutorial: Installasjon

Det er enkelt å installere SAS University Edition. Tilgjengeligheten av den som en virtuell maskin krever imidlertid at du kjører den i et virtuelt miljø. Du må installere en virtualiseringsprogramvare på PC-en din før du kjører SAS-programvaren. Følgende trinn hjelper deg med å laste ned og konfigurere SAS-miljøet.

1) Last ned SAS University Edition

SAS University Edition kan lastes ned fra denne lenken SAS University Edition . Hvis du klikker på lenken ovenfor, vises følgende vindu. Les kravdetaljene før du begynner å laste ned.

2) Hurtigstartveiledning for installasjon

Personer som er helt nye for installasjonsprosessen, kan gå gjennom følgende guider og videoer som er tilgjengelige som i trinn 1. Det er valgfritt, og du kan hoppe over det hvis du allerede er kjent.

hva gjør matte.abs i java

3) Sette opp en virtualiseringsprogramvare

Koblingene i trinn 2 lar deg laste ned den aktuelle virtualiseringsprogramvaren. Du kan hoppe over dette trinnet hvis du allerede har installert en virtualiseringsprogramvare.

4) Last ned zip-filen

Velg riktig versjon av SAS University Edition-kompatibelmed det virtualiseringsmiljøet du har. Den lastes ned som en zip-fil. Navnetvil være lik: ‘Unvbasicvapp_9411005_vmx_en_sp0_1.zip’

5) Pakk ut zip-filen

Pakk ut den ovennevnte zip-filen og lagre den i en passende katalog.

6) Laste inn den virtuelle maskinen

hva er en instansvariabel

Åpne og start VMware-spilleren din, se etter en fil som ender med utvidelsen .vmx og åpne den. Følgende skjermbilde vil være synlig. Vær oppmerksom på de grunnleggende innstillingene som minne og harddiskplass som er tildelt for din referanse.

7) Slå på den virtuelle maskinen

Klikk på Slå på denne virtuelle maskinen ved siden av det grønne pilemerket, kan du starte den virtuelle maskinen. Følgende skjermbilde skal vises.

Under innlasting vises følgende skjermbilde. Etter dette kan du kjøre den virtuelle maskinen. Du får en melding om å gå til URL-en som åpner SAS-miljøet.

8) S tartende SAS Studio

Åpne en ny fane i nettleseren din og last inn URL-en som er markert i bildet ovenfor. Følgende skjermbilde vises for å indikere beredskapen til SAS-miljøet. Du kan få en annen URL fordi, URLkan være forskjellig fra PC til PC.

Du kan starte studioet, og du er god å gå.

Kjører et SAS-program

Nå som vi har forstått hvordan vi installerer SAS University Edition, la oss ta i et eksempel på SAS-program i vår SAS-opplæring.

Koden nedenfor viser hvordan du skriver ut en Fibonacci-sekvens. Hvis du ikke vet hva en Fibonacci-sekvens er, la meg definere den for deg.

Fibonacci-sekvensen er et sett med tall som begynner med ett eller null, etterfulgt av ett, og fortsetter basert på regelen om at hvert tall (kalt et Fibonacci-tall) er lik summen av de to foregående tallene. Hvis Fibonacci-sekvensen er betegnet F (n), der n er den første termen i sekvensen, viser følgende ligning Fibonacci-sekvensen for n = 0, der de to første begrepene er definert som 0 og 1 etter konvensjon:

F (0) = 0, 1, 1, 2, 3, 5, 8, 13, 21, 34 ...

I noen sammenhenger er det vanlig å bruke n = 1. I så fall er de to første begrepene definert som 1 og 1 som standard, og derfor:

F (1) = 1, 1, 2, 3, 5, 8, 13, 21, 34 ...

La oss ta en titt på denne SAS-koden som genererer en Fibonacci-sekvens som starter med en.

DATA Fibonacci Gjør jeg = 1 til 10 Fib = Sum (Fib, lag (Fib)) hvis jeg = 1, da Fib = 1 utgangsslutt PROC UTSKRIFT Fibonacci Run

I koden ovenfor har vi definert en funksjon kalt ‘Fib’ for å beregne neste tall. Fib er lik summen av det nåværende Fib-nummeret og det forrigeFibonacciAntall. Vi bruker lagfunksjon for å hente den siste funksjonen og for å hente verdien av forrige fibnummer.

Følgende bilde viser utdataene fra koden ovenfor. Vi har brukt PROC PRINT-prosedyren for å vise utdataene i trykt form.

Jeg håper du likte denne SAS-opplæringsbloggen. Dette var den første bloggen i SAS Tutorial-bloggserien. Den neste bloggen min vil være om SAS-programmering, les det også for å lære å skrive programmer i SAS.

Hvis du ønsker å lære SAS og bygge en karriere i analytics-domenet, kan du sjekke ut vårt som kommer med instruktørledet live-opplæring og reell prosjektopplevelse.Denne opplæringen vil hjelpe deg med å forstå SAS i dybden og hjelpe deg med å mestreulike begreper i SAS-språk.

Interessert i å lære SAS fra eksperter? Meld deg på nå

Har du et spørsmål til oss? Vennligst nevn det i kommentarfeltet, så kommer vi tilbake til deg.