R Tutorial - A Beginner's Guide to Learn R Programming



Denne bloggen på R Tutorial introduserer deg for R-verktøyet og hjelper deg med å forstå de forskjellige grunnleggende tingene i R-programmering i detalj med eksempler.

R er det mest populære dataanalyseverktøyet, da det er åpen kildekode, fleksibelt, tilbyr flere pakker og har et stort fellesskap. Den er designet for programvareprogrammerere, statistikere og databearbeidere, og dermed gitt popularitet til .I denne R-opplæringsbloggen vil jeg gi deg et fullstendig innblikk i R med eksempler.

Nedenfor er emnene i denne R-opplæringsbloggen som jeg skal diskutere i følgende sekvens:





  1. Hvorfor trenger vi Analytics ?
  2. Hva er Business Analytics ?
  3. Hvorfor R og hvem bruker R ?
  4. Installasjon av R
  5. Dataoperatører
  6. Datatyper
  7. Flytkontroll

R Opplæring: Hvorfor trenger vi Analytics?

Før jeg svarer på spørsmålet, la meg orientere deg om noen av problemene og løsningene i R på flere domener.



bank - R Opplæring - Edureka

Bank :

Det genereres store mengder kundedata hver dag i banker. Wmed å håndtere millioner av kunder med jevne mellomrom, blir det vanskelig å spore pantelånene.



Løsning :

R bygger en tilpasset modell som opprettholder lånene som gis til hver enkelt kunde, som hjelper oss å bestemme beløpet som skal betales av kunden over tid.

Forsikring :

Forsikring avhenger i stor grad av prognoser. Det er vanskelig åbestemme hvilken policy du vil godta eller avvise.

Løsning:

Ved å bruke den kontinuerlige kredittrapporten som innspill, kan vi lage en modell i R som ikke bare vil vurdere risikoappetitt, men også lage en prediktiv prognose også.

Helsevesen:

Hvert år blir millioner innlagt på sykehus, og milliarder blir brukt årlig bare i innleggelsesprosessen.

Løsning :

Gitt pasienthistorie og medisinsk historie, kan det bygges en prediktiv modell for å identifisere hvem som er i fare for sykehusinnleggelse og i hvilken grad medisinsk utstyr skal skaleres.

Nå vet vi hvordan dataanalyse hjelper organisasjoner å utnytte dataene sine og bruke dem til å identifisere nye muligheter. Hvis vi snakker om behovet for analyse i en organisasjon, må du komme over disse fire aspektene:

La oss nå gå videre i R tutorial blogg, hvor vi først vil forstå hva som er forretningsanalyse.

R Opplæring: Hva er Business Analytics?

Forretningsanalyse er en prosess for å undersøke store datasett og oppnå skjulte mønstre, sammenhenger og annen innsikt. Det hjelper deg i utgangspunktet å forstå alle dataene du har samlet, det være seg organisasjonsdata, markeds- eller produktundersøkelsesdata eller annen form for data. Det blir enkelt for deg å ta bedre beslutninger, bedre produkter, bedre markedsføringsstrategier osv. Se bildet nedenfor for bedre forståelse:

Hvis du ser på figuren ovenfor, er dataene dine i det første bildet spredt. Nå, hvis du vil ha noe spesifikt, for eksempel en bestemt post i en database, blir det tungvint. For å forenkle dette trenger du analyse. Med analyse blir det lett å finne en sammenheng mellom dataene. Når du har funnet ut hva du skal gjøre, blir det ganske enkelt for deg å ta avgjørelser som hvilken vei du vil følge eller når det gjelder forretningsanalyse, hvilken vei vil føre til forbedring av organisasjonen.

Men du kan ikke forvente at folk i kjeden ovenfor alltid skal forstå rådataene du gir dem etter analyse. Så for å overvinne dette gapet, har vi et konsept av datavisualisering .

Datavisualisering : Datavisualisering er visuell tilgang til store mengder data du har generert etter analyse. Det menneskelige sinnet behandler visuelle bilder og visuell grafikk er mer bedre enn å sammenligne med rådata. Det er alltid lett for oss å forstå et kakediagram eller et søylediagram sammenlignet med rå tall. Nå lurer du kanskje på hvordan kan du oppnå denne datavisualiseringen ut fra dataene du allerede har analysert?
Det er forskjellige verktøy tilgjengelig i markedet for datavisualisering:

Dere alle lurer på at det allerede er så mange verktøy som hjelper deg med å oppnå datavisualisering og en viss mengde analyse, hvorfor gå med R?

Så mitt neste emne i R-opplæringsbloggen tar for seg ‘hvorfor R’ og ‘hvem bruker R’.

R-opplæring: Hvorfor R og hvem bruker R?

Hvorfor R?

R er et programmerings- og statistisk språk.

R brukes til dataanalyse og visualisering.

R er enkelt og lett å lære, lese og skrive.

R er et eksempel på en FLOSS (Free Libre og Open Source Software) hvor man fritt kan distribuere kopier av denne programvaren, lese kildekoden, endre den osv.

Hvem bruker R?

  • Consumer Financial Protection Bureau bruker R til dataanalyse
  • Statistikere på John Deere bruker R for modellering av tidsserier og geospatial analyse på en pålitelig og reproduserbar måte.
  • Bank of America bruker R for rapportering.
  • R er en del av teknologibakken bak Foursquares berømte anbefalingsmotor.
  • ANZ, den fjerde største banken i Australia, som bruker R for kredittrisikoanalyse.
  • Google bruker R for å forutsi økonomisk aktivitet.
  • Mozilla, stiftelsen som er ansvarlig for Firefox-nettleseren, bruker R for å visualisere nettaktivitet.

Nedenfor er noen av domenene der R brukes:

La oss nå gå videre i R tutorial blogg og installere R.

R Opplæring: Installasjon av R

La meg veilede deg gjennom prosessen med å installere R på systemet ditt. Bare følg trinnene nedenfor:

Trinn 1 : Gå til lenken- https://cran.r-project.org/

Steg 2 : Last ned og installer R 3.3.3 på systemet ditt.

Se skjermbildet nedenfor for å få en bedre forståelse.

Ved å følge trinnene ovenfor er du ferdig med R-installasjonsdelen. Nå kan du starte kodingen direkte i R ved å laste ned RStudio IDE. Følg trinnene nedenfor for å laste ned dette:

Trinn 1 : Gå til lenken- https://www.rstudio.com/

Steg 2 : Last ned og installer Rstudio på systemet ditt.

Etter å ha installert alt, er du klar til å kode!

R Opplæring for nybegynnere | R Programmeringsveiledning | Edureka

La oss nå gå videre i R Tutorial-bloggen og forstå hva som er dataoperatører i R.

R Opplæring: Dataoperatører i R

Det er hovedsakelig 5 forskjellige typer operatører, som er oppført nedenfor:

  1. Aritmetiske operatører : Utfør aritmetiske operasjoner som addisjon, subtraksjon, multiplikasjon, divisjon etc.
  2. Oppdragsoperatører :Oppdragsoperatører brukes til å tilordne verdier. For eksempel:
  • Oppdragsoperatør =
    Syntaks:
    variabelnavn = verdi
> x = 5 >x 
Utgang: [1] 5
  • Oppdragsoperatør<-
    Syntaks:
    variabelt navn<- value

    > x<- 15 > x
    Utgang: [1] 15
  • Oppdragsoperatør<<-
    Syntaks:
    variabelt navn<<- value
> x<<- 2 > x
Utgang: [1] 2
  • Oppdragsoperatør ->
    Syntaks:
    verdi -> variabelnavn

    > 25 -> x > x 
    Utgang: [1] 25

3. Relasjonsoperatør : Den definerer en sammenheng mellom to enheter. For eksempel: ,<=,!= etc.

> xx! = 2
Produksjon:[1] SANT

4. Logiske operatører : Disse operatorene sammenligner de to enhetene og brukes vanligvis med boolske (logiske) verdier som &, | og!.

> x2 og 3
Produksjon:[1] SANT

5. Spesialoperatører : Disse operatørene brukes til bestemte formål, ikke til logisk beregning. For eksempel:

  • Den oppretter serien med tall i rekkefølge for en vektor.

    > xx
    Utgang: [1] 2 3 4 5 6 7 8
  • % i% Denne operatøren brukes til å identifisere om et element tilhører en vektor.
    Eksempel

    > xyy% i% x
    Utgang: [1] SANT

R Opplæring: Datatyper

Datatyper brukes til å lagre informasjon. I R trenger vi ikke å erklære en variabel som en datatype. Variablene tildeles R-objekter, og datatypen til R-objektet blir datatypen til variabelen.Det er hovedsakelig seks datatyper til stede i R:

La oss gå nærmere inn på hver av dem:

Vector : En vektor er en sekvens av dataelementer av samme grunnleggende type. Eksempel:

vtr = (1, 3, 5, 7 9)

eller

vtr<- (1, 3, 5 ,7 9)

Det er 5 atomvektorer, også betegnet som fem klasser av vektorer.

Liste : Lister er R-objektene som inneholder elementer av forskjellige typer som & minus tall, strenger, vektorer og en annen liste inne i den.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = liste (n, s, SANT) > x

Produksjon -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] SANN

Arrays : Arrays er R-dataobjektene som kan lagre data i mer enn to dimensjoner. Det tar vektorer som inngang og bruker verdiene i dim-parameteren for å lage en matrise.

vektor1<- c(5,9,3) vektor2<- c(10,11,12,13,14,15) resultat<- array(c(vector1,vector2),dim = c(3,3,2))

Produksjon -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Arrays : Matriser er R-objektene der elementene er ordnet i et todimensjonalt rektangulært oppsett. En matrise opprettes ved hjelp av funksjonen matrise (). Eksempel: matrise (data, nrow, ncol, byrow, dimnames) hvor,

data er inngangsvektoren som blir dataelementene til matrisen.

er antall rader som skal opprettes.

ncol er antall kolonner som skal opprettes.

byrå er en logisk ledetråd. Hvis SANT, er inngangsvektorelementene ordnet etter rad.

dimname er navnene som er tildelt radene og kolonnene.

>Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) >Mat
Produksjon :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Faktorer : Faktorer er dataobjektene som brukes til å kategorisere dataene og lagre dem som nivåer. De kan lagre både strenger og heltall. De er nyttige i dataanalyse for statistisk modellering.

> data<- c('East','West','East','North','North','East','West','West“,'East“) > faktor_data<- factor(data) > faktor_data

Produksjon :

[1] Øst vest øst nord nord øst vest vest øst Nivåer: Øst Nordvest

Datarammer : En dataramme er en tabell eller en todimensjonal matriselignende struktur der hver kolonne inneholder verdier av en variabel, og hver rad inneholder ett sett verdier fra hver kolonne.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > merker = c (623,3,515,2,611,0,729,0,843,25) > std. data<- data.frame(std_id, std_name, marks) > std. data

Produksjon :

std_id std_name merker 1 1 Rick 623.30 2 2 Og 515,20 3 3 Michelle 611,00 4 4 Ryan 729,00 5 5 Gary 843,25

Etter dette kommer vi til slutten av forskjellige datatyper i R. La oss nå gå videre i R Tutorial-bloggen og forstå et annet nøkkelbegrep - flytkontrolluttalelser.

R Opplæring: Flow Control Statements

Uttalelser om flytkontroll spiller en veldig viktig rolle, ettersom de lar deg kontrollere gjennomføringsflyten av et skript i en funksjon. De mest brukte flytkontrolluttalelsene er representert i bildet nedenfor:

La oss nå diskutere hver enkelt av dem med eksempler.

R Opplæring: Selector Statements

  • Hvis kontrollerklæring : Denne kontrollerklæringen evaluerer en enkelt tilstand. Det er ganske enkelt, siden det bare har et enkelt nøkkelord 'hvis' etterfulgt av tilstanden og deretter visse sett med utsagn som må utføres i tilfelle det er sant. Se flytskjemaet nedenfor for å få en bedre forståelse:

I dette flytskjemaet vil koden svare på følgende måte:

  1. Først og fremst vil den gå inn i løkken der den sjekker tilstanden.
  2. Hvis vilkåret er sant, vil betinget kode eller de skriftlige uttalelsene bli utført.
  3. Hvis tilstanden er falsk, blir utsagnene ignorert.

Nedenfor er et eksempel på hvis kontrolluttalelse i R. Prøv å kjøre dette eksemplet i R Studio.

x = 2 gjenta {x = x ^ 2 utskrift (x) hvis (x> 100) {break}

Utgang:

[1] 4 [1] 16 [1] 256
  • Hvis annet kontrollerklæring :Eksamens type kontrollerklæringevaluerer en gruppe forhold og velger utsagnene. Se flytskjemaet nedenfor for å få en bedre forståelse:

I dette flytskjemaet vil koden svare på følgende måte:

  1. Først og fremst vil den gå inn i løkken der den sjekker tilstanden.
  2. Hvis tilstanden er oppfylt, blir de første 'if' uttalelsene utført.
  3. Hvis tilstanden er falsk, går den til 'annet hvis' -tilstand, og hvis den er sant, blir 'annet hvis' -koden utført.
  4. Til slutt, hvis 'annet hvis' koden også er falsk, vil den gå til 'annet' kode og den blir utført. Dette betyr at hvis ingen av disse forholdene er sanne, blir 'annet' -uttalelsen utført.

Nedenfor er et eksempel på hvis ellers kontrolluttalelse i R. Prøv å kjøre dette eksemplet i R Studio.

x5) {utskrift ('x er større enn 5')} annet hvis (x == 5) {utskrift ('x er lik 5')} annet {utskrift ('x er ikke større enn 5')}

Produksjon:

[1] 'x er lik 5'
  • Bytt uttalelser : Disse kontrolluttalelsene brukes i utgangspunktet til å sammenligne et bestemt uttrykk med en kjent verdi. Se flytskjemaet nedenfor for å få en bedre forståelse:

I dette Switch-tilfellet flytskjema vil koden svare i følgende trinn:

  1. Først og fremst vil det gå inn i brytervesken som har et uttrykk.
  2. Deretter vil den gå til sak 1-tilstand, sjekker verdien som sendes til tilstanden. Hvis det er sant, vil Statement block utføres. Etter det vil den bryte fra den bryter saken.
  3. I tilfelle det er usant, vil det bytte til neste sak. Hvis tilfelle 2 er sant, vil den utføre uttalelsen og bryte fra den saken, ellers vil den igjen hoppe til neste sak.
  4. La oss si at du ikke har spesifisert noe tilfelle, eller at det er feil input fra brukeren, så vil det gå til standardtilfelle der det vil skrive ut standarduttalelsen.

Nedenfor er et eksempel på bryteruttalelse i R. Prøv å kjøre dette eksemplet i R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Utgang:

[1] 275

R Opplæring: Loop Statements

Sløyfer hjelper deg å gjenta visse sett med handlinger slik at du ikke trenger å utføre dem gjentatte ganger. Tenk deg at du må utføre en operasjon 10 ganger. Hvis du begynner å skrive koden for hver gang, øker lengden på programmet, og det vil være vanskelig for deg å forstå det senere. Men samtidig ved å bruke en sløyfe, hvis jeg skriver den samme utsagnet i en sløyfe, sparer det tid og gjør det lettere for kodelesbarhet. Det blir også mer optimalisert med hensyn til kodeeffektivitet.

I bildet ovenfor, ‘ gjenta' og ‘ samtidig som 'Uttalelser hjelper deg med å utføre et visst sett med regler til tilstanden er oppfylt, men' til' er en loop-setning som brukes når du vet hvor mange ganger du vil gjenta en setningsblokk. Nå, hvis du vet at du vil gjenta det 10 ganger, vil du gå med 'for' uttalelse, men hvis du ikke er sikker på hvor mange ganger du vil at koden skal gjentas, vil du gå med 'gjenta' eller 'while' løkke.

La oss diskutere hver enkelt av dem med eksempler.

  • Gjenta : Gjenta sløyfen hjelper deg med å utføre det samme settet med kode igjen og igjen til en stoppbetingelse er oppfylt. Se flytskjemaet nedenfor for å få en bedre forståelse:

I flytskjemaet ovenfor vil koden svare i følgende trinn:

  1. Først og fremst vil den angi og utføre et sett med kode.
  2. Deretter vil den sjekke tilstanden. Hvis det er sant, vil det gå tilbake og utføre det samme settet med kode igjen til det er ment å være falsk.
  3. Hvis det blir funnet å være falsk, vil det gå ut av sløyfen.
  • Samtidig som : While-setningen hjelper også til å utføre det samme settet med kode igjen og igjen til en stoppbetingelse er oppfylt. Se flytskjemaet nedenfor for å få en bedre forståelse:

I flytskjemaet ovenfor vil koden svare i følgende trinn:

  1. Først av alt vil det sjekke tilstanden.
  2. Hvis det blir funnet at det er sant, vil det utføre kodesettet.
  3. Deretter sjekker den igjen tilstanden, hvis den er sant, vil den utføre den samme koden igjen. Så snart tilstanden er funnet å være falsk, går den umiddelbart ut av sløyfen.

Nedenfor er et eksempel på mens uttalelse i R. Prøv å kjøre dette eksemplet i R Studio.

x = 2 mens (x<1000) { x=x^2 print(x) } 

Produksjon:

4 16 256 65 536

Så du må lure på hvordan disse to utsagnene er forskjellige? La meg fjerne tvilen din!
Her er den største forskjellen mellom gjentakelsen og påstanden at den endres med hensyn til tilstanden din. Samtidig som loop definerer i utgangspunktet når du skal gå inn i loop for å utføre uttalelsene og gjenta loop definerer når du drar fra loop etter utførelsen av uttalelsene. Så disse to utsagnene er kjent som entry control loop og exit control loop. Det er slik mens og gjentatte uttalelser er forskjellige.

  • For løkke: For sløyfer brukes når du trenger å utføre en kodeblokk flere ganger. Se flytskjemaet nedenfor for å få en bedre forståelse:

I flytskjemaet ovenfor vil koden svare i følgende trinn:

  1. Først av alt er det initialisering der du spesifiserer hvor mange ganger du vil at loop skal gjentas.
  2. Deretter sjekker den tilstanden. Hvis tilstanden er oppfylt, vil den utføre kodesettet for det angitte antall ganger.
  3. Så snart tilstanden er funnet å være falsk, går den umiddelbart ut av sløyfen.

Nedenfor er et eksempel på uttalelse i R. Prøv å kjøre dette eksemplet i R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Utgang:

7 19 25 65 45

Deretter la oss gå til vårt siste sett med uttalelser i R Tutorial-bloggen, dvs. hopputtalelser.

R Opplæring: Jump Statements

Break Statement : Break uttalelser hjelper til med å avslutte programmet og gjenopptar kontrollen til neste uttalelse som følger sløyfen. Disse uttalelsene brukes også i bryterveske. Se flytskjemaet nedenfor for å få en bedre forståelse:

I flytskjemaet ovenfor vil koden svare i følgende trinn:

  1. Først og fremst vil den gå inn i løkken der den sjekker tilstanden.
  2. Hvis sløyfetilstanden er falsk, går den direkte ut av sløyfen.
  3. Hvis tilstanden er oppfylt, vil den sjekke bruddtilstanden.
  4. Hvis bruddtilstand er oppfylt, eksisterer den fra sløyfen.
  5. Hvis bruddtilstanden er falsk, vil den utføre utsagnene som er igjen i løkken og deretter gjenta de samme trinnene.

Nedenfor er et eksempel på hopputtrykk i R. Prøv å kjøre dette eksemplet i R Studio.

x<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Produksjon:

[1] 1 [1] 2

Neste uttalelse : En neste setning brukes når du vil hoppe over gjeldende iterasjon av sløyfen uten å avslutte den. Neste uttalelse er ganske lik ‘fortsett’ i andre programmeringsspråk. Se flytskjemaet nedenfor for å få en bedre forståelse:

I flytskjemaet ovenfor vil koden svare i følgende trinn:

  1. Først og fremst vil den gå inn i løkken der den sjekker tilstanden.

  2. Hvis sløyfetilstanden er falsk, går den direkte ut av sløyfen.

  3. Hvis sløyfetilstanden er sann, vil den utføre blokk 1-setninger.

  4. Etter det vil den se etter ‘neste’ uttalelse. Hvis den er tilstede, vil ikke uttalelsene etter det bli utført i samme iterasjon av sløyfen.

  5. Hvis ‘neste’ uttalelse ikke er til stede, vil alle uttalelsene utføres.

Nedenfor er et eksempel på neste uttalelse i R. Prøv å kjøre dette eksemplet i R Studio.

summer sifrene i et heltall java
for (i i 1:15) {if ((i %% 2) == 0) {neste} skriv ut (i)}

Utgang:

1 3 5 7 9 11 13 15

Dette er slutten på R-opplæringsbloggen. Jeg håper dere er klare over hvert konsept som jeg har diskutert ovenfor. Følg med, min neste blogg vil være på R-trening hvor jeg skal forklare noen flere konsepter om R i detalj med eksrikelig.

Nå som du har forstått grunnleggende om R, sjekk ut av Edureka, et pålitelig online læringsfirma med et nettverk av mer enn 250 000 fornøyde elever spredt over hele verden. Edurekas Data Analytics med R-opplæring vil hjelpe deg med å få ekspertise innen R-programmering, datamanipulering, utforskende dataanalyse, datavisualisering, datautvinning, regresjon, sentimentanalyse og bruk av R Studio for virkelige casestudier på detaljhandel, sosiale medier.

Har du et spørsmål til oss? Vennligst nevn det i kommentarfeltet i denne 'R Tutorial' -bloggen, så kommer vi tilbake til deg så snart som mulig.