R-programmering - Nybegynnerguide til R-programmeringsspråk



Denne bloggen om R-programmering introduserer deg for R og hjelper deg med å forstå de forskjellige grunnleggende konseptene for R-programmering i detalj med eksempler.

R er et av de mest populære analyseverktøyene. Men bortsett fra å bli brukt til analyse, er R også et programmeringsspråk.Med sin vekst i IT-bransjen er det en blomstrende etterspørsel etter dyktige eller med forståelse av R som begge, et dataanalyseverktøy og et programmeringsspråk.I denne bloggen vil jeg hjelpe deg med å forstå de forskjellige grunnleggende faktorene i R-programmering. I vår s urolig Blogg ,vi har diskutert Hvorfor trenger vi Analytics, hva er forretningsanalyse, hvorfor og hvem bruker R.

I denne bloggen vil vi forstå kjernebegrepene nedenfor i R-programmering i følgende rekkefølge:





endelig og avslutt i Java
  1. Variabler
  2. Datatyper
  3. Dataoperatører
  4. Betinget erklæring
  5. Sløyfer
  6. Funksjoner

Du kan gå gjennom webinaropptaket av R Programming Language der instruktøren vår har forklart emnene på en detaljert måte med eksempler som vil hjelpe deg å forstå R-programmering bedre.

R-programmering for nybegynnere | R Opplæring i programmeringsspråk | Edureka



Så la oss gå videre og se på det første konseptet med R-programmering - variabler.

R Programmering: Variabler

Variabler er ikke annet enn et navn til et minneplass som inneholder en verdi. En variabel i R kan lagre numeriske verdier, komplekse verdier, ord, matriser og til og med en tabell. Overraskende, ikke sant?

Variabel - R-programmering - Edureka

Fig: Opprettelseav variabler



Ovenstående bilde viser oss hvordan variabler opprettes og hvordan de lagres i forskjellige minneblokker. I R trenger vi ikke deklarere en variabel før vi bruker den, i motsetning til andre programmeringsspråk som Java, C, C ++, etc.

La oss gå videre og prøve å forstå hva som er en datatype og de forskjellige datatypene som støttes i R.

R Programmering: Datatyper

I R blir ikke en variabel deklarert av noen datatype, men den får datatypen til R-objektet tilordnet den. Så R kalles et dynamisk skrevet språk, noe som betyr at vi kan endre en datatype av samme variabel igjen og igjen når vi bruker den i et program.

Datatyper spesifiserer hvilken type verdi en variabel har og hvilken type matematiske, relasjonelle eller logiske operasjoner som kan brukes på den uten å forårsake en feil. Det er mange datatyper i R, men nedenfor er de mest brukte:

La oss nå diskutere hver av disse datatypene individuelt, med utgangspunkt i vektorer.

Vektorer

Vektorer er de mest grunnleggende R-dataobjektene, og det er seks typer atomvektorer. Nedenfor er de seks atomvektorene:

Logisk : Den brukes til å lagre logisk verdi som EKTE eller FALSK .

Numerisk : Den brukes til å lagre både positive og negative tall inkludert reelt tall.

F.eks .: 25, 7.1145, 96547

Heltall : Den inneholder alle heltallene, dvs. alle positive og negative heltall.

F.eks .: 45.479, -856.479, 0

Kompleks : Disse har formen x + yi, der x og y er numeriske og i representerer kvadratroten -1.

Eg: 4+3i

Karakter : Den brukes til å lagre enten et enkelt tegn, en gruppe tegn (ord) eller en gruppe ord sammen. Tegnene kan defineres i enten enkle sitater eller doble anførselstegn.

F.eks .: 'Edureka', 'R er morsomt å lære'.

Generelt defineres og initialiseres en vektor på følgende måte:

Vtr = c (2, 5, 11, 24) Eller Vtr<- c(2, 5, 11 , 24)

La oss gå videre og forstå andre datatyper i R.

Liste

Lister er ganske like vektorer, men lister er R-objektene som kan inneholde elementer av forskjellige typer som & minus tall, strenger, vektorer og en annen liste inne i den.

F.eks .:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Produksjon:

[[1]] [1] 'Hei' 'Hei' 'Hvordan gjør du '[[2]] [1] 22.5 [[3]] [1] 14965 [[4]] [1] SANT

Matrise

Matrise er R-objektet der elementene er ordnet i et todimensjonalt rektangulært oppsett.

Den grunnleggende syntaksen for å lage en matrise i R er & minus

 matrise (data, nrow, ncol, byrow, dimnames) 

Hvor:

  • data er inngangsvektoren som blir dataelementene til matrisen.
  • er antall rader som skal opprettes.
  • ncol er antall kolonner som skal opprettes.
  • byrå er en logisk ledetråd. Hvis SANN, er inngangsvektorelementene ordnet etter rad.
  • dimname er navnene som er tildelt radene og kolonnene.

Eksempel:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Produksjon:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ARRAY

Arrays i R er dataobjekter som kan brukes til å lagre data i mer enn to dimensjoner. Det tar vektorer som inngang og bruker verdiene i Nei parameter for å opprette en matrise.

Den grunnleggende syntaksen for å lage en matrise i R er & minus

 array (data, dim, dimnames) 

Hvor:

  • data er inngangsvektoren som blir dataelementene i matrisen.
  • Nei er dimensjonen til matrisen, hvor du passerer antall rader, kolonne og antall matriser som skal opprettes av nevnte dimensjoner.
  • dimname er navnene som er tildelt radene og kolonnene.

Eksempel:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Produksjon:

, , en [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Dataramme

En dataramme er en tabell eller en todimensjonal matriselignende struktur der hver kolonne inneholder verdier for en variabel og hver rad inneholder ett sett med verdiertilhver kolonne. Nedenfor er noen av egenskapene til en dataramme som må vurderes hver gang vi jobber med dem:

  • Kolonnenavnene skal være tomme.
  • Hver kolonne skal inneholde samme mengde dataelementer.
  • Dataene som er lagret i en dataramme kan være av numerisk, faktor- eller karaktertype.
  • Radnavnene skal være unike.

Eksempel:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Sales', 'Finance', 'Marketing', 'HR ',' FoU ') emp. Data<- data.frame(emp_id, emp_name, dept) emp.data 

Produksjon:

emp_id emp_name avd 1 100 John Salg 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary FoU

Så nå som vi har forstått de grunnleggende datatypene R, er det på tide at vi dykker ned i R ved å forstå konseptene til dataoperatører.

R Programmering: Dataoperatører

Det er hovedsakelig 4 dataoperatører i R, de er som vist nedenfor:

Aritmetiske operatører : Disse operatørene hjelper oss med å utføre de grunnleggende aritmetiske operasjonene som addisjon, subtraksjon, multiplikasjon, etc.

Tenk på følgende eksempel:

num1 = 15 num2 = 20 num3 = 0 # tilleggsnummer3 = num1 + num2 num3 #substraksjon num3 = num1 - num2 num3 #multiplikasjon num3 = num1 * num2 num3 #divisjon num3 = num1 / num2 num3 #modul num3 = num1 %% num2 num3 #eksponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 #gulvdeling num3 = num1% /% num2 num3

Produksjon:

[1] 35 [femten [1] 300 [1] 0,75 [1] 15 [1] 125 [elleve

Relasjonsoperatører : Disse operatørene hjelper oss med å utføre relasjonsoperasjoner som å sjekke om en variabel er større enn, mindre enn eller lik en annen variabel. Resultatet av en relasjonsoperasjon er alltid en logisk verdi.

Tenk på følgende eksempler:

num1 = 15 num2 = 20 #ekvivalenter til num3 = (num1 == num2) num3 # ikke lik num3 = (num1! = num2) num3 # mindre enn num3 = (num1 num2) num3 # mindre enn lik num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Produksjon:

[1] FALSK [1] SANT [1] SANT [1] FALSK [1] SANT [1] FALSK

Oppdragsoperatører: Disse operatorene brukes til å tilordne verdier til variabler i R. Oppgaven kan utføres ved å bruke enten tildelingsoperatøren(<-) eller er lik operator (=). Verdien av variabelen kan tildeles på to måter, venstre oppgave og høyre oppgave.

LogiskOperatører: Disse operatørene sammenligner de to enhetene og brukes vanligvis med boolske (logiske) verdier som ‘og’, ‘eller’og'ikke'.


R-programmering: Betinget utsagn

  1. Hvis uttalelse: If-setningen hjelper deg med å evaluere et enkelt uttrykk som en del av flyten. For å utføre denne evalueringen trenger du bare å skrive søkeordet If etterfulgt av uttrykket som skal evalueres. Flytskjemaet nedenfor vil gi deg en ide om hvordan If-setningen styrer strømmen av en kode: Tenk på følgende eksempel:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Produksjon:

[1] 'Num1 er mindre eller lik Num2'
  • Annet hvis uttalelse: Else if-setningen hjelper deg med å utvide grener til strømmen opprettet av If-setningen og gi deg muligheten til å evaluere flere forhold ved å opprette nye grener av flyt. Flyten nedenfor vil gi deg en ide om hvordan den andre hvis uttalelsen forgrener strømmen av koden:

    Tenk på følgende eksempel:

    Num1 = 5 Num2 = 20 hvis (Num1 Num2) {print ('Num2 er mindre enn Num1')} ellers hvis ('Num1 == Num2) {print (' Num1 og Num2 er like ')}

    Produksjon:

    [1] 'Num1 er mindre enn Num2'

  • Annet utsagn: Den andre uttalelsen brukes når alle de andre uttrykkene er sjekket og funnet ugyldige. Dette vil være den siste uttalelsen som blir utført som en del av If - Else if filialen. Under flow vil du gi deg en bedre ide om hvordan Else endrer strømmen av koden:

Tenk på følgende eksempel:

javascript varsel pålogging for å laste ned
Num1 = 5 Num2 = 20 hvis (Num1 Num2) {print ('Num2 er mindre enn Num1')} ellers print ('Num1 og Num2 er like')}

Produksjon:

[1] 'Num1 og Num2 er like'

R Programmering: Sløyfer

En løkkeerklæring lar oss utføre en uttalelse eller en gruppe utsagn flere ganger. Det er hovedsakelig 3 typer løkker i R:

  1. gjenta Loop : Den gjentar en uttalelse eller en gruppe utsagn mens en gitt tilstand er SANT. Gjenta sløyfe er det beste eksemplet på en utgangsstyrt sløyfe der koden først utføres og deretter blir tilstanden sjekket for å avgjøre om kontrollen skal være inne i sløyfen eller gå ut av den. Nedenfor er strømmen av kontroll i en repetisjonssløyfe:
    La oss se på eksemplet nedenfor for å forstå hvordan vi kan bruke repeterende sløyfe til å legge til n tall til summen når overstiger 100:

    x = 2 gjenta {x = x ^ 2 utskrift (x) hvis (x> 100) {break}

    Produksjon:

    [1] 4 [1] 16 [1] 256
  2. mens Loop : Jegt hjelper til med å gjenta en uttalelse eller gruppe utsagn mens en gitt tilstand er SANT. Mens sløyfe, sammenlignet med gjentakelsessløyfen, er litt annerledes, er det et eksempel på en inngangsstyrt sløyfe der tilstanden først blir sjekket, og bare hvis tilstanden blir funnet å være sann, leveres kontrollen inne i sløyfen for å utføre koden . Nedenfor er strømmen av kontroll i en stundsløyfe:
    La oss se på eksemplet nedenfor for å legge til summen av kvadrater for de første 10 tallene og forstå hvordan mens løkken fungerer bedre:

    num = 1 sumn = 0 mens (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Produksjon:

    [elleve [femten [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. for Loop : Den brukes til å gjenta et utsagn eller en gruppe for et fast antall ganger. I motsetning til repetisjon og mens loop, brukes for loop i situasjoner der vi er klar over hvor mange ganger koden må utføres på forhånd. Det ligner på mens sløyfen der tilstanden først blir sjekket, og da blir bare koden skrevet inni kjørt. La oss se strømmen av kontroll for for loop nå:

La oss nå se på et eksempel der vi skal bruke for loop til å skrive ut de første 10 tallene:

for (x i 1:10) {print (x)}

Produksjon:

[elleve [1] 2 [1. 3 [1] 4 [femten [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R Programmering: Funksjoner

En funksjon er en blokk med organisert, gjenbrukbar kode som brukes til å utføre en enkelt, relatert handling. Det er hovedsakelig to typer funksjoner i R:

Forhåndsdefinerte funksjoner : Disse er innebygde funksjoner som kan brukes av brukeren til å gjøre sitt arbeid lettvintr. F.eks .: mean( x) , sum( x) , kvmt ( x ), toupper( x ), etc.

Brukerdefinert Funksjoner: Disse funksjonene er opprettet av brukeren for å oppfylle et bestemt krav fra brukeren. Nedenfor er syntaksen for å opprette en funksjon iR:

 func  nasjonens navn  <– funksjon (arg_1, arg_2 og hellip){ // Funksjonslegeme }

Tenk på følgende eksempel på en enkel funksjon for å generere summen av kvadrateneav2 tall:

sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Utgang: [1] 25

Jeg håper du har likt å lese denne R-programmeringsbloggen. Vi har dekket alt det grunnleggende om R i denne opplæringen, slik at du kan begynne å øve nå. Etter denne R-programmeringsbloggen kommer jeg med flere blogger på R for Analytics, så følg med.

Nå som du har forstått grunnleggende om R, sjekk ut av Edureka, et pålitelig online læringsfirma med et nettverk av mer enn 250 000 fornøyde elever spredt over hele verden. Edurekas Data Analytics med R-opplæring vil hjelpe deg med å få ekspertise innen R-programmering, datamanipulering, utforskende dataanalyse, datavisualisering, datautvinning, regresjon, sentimentanalyse og bruk av RStudio for case-studier i det virkelige liv på detaljhandel, sosiale medier.

Har du et spørsmål til oss? Vennligst nevn det i kommentarfeltet på denne 'R-programmering' -bloggen, så kommer vi tilbake til deg så snart som mulig.