Hva er forutsetningene for maskinlæring?



Denne bloggen om forutsetninger for maskinlæring vil hjelpe deg å forstå de grunnleggende konseptene du trenger å vite før du kommer i gang med maskinlæring.

Machine Learning er utvilsomt den mest etterspurte teknologien i tiden! Hvis du er en nybegynner som kommer i gang med maskinlæring, er det viktig at du kjenner forutsetningene for maskinlæring. Denne bloggen vil hjelpe deg med å forstå de forskjellige konseptene du trenger å vite før du begynner med maskinlæring.

For å få inngående kunnskap om kunstig intelligens og maskinlæring, kan du registrere deg for live av Edureka med 24/7 support og levetidstilgang.





hvordan lage et dynamisk utvalg i java

Her er en liste over emner dekket i denne bloggen:

  1. Forutsetninger for maskinlæring
  2. Forstå maskinlæring med en brukstilfelle

Forutsetninger for maskinlæring

Å komme i gang medMaskinlæring du må være kjent med følgende konsepter:



  1. Statistikk
  2. Lineær algebra
  3. Kalkulus
  4. Sannsynlighet
  5. Programmerings språk

Statistikk

Statistikk inneholder verktøy som kan brukes til å få noe resultat av dataene. Det er beskrivende statistikk som brukes til å transformere rådata til viktig informasjon. Inferensiell statistikk kan også brukes til å få viktig informasjon fra et utvalg av data i stedet for å bruke komplett datasett.

For å lære mer om Statistikk du kan gå gjennom følgende blogger:

Lineær algebra

Lineære algebra-avtalermed vektorer, matriser og lineære transformasjoner. Det er veldig viktig i maskinlæring da det kan brukes til å transformere og utføre operasjoner på datasettet.



Kalkulus

Kalkulus er et viktig felt i matematikk, og det spiller en integrert rolle i mange maskinlæringsalgoritmer. Datasett med flere funksjoner erbrukes til å bygge maskinlæringsmodeller ettersom funksjoner er flere multivariable kalkulasjoner spiller en viktig rolle for å bygge en maskinlæringsmodell. Integrasjoner og differensiering er et must.

Sannsynlighet

Sannsynlighet hjelper til med å forutsi sannsynligheten for hendelser. Det hjelper oss å resonnere at situasjonen kan eller ikke kan skje igjen. For maskinlæring er sannsynlighet en fundament.

Mathematics

For å lære mer om sannsynlighet, kan du gå gjennom dette Blogg.

Programmeringsspråk

Det er viktig å kjenne programmeringsspråk som R og Python for å implementere hele maskinlæringsprosessen. Python og R har begge innebygde biblioteker som gjør det veldig enkelt å implementere maskinlæringsalgoritmer.

Bortsett fra å ha grunnleggende programmeringskunnskap, er det også viktig at du vet hvordan du henter ut, behandler og analyserer data. Dette er en av de viktigste ferdighetene som trengs for maskinlæring.

For å lære mer om programmeringen språk for maskinlæring, kan du gå gjennom følgende blogger:

  1. De beste Python-bibliotekene for datavitenskap og maskinlæring

Machine Learning Use Case

Maskinlæring handler om å lage en algoritme som kan lære av data for å komme med en forutsigelse som hva slags gjenstander som er der på bildet, eller anbefaling, den beste kombinasjonen av medisiner for å kurere den bestemte sykdommen eller spamfiltrering.

Maskinlæring er bygget på matematiske forutsetninger, og hvis du vet hvorfor matematikk brukes i maskinlæring, vil det gjøre det morsomt. Du må kjenne matematikken bak funksjonene du skal bruke og hvilken modell som passer for dataene og hvorfor.

Så la oss starte med et interessant problem med å forutsi boligpriser, ha et datasett som inneholder en historie med forskjellige funksjoner og priser, for nå vil vi vurdere arealet av boareal i kvadratmeter og prisene.

Nå har vi et datasett som inneholder to kolonner som vist nedenfor:

Det må være noen sammenheng mellom disse to variablene for å finne ut at vi trenger å bygge en modell som kan forutsi prisen på hus, hvordan kan vi gjøre det?

La oss graflegge disse dataene og se hvordan de ser ut:

Her er X-aksen prisen per kvadratmeter boareal og Y-aksen er prisen på huset. Hvis vi plotter alle datapunktene, får vi et spredningsdiagram som kan representeres av en linje som vist i figuren ovenfor, og hvis vi legger inn noen data, vil den forutsi noe resultat. Ideelt sett må vi finne en linje som vil krysse maksimale datapunkter.

Her prøver vi å lage en linje som kalles:

Y = mX + c

Denne metoden for å forutsi det lineære forholdet mellom målet (avhengig variabel) og prediktorvariabel (uavhengig variabel) blir betegnet som lineær regresjon. Det lar oss studere og oppsummere en sammenheng mellom to variabler.

  • X = Uavhengig variabel
  • Y = avhengig variabel
  • c = y-skjæringspunkt
  • m = Slop of line

Hvis vi vurderer ligningen har vi verdier for X, som er en uavhengig variabel, så alt vi trenger å gjøre er å beregne verdier for m og c for å forutsi verdien av Y.

Så hvordan finner vi disse variablene?

For å finne disse variablene, kan vi prøve en rekke verdier og prøve å finne ut en linje som krysser det maksimale antallet datapunkter. Men hvordan kan vi finne den beste passformlinjen?

Så for å finne den best tilpassede linjen, kan vi bruke minste kvadraters feilfunksjon som vil finne feilen mellom den virkelige verdien av y og den forventede verdien y`.

Feilfunksjonen minste kvadratene kan vises med følgende ligning:

Ved hjelp av denne funksjonen kan vi finne ut feilen for hvert forutsagte datapunkt ved å sammenligne den med den faktiske verdien til datapunktet. Du tar deretter summeringen av alle disse feilene og kvadrerer dem for å finne ut avviket i spådommen.

Hvis vi legger til den tredje aksen i grafen vår som inneholder alle mulige feilverdier og plotter den i et tredimensjonalt rom, vil det se slik ut:

I bildet ovenfor vil de ideelle verdiene være i den nederste sorte delen som vil forutsi prisene nær det faktiske datapunktet. Neste trinn er å finne best mulige verdier for m og c. Dette kan gjøres ved å bruke optimaliseringsteknikken som kalles gradientnedstigning.

Gradientnedstigning er en iterativ metode, der vi begynner med å initialisere noen verdisett for variablene våre og forbedre dem sakte ved å minimere feilen mellom den faktiske verdien og den forventede verdien.

Nå hvis vi tror at prisene på leiligheten egentlig ikke bare avhenger av prisen per kvadratmeter, er det mange faktorer som antall soverom, bad osv. Hvis vi vurderer disse funksjonene også, vil ligningen se noe ut som dette

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Dette er multilinær regresjon dette tilhører lineær algebra, her kan vi bruke matriser av størrelse mxn der m er funksjoner og n er datapunkter.

La oss vurdere en annen situasjon der vi kan bruke sannsynligheten til å finne husets tilstand for å klassifisere et hus basert på om det er i god eller dårlig stand. For at dette skal fungere, må vi bruke en teknikk kalt Logistisk regresjon som fungerer på sannsynligheten for forekomster representert av en sigmoidfunksjon.

java frontend utvikler CV

I denne artikkelen dekket vi forutsetningene for maskinlæring og hvordan de brukes i maskinlæring. Så i utgangspunktet består den av statistikk, kalkulator, lineær algebra og sannsynlighetsteori. Calculus har teknikker som brukes for optimalisering, lineær algebra har algoritmer som kan fungere på store datasett, med sannsynlighet kan vi forutsi sannsynligheten for forekomster, og statistikk hjelper oss å utlede nyttig innsikt fra utvalget av datasett.

Nå som du kjenner forutsetningene for maskinlæring, er jeg sikker på at du er nysgjerrig på å lære mer. Her er noen få blogger som hjelper deg med å komme i gang med datavitenskap:

Hvis du ønsker å melde deg på et komplett kurs om kunstig intelligens og maskinlæring, har Edureka en spesialkurat som vil gjøre deg dyktig i teknikker som Overvåket læring, Uovervåket læring og Naturlig språkbehandling. Det inkluderer opplæring i de siste fremskrittene og tekniske tilnærminger innen kunstig intelligens og maskinlæring som dyp læring, grafiske modeller og forsterkningslæring.