Veiledet læring i Apache Mahout

Supervised Learning er en teknikk for maskinlæring, der en funksjon utledes fra de merkede eksemplene på treningsdata.

Supervised Learning er metoden, der treningsdataene inkluderer både input og ønsket resultat. Å trene systemet med eksempler kalles veiledet læring. Ellers kan opplæring av algoritmen med en lærer også behandles som veiledet læring. Etter å ha trent algoritmen med alle eksempeldata eller merkede data, som har både prediktorene på målvariabelen, kan man trene algoritmen og bruke det usynlige eksemplet for videre klassifisering.



Her er noen av de viktige funksjonene i Supervised Learning in Mahout:

  • Konstruksjonen av en riktig opplæring, validering og testsett (Bok) er avgjørende.
  • Disse metodene er vanligvis raske og nøyaktige.
  • De veiledede læringsmetodene må kunne generalisere.
  • De gir riktige resultater når nye data blir gitt i input uten å vite apriorimål.
  • I noen tilfeller er de riktige resultatene (målene) kjent og gitt i input til modellen under læringsprosessen.

Eksempel på veiledet læring

I tilfelle du vil trene et oppdrag og du får to forskjellige grupper av bilder sammen med de merkede dataene, f.eks. på bildet ovenfor har den ene gruppen bilder av en elefant, og den andre har bilder av en løve. Merkede data innebærer at hvert datasett har en målverdi. I eksemplet ovenfor er datasettet bilder av elefant, mens etiketten som er gitt til det, dvs. 'Elefant' er målverdien til datasettet. Slike merkede datasett brukes til treningsprosessen, slik at treningsalgoritmen kan dra nytte av dette datasettet og bygge en modell, som videre kan brukes til å klassifisere usett eksemplene uten merkede data, eller målvariabelen.



La oss identifisere funksjonene som hjelper til med å identifisere et objekt som en elefant eller en løve:

Funksjonene kunne vært - størrelse, farge, høyde, ørestørrelse, koffert, brosme

sette opp php på windows

Dette kan kalles et funksjonssett, som vil bli brukt til treningsformålet. Dette funksjonssettet vil påvirke den endelige målvariabelen. Disse variablene er kjent som prediktorvariabler fordi de hjelper oss med å bestemme endelig målvariabel . Den endelige variabelen kan også kalles en etikett. Den endelige variabelen her er Elephant / Lion.



table-word

I dette eksemplet er hver av postene i kategoriene, størrelse, farge, høyde, ørestørrelse, koffert og brosme en prediktorvariabel, mens Elephant and Lion er målvariablene. Disse variablene kan behandles som henholdsvis treningseksempler og treningsdatasett.

Supervised Learning er således en måte du trener sammen med etikettene, der du ber algoritmen om å trekke ut visse funksjoner ut av den, og basert på det, når du ser et usett eksempel, vil algoritmen være i stand til å klassifisere den inn i riktig klasse.

Har du et spørsmål til oss? Nevn dem i kommentarfeltet, så kommer vi tilbake til deg.

Relaterte innlegg: