Modelleringsteknikker i forretningsanalyse med R



Bloggen gir en kort introduksjon av modelleringsteknikker i forretningsanalyse med R.

Ulike modelleringsteknikker:

Vi kan dele alle problemer i mindre prosesser:





Klassifisering - er der vi klassifiserer dataene. F.eks. sykdommer, alle sykdommer viser en viss oppførsel, og vi kan klassifisere dem ytterligere.

For eksempel: sykdommer som reduserer immuniteten, sykdommer som gir hodepine, etc.



Regresjon - innebærer å finne ut forholdet mellom flere variabler.

For eksempel: hvordan et menneskes vekt er relatert til hans høyde.

android studio tutorials for nybegynnere

AnomoliGjenkjenning - er i utgangspunktet en svingning.



For eksempel: I tilfelle høyspenning eller lavspenning.

Et annet eksempel kan inkludere regulert atferd som innebærer å kjøre på høyre eller venstre side basert på land. Anomoliet her er noen som kjører fra det motsatte.

Et annet eksempel kan være nettverksinntrenging. Her logger en autentisert bruker inn på firmaets nettsted, og hvis noen uautentiserte logger på, er det enAn0moly.

Attributt Viktighet - Det gir i utgangspunktet flere attributter, som høyde, vekt, temperatur, hjerterytme. Et poeng å merke seg er at alle disse attributtene er viktige for en oppgave.

tablå data blending venstre bli med

For eksempel: Noen prøver å forutsi, når en person kommer til kontoret. Hvert attributt spiller en viktig rolle, men ikke alle attributter er viktige.

Foreningsregler - I enklere termer er det å analysere eller forutsi neste oppførsel, der det dreier seg om anbefalingsmotoren.

For eksempel: En person som kjøper brød kan også kjøpe melk. Hvis vi analyserer tidligere handlemåter, har alle varene i handlekurven en sammenheng. I dette tilfellet kan det være sannsynlighet for at den som kjøper brød også vil kjøpe melk.

Gruppering - Det er en av de eldste teknikkene innen statistikk. Faktisk kan man alltid modellere ethvert problem, det være seg klassifisering eller klynging, som betyr å gruppere lignende enheter.

For eksempel:

1) Ta en kurv med epler og appelsiner, der vi kan adskille epler fra appelsiner.

2) En viktig brukssak for klynging er helsetjenester. Nesten all statistikk og analyse startet med brukstilfeller av helsetjenester. For å gå dypere, er det et klyngebegrep kalt kohorter (personer med lignende sykdommer), slik at de kan studeres separat fra eksisterende kunder. For eksempel, hvis 10 personer lider av feber og ytterligere 10 personer med hodepine, vil vi finne det som er vanlig mellom dem og generere medisiner.

Funksjonsekstraksjon - I nøyaktighet er utvinningsnøyaktighet, gyldighet og feil ganske relevant. Med andre ord kan funksjonsutvinning betegnes som mønstergjenkjenning.

likheter mellom java og javascript

For eksempel:

Når en bruker skriver inn et begrep i Google-søk, kommer det opp med resultater. Nå er et viktig spørsmål å stille hvordan visste den, hvilken side er relevant og ikke-relevant for begrepet? Dette kan besvares med funksjonsutvinning og mønstergjenkjenning, hvor det legger til fremtredende funksjoner. La oss si at et bilde er gitt, visse kameraer oppdager ansikter, fremhever ansiktet for å gi vakre bilder, som også bruker funksjonsgjenkjenning.

Overvåket læring vs Uovervåket læring

til) Prediksjonskategori - Teknikkene inkluderer regresjon, logistikk, nevrale nettverk og beslutningstrær. Noen eksempler inkluderer svindeloppdagelse (hvor en datamaskin lærer og forutsier neste svindel fra tidligere svindelhistorie). I uten tilsyn læring kan man ikke forutsi med eksempler, da det ikke er noen historiske data.

b) Klassifiseringskategori - Hvis vi tar et eksempel, enten transaksjonen er falske eller ikke, går den inn i klassifiseringskategorien. Her tar vi historiske data og klassifiserer dem med beslutningstrær, eller i tilfelle vi ikke tar noen historiske data i det hele tatt, så begynner vi direkte på data og prøver å utnytte funksjoner alene. For eksempel hvis vi trenger å kjenne de ansatte som sannsynligvis vil forlate organisasjonen eller sannsynligvis vil bli værende. I tilfelle det er en ny organisasjon der vi ikke kan bruke historiske data, kan vi alltid bruke klynging for datautvinning.

c) Letekategori - Dette er en rett frem metode som kommer opp med, hva big data betyr. I uten tilsyn læring kalles det prinsippkomponenter og klynging.

d) Affinitetskategori - her er flere elementer involvert som kryssalg / oppsalg, markedskurvanalyse. I kurvanalysen er det ingen veiledet læring, da det ikke er noen historiske data. Så vi tar data direkte og finner assosiasjoner, sekvensering og faktoranalyse.

Har du et spørsmål til oss? Nevn dem i kommentarfeltet, så kommer vi tilbake til deg.

Relaterte innlegg: