Prediktiv Analytics-prosess i Business Analytics med R



Bloggen gir en kort ide om Predictive Analytics-prosessen i Business Analytics med R

Typisk modelleringsprosess:

I en typisk modelleringsprosess er det viktig å begynne å tegne en hypotese. En RFP (Request for Proposal) mottas og deretter tegnes en hypotese.





hva er kokk og dukke
  1. Bestem riktig datakilde - Her kan kunden gi datakilde, hvis ikke, må vi lete etter en datakilde. Gitt et scenario hvor vi prøver å evaluere hvem som ville vinne valget, gjøres en offentlig analyse av data med kilder som inkluderer sosiale medier, nyhetskanaler eller opinion. Vi må også forstå mengden data som trengs for å analysere problemet. I dette tilfellet ser vi vanligvis etter store prøver, siden det er en valgsak. På den annen side, hvis analysen er gjort på Healthcare, er det vanskelig å gå for en stor befolkning fordi det er en mulighet for ikke å få nok folk til å validere hypotesen. Også kvaliteten på data er veldig viktig.
  2. Pakk ut data - Hvis vi for eksempel tar et populasjonsutvalg, kan vi se på attributter, som høy inntekt, lav inntekt, alder, yrkesaktive befolkning (utenfor stedet), beboere, NRI, dekning av sykehus, etc., for å starte studien . Her trenger vi kanskje ikke så mange attributter for hypotesen. Vi forstår at attributter, for eksempel høy og lav inntekt, kanskje ikke er de medvirkende faktorene for å bestemme hvem som vinner valget. Men alder kan utgjøre en forskjell, da det vil gi en direkte opptelling av hvor mange som skal stemme. Mange ganger kan vi ekskludere mindre brukte attributter eller inkludere attributter som er nyttige. Det kan gå galt i begge tilfeller. Det er grunnen til at analyse er en utfordring.
  3. Masser dataene slik at de passer til verktøyet - Dette er fordi ikke alle verktøy kan akseptere alle data. Enkelte verktøy godtar bare CSV-data eller excel-data. Mangel på verktøy er en utfordring.
  4. Kjør analysen - Denne operasjonen kan utføres ved hjelp av mange analyseteknikker.
  5. Trekke konklusjoner - Analysen gir tall for å være presise. Men det er opp til en bruker å trekke konklusjoner ut av disse tallene. For eksempel, hvis det står 10% eller 20%, må vi forstå hva det betyr? Har det korrelasjon mellom attributt A og attributt B?
  6. Implementere resultater - Det er viktig å implementere konklusjoner for å se resultater i virksomheten. For eksempel kan det konkluderes med at ‘Folk kjøper paraply i regntiden’ som kan føre til flere forretninger. Her må vi implementere konklusjon der vi lager paraply, tilgjengelig i butikker, men da kan det ha ledelsesproblemer. I det øyeblikket statistikken gir resultat, kan implementeringen gå galt.
  7. Overvåk fremdriften - Det siste trinnet her, overvåking spiller en viktig rolle. Overvåking kan gå galt fordi ikke mange organisasjoner ønsker å overvåke fremdriften, og det blir sett på som et ubetydelig trinn. Men overvåking er viktig som vi kan forstå hvis vår forskning og konklusjoner går i riktig retning.

Sjekk også ut denne artikkelen' Korrelasjon betyr ikke årsak 'som gir et innblikk i hvordan analytikere kan gå galt. Et viktig poeng å merke seg i dette diagrammet er at Running Analysis er det eneste trinnet der maskinen er ansvarlig og utover det er opp til et menneske som til slutt vil bestemme hvordan forskningen gjøres.

Har du spørsmål til oss? Nevn dem i kommentarfeltet, så kommer vi tilbake til deg.



eksempler på pythonklasser og objekter

Relaterte innlegg: