Siste maskinlæringsprosjekter å prøve i 2019



Denne artikkelen vil gi deg omfattende kunnskap om maskinlæringsprosjekter i bransjen og gjennombruddene som er gjort på dette området.

er helt klart et felt som har sett sprø fremgang de siste par årene. Denne trenden og fremskrittene har skapt mange jobbmuligheter i bransjen. Behovet for Machine Learning Engineers er høyt etterspurt, og denne økningen skyldes teknologien under utvikling og generering av enorme mengder data aka Big Data. Så i denne artikkelen vil jeg diskutere de mest fantastiske maskinlæringsprosjektene man absolutt bør kjenne til og jobbe med, i følgende rekkefølge:

Hva er maskinlæring?

Machine Learning er et konsept som lar maskinen lære av eksempler og erfaringer, og det også uten å være eksplisitt programmert. Så i stedet for at du skriver koden, mater du data til den generiske algoritmen, og algoritmen / maskinen bygger logikken basert på de gitte dataene.





Hvem er en ML-ingeniør

Trinn for maskinlæring

Enhver maskinlæringsalgoritme følger et vanlig mønster eller trinn.



Samle data: Dette trinnet innebærer innsamling av alle relevante data fra forskjellige kilder

Data Wrangling: Det er prosessen med å rense og konvertere 'rådata' til et format som gir praktisk forbruk

Analyser data: Data analyseres for å velge og filtrere dataene som kreves for å forberede modellen



Togalgoritme: Algoritmen blir trent på treningsdatasettet, der algoritmen forstår mønsteret og reglene som styrer dataene

Testmodell: Testdatasettet bestemmer nøyaktigheten til modellen vår.

Utplassering: Hvis hastigheten og nøyaktigheten til modellen er akseptabel, bør den modellen distribueres i det virkelige systemet. Etter at modellen er utplassert basert på ytelsen, blir modellen oppdatert og forbedret hvis det er en dip i ytelsen, blir modellen omskolert.

Typer maskinlæring

Maskinlæring er underkategorisert i tre typer:

Veiledet læring: Det er den der du har inngangsvariabler (x) og en utgangsvariabel (Y), og du bruker en algoritme for å lære kartleggingsfunksjonen fra inngangen til utgangen.

Uovervåket læring: Noen ganger er de gitte dataene ustrukturerte og umerkede. Så det blir vanskelig å klassifisere dataene i forskjellige kategorier. Uovervåket læring hjelper til med å løse dette problemet. Denne læringen brukes til å gruppere inngangsdataene i klasser på grunnlag av deres statistiske egenskaper.

Forsterkningslæring: Det handler om å ta passende tiltak for å maksimere belønningen i en bestemt situasjon.
når det gjelder forsterkningslæring, er det ingen forventet produksjon. Forsterkningsagenten bestemmer hvilke handlinger som skal utføres for å utføre en gitt oppgave. I fravær av et opplæringsdatasett, er det bundet til å lære av sin erfaring.

La oss nå se på noen virkelige maskinlæringsprosjekter som kan hjelpe bedrifter med å generere profitt.

Brukstilfeller for industrien

1. BEVEGELSESTUDIO

Domene: Halv

Fokus: Optimaliser valgprosessen

hvordan du setter opp php

Forretningsutfordring: Motion Studio er det største radioproduksjonshuset i Europa. Med en inntekt på mer enn en milliard dollar, har selskapet besluttet å lansere et nytt reality-show: RJ Star. Responsen på showet er uten sidestykke, og selskapet er oversvømmet med stemmeklipp. Du som ML-ekspert må klassifisere stemmen som en mann / kvinne slik at det første filtreringsnivået blir raskere.

Nøkkelsaker: Stemmeprøve er på tvers av aksenter.

Forretningsfordel: Siden RJ Star er et reality show, tiden for å velge kandidater er veldig kort. Hele showets suksess og dermed fortjenesten avhenger av rask og jevn gjennomføring

importer pandaer som pd import numpy som np importer matplotlib.pyplot som plt importer sjøfødt som sns% matplotlib inline importadvarsler advarsler. filteradvarsler ('ignorere') df = pd.read_csv ('stemmeklassifisering.csv') df.head ()

# Sjekk nei. av poster df.info () df.describe () df.isnull (). sum ()

print ('Shape of Data:', df.shape) print ('Totalt antall etiketter: {}'. format (df.shape [0])) print ('Number of male: {}'. format (df [ df.label == 'mann']. form [0])) utskrift ('Antall kvinner: {}'. format (df [df.label == 'kvinne']. form [0]))

X = df.iloc [:,: -1] print (df.shape) print (X.shape)

fra sklearn.preprocessing importerer LabelEncoder y = df.iloc [:, - 1] gender_encoder = LabelEncoder () y = gender_encoder.fit_transform (y) y fra sklearn.preprocessing import StandardScaler scaler = StandardScaler () scaler.fit (X) X = scaler.transform (X) fra sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0.3, random_state = 100) from sklearn.svm import SVC from sklearn import metrics from sklearn_met , confusion_matrix svc_model = SVC () svc_model.fit (X_train, y_train) y_pred = svc_model.predict (X_test) print ('Accuracy Score:') print (metrics.accuracy_score (y_test, y_pred))

skriv ut (confusion_matrix (y_test, y_pred))

2. LITIONPOWER

Domene: Bil

Fokus: Incentiviser drivere

Forretningsutfordring: Lithionpower er den største leverandøren av elektriske kjøretøybatterier. Drivere leier batteri vanligvis for en dag og bytter det ut med et ladet batteri fra selskapet. Lithionpower har en variabel prisingsmodell basert på førerens kjørehistorikk. Ettersom batteriets levetid avhenger av faktorer som for høy hastighet, avstand kjørt per dag osv. Du som ML-ekspert må lage en klyngemodell der sjåfører kan grupperes sammen basert på kjøredataene.

Nøkkelsaker: Drivere vil bli incentivert basert på klyngen, så gruppering må være nøyaktig.

Forretningsfordeler: Økning i fortjeneste, opptil 15-20% ettersom drivere med dårlig historie vil bli belastet mer.

importer pandaer som pd import numpy som np importer matplotlib.pyplot som plt import seaborn som sns sns.set () # for plot styling% matplotlib inline import advarsler advarsler. filteradvarsler ('ignorere') importer matplotlib.pyplot som plt plt.rcParams [ 'figure.figsize'] = (12, 6) df = pd.read_csv ('driver-data.csv') df.head ()

df.info () df.beskriv ()

fra sklearn.cluster import KMeans #Taking 2 clusters kmeans = KMeans (n_clusters = 2) df_analyze = df.drop ('id', axis = 1) kmeans.fit (df_analyze)

kmeans.cluster_centers_

skriv ut (kmeans.labels_) skriv ut (len (kmeans.labels_))

print (type (kmeans.labels_)) unik, teller = np.unique (kmeans.labels_, return_counts = True) print (dict (zip (unik, teller)))

df_analyze ['cluster'] = kmeans.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_perc', data = df_analyze, hue = 'cluster', palette = 'coolwarm', size = 6, aspekt = 1, fit_reg = Falsk)

# Nå, la oss sjekke klyngene, når n = 4 kmeans_4 = KMeans (n_clusters = 4) kmeans_4.fit (df.drop ('id', axis = 1)) kmeans_4.fit (df.drop ('id', axis = 1)) print (kmeans_4.cluster_centers_) unik, teller = np.unique (kmeans_4.labels_, return_counts = True) kmeans_4.cluster_centers_ print (dict (zip (unik, teller)))

df_analyze ['cluster'] = kmeans_4.labels_ sns.set_style ('whitegrid') sns.lmplot ('mean_dist_day', 'mean_over_speed_perc', data = df_analyze, hue = 'cluster', palette = 'coolwarm', size = 6 aspekt = 1, fit_reg = Falsk)

3. BluEx

Domene: Logistikk

Fokus: Optimal sti

Forretningsutfordring: BluEx er et ledende logistikkselskap i India. Det er kjent for effektiv levering av pakker til kunder. BluEx står imidlertid overfor en utfordring der varebilsjåførene tar en suboptimal vei for levering. Dette medfører forsinkelser og høyere drivstoffkostnader. Du som ML-ekspert må lage en ML-modell ved hjelp av Reinforcement Learning slik at effektiv vei blir funnet gjennom programmet.

Nøkkelsaker: Data har mange attributter, og klassifisering kan være vanskelig.

Forretningsfordeler: Opptil 15% av drivstoffkostnadene kan spares ved å ta den optimale veien.

hvordan du bruker aws cli
importer numpy som np import pylab som plt import nettverkx som nx #Initializing points points_list = [(0,1), (1,5), (5,6), (5,4), (1,2), (2 , 3), (2,7)] goal = 7 mapping = {0: 'Start', 1: '1', 2: '2', 3: '3', 4: '4', 5: '5 ', 6:' 6 ', 7:' 7-Destination '} G = nx.Graf () G.add_edges_from (points_list) pos = nx.spring_layout (G, k = .5, center = points_list [2]) nx .draw_networkx_nodes (G, pos, node_color = 'g') nx.draw_networkx_edges (G, pos, edge_color = 'b') nx.draw_networkx_labels (G, pos) plt.show ()

NO_OF_POINTS = 8 #Inititlaizing R Matrix R = np.matrix (np.ones (form = (NO_OF_POINTS, NO_OF_POINTS))) R * = -1 for punkt i poengliste: skriv ut (punkt) hvis punkt [1] == mål: R [punkt] = 150 annet: R [punkt] = 0 hvis punkt [0] == mål: R [punkt [:: - 1]] = 150 annet: # omvendt av punkt R [punkt [:: - 1]] = 0

R [mål, mål] = 150 R

Q = np.matrix (np.zeros ([NO_OF_POINTS, NO_OF_POINTS])) # Læringsparameteren gamma = 0,8 initial_state = 1 def tilgjengelig_handlinger (state): current_state_row = R [state,] av_act = np.where (current_state_row & ampampampgt = 0 ) [1] retur av_act tilgjengelig_akt = tilgjengelig_handlinger (initialstatus) def sample_next_action (available_actions_range): next_action = int (np.random.choice (available_act, 1)) returnere next_action action = sample_next_action (available_act) def update (current_state, action, gamma) : max_index = np.where (Q [action,] == np.max (Q [action,])) [1] if max_index.shape [0] & ampampampgt 1: max_index = int (np.random.choice (max_index, størrelse = 1)) annet: max_index = int (max_index) max_value = Q [handling, max_index] Q [current_state, action] = R [current_state, action] + gamma * max_value print ('max_value', R [current_state, action] + gamma * max_value) hvis (np.max (Q) & ampampampgt 0): return (np.sum (Q / np.max (Q) * 100)) annet: returner (0) oppdatering (initial_state, action, gamma)

score = [] for i i rekkevidde (700): current_state = np.random.randint (0, int (Q.shape [0])) available_act = available_actions (current_state) action = sample_next_action (available_act) score = update (current_state, action, gamma) scores. append (score) print ('Score:', str (score)) print ('Trained Q matrix:') print (Q / np.max (Q) * 100) # Testing current_state = 0 trinn = [current_state] while current_state! = 7: next_step_index = np.where (Q [current_state,] == np.max (Q [current_state,])) [1] if next_step_index.shape [0] & ampampampgt 1: next_step_index = int (np.random.choice (next_step_index, size = 1)) ellers: next_step_index = int (next_step_index) steps. append (next_step_index) current_state = next_step_index

print ('Most efficient path:') print (trinn) plt.plot (score) plt.show ()

Open Source Machine Learning Prosjekter i 2019

Detektron : Detectron er programvaresystemet på Facebook AI Research som implementerer moderne algoritmer for gjenkjenning av objekter. Den er skrevet på Python og drevet av Caffe2 deep learning framework.

Målet med Detectron er å tilby en høykvalitets kodebase med høy ytelse for gjenkjenningsforskning. Den er designet for å være fleksibel for å støtte rask implementering og evaluering av ny forskning. Den inneholder mer enn 50 ferdig trente modeller.

Densposisjon : Beregning av tett menneskelig pose tar sikte på å kartlegge alle menneskelige piksler av et RGB-bilde til 3D-overflaten av menneskekroppen. DensePose-RCNN er implementert i Detectron-rammeverket.

TensorFlow.js : Det er et bibliotek for utvikling og opplæring av ML-modeller og distribusjon i nettleseren. Det er blitt en veldig populær utgivelse siden den ble utgitt tidligere i år og fortsetter å forbløffe med sin fleksibilitet. Med dette kan du

  • Utvikle ML i nettleseren: Bruk fleksible og intuitive API-er til å bygge modeller fra bunnen av ved hjelp av JavaScript-lineært algebra-bibliotek på lavt nivå eller API på høyt nivålag.
  • Kjør eksisterende modeller : Bruk TensorFlow.js-modellomformere til å kjøre eksisterende TensorFlow-modeller rett i nettleseren.
  • Omskolering Eksisterende modeller: Omskolere eksisterende ML-modeller ved hjelp av sensordata som er koblet til nettleseren, eller andre data på klientsiden.

Waveglow: Machine Learning gjør også store fremskritt innen lydbehandling, og det genererer ikke bare musikk eller klassifisering. WaveGlow er et strømningsbasert generativt nettverk for talesyntese av NVIDIA. Forskerne har også listet opp trinnene du kan følge hvis du vil trene din egen modell fra bunnen av.

Bilde maling : Tenk deg at du har et halvt bilde av en scene, og at du ønsket det fulle landskapet, vel, det er det som maling kan gjøre det for deg. Dette prosjektet er en Keras-implementering av Stanfords Image Outpainting-papir. Modellen ble trent med 3500 utrangerte stranddata med argumentasjon på opptil 10.500 bilder for 25 epoker .

Dette er et fantastisk papir med en detaljert trinnvis forklaring. Et must-eksempel for alle maskinlæringsentusiaster. Personlig er dette mitt favoritt maskinlæringsprosjekt.

Dyp malerisk harmonisering : Vel, snakker om bilder, dette er et mesterverk. Hva denne algoritmen gjør er å ta et bilde som inngang, og hvis du legger til et eksternt element i bildet, blander det elementet inn i omgivelsene som om det er en del av det.

Kan du se forskjellen? Ingen rett? Vel, dette viser oss hvor langt vi har kommet når det gjelder maskinlæring.

DeepMimic: Nå, ta en nærmere titt på bildene her, du ser en stikkfigur som gjør spin-kick, backflip og cartwheel. At venninnen min er forsterkningslæring i aksjon. DeepMimic er en eksempelstyrt dyp forsterkningslæring av fysikkbaserte karakterferdigheter.

Magenta : Magenta er et forskningsprosjekt som utforsker rollen som maskinlæring i prosessen med å skape kunst og musikk. Primært innebærer dette å utvikle nye dyplærings- og forsterkningslæringsalgoritmer for å generere sanger, bilder, tegninger og annet materiale.

Det er også en utforskning i å bygge smarte verktøy og grensesnitt som gjør det mulig for kunstnere og musikere å utvide ( ikke erstatte! ) deres prosesser ved hjelp av disse modellene. Gå og spre vingene dine, lag ditt unike innhold for Instagram eller Soundcloud og bli en influencer.

Så gutter, med dette kommer vi til en slutt på denne fantastiske artikkelen om maskinlæringsprosjekter. Prøv disse eksemplene og gi oss beskjed i kommentarfeltet nedenfor. Jeg håper du ble kjent med den praktiske implementeringen av maskinlæring i bransjen. Edureka’s gjør deg dyktig i teknikker som Supervised Learning, Unsupervised Learning and Natural Language Processing. Det inkluderer opplæring i de siste fremskrittene og tekniske tilnærmingene innen kunstig intelligens og maskinlæring som dyp læring, grafiske modeller og forsterkningslæring