Hvordan “lærer maskinprogrammer”?

I denne artikel ser vi på to maskinlærings (ML) teknikker, Naive Bayes klassifikator og neurale netværk og afmystificerer, hvordan de fungerer.

Med al hype omkring selvkørende biler og videospilsspilende AI-robotter, er det værd at tage et skridt tilbage og minde os selv om, hvordan maskinindlæringsprogrammer faktisk "lærer". I denne artikel ser vi på to maskinlærings (ML) teknikker - spamfiltre og neurale netværk - og afmystificerer, hvordan de fungerer.

Og hvis du ikke er sikker på, hvad maskinlæring endda er, skal du læse om forskellen mellem kunstig intelligens, maskinlæring og dyb læring.

Et simpelt eksempel: Naive Bayes Classifier

En almindelig maskinlæringsalgoritme er Naive Bayes-klassificeringsenheden, der bruges til at filtrere spam-e-mails. Det holder beskeder som "Nigerian Prince Needs Monetary Assistance!" Ud af din indbakke. Så hvordan fungerer det?

Hver gang du klikker på knappen "Marker som spam", opdaterer du en gigantisk database med eksempler på spam-e-mails. Med disse oplysninger kan et computerprogram indsamle statistik om forskellige ord eller sætninger. For eksempel kan det bemærkes, at 25% af spam-e-mails indeholder udtrykket "mandlig forbedring", eller at 30% indeholder udtrykket "hurtige penge nu".

Med disse numre har Naive Bayes-klassificeringen nu alle de oplysninger, den har brug for for at markere indgående e-mails som enten legitime eller spam. Når du modtager en ny meddelelse, søger algoritmen statistikker over alle ordene i den. Derefter kombineres disse statistikker med en vis matematik (specifikt en sandsynlighedsfaktor kaldet Bayes-regel) for at klassificere e-mail som spam eller ej. Det er det!

Vi har selvfølgelig glemt over antallet, der går i denne algoritme, men den egentlige ”lærings” -proces for dette ML-program er ganske enkelt. Det er bare at opdatere statistikker om ord / sætninger (f.eks. 40% af e-mails med udtrykket "Nigerian Prince" er spam). Der er ikke noget mystisk ved, hvordan dette program fungerer.

En uheldig bivirkning af spamfiltrering

Et komplekst eksempel: neurale netværk

En ML-algoritme, der vokser i popularitet, er neurale netværk. I juli sidste år annoncerede Google, at det brugte neurale netværk til at skære ned på omkostningerne til køling af datacentre med hele 40%. For at reducere omkostningerne havde de brug for en måde at forudsige, hvordan deres PUE (effektforbrugseffektivitet) ændres med hensyn til variabler som serverbelastning, antal vandpumper, antal køletårne ​​og andre datacenterattributter.

Google bruger også maskinlæring til at forudsige parkeringsvanskeligheder, og det er kun to af mange anvendelser af maskinlæring. En sådan beregning er for kompliceret til, at en ingeniør kan formulere for hånd, så de brugte et neuralt netværk.

Googles neurale netværk er komplicerede, men alt hvad du behøver at vide er, at det indeholder parametre, der bliver opdateret, når du indtaster data. "Data" i sammenhæng med datacentereksemplet betyder PUE-niveauer, serverbelastning, # vandpumper osv. På forskellige tidspunkter. Når disse parametre bliver tilpasset, forbedres det neurale netværks evne til nøjagtigt at beregne PUE. Slutresultatet er et program, der kan fortælle dig, hvad en menneskelig ingeniør ikke kunne - hvordan deres energieffektivitet ændres baseret på deres datacenter-kølingskonfiguration.

Google brugte denne algoritme for at opnå det fantastiske 40% fald i omkostninger. Sammenfattende “lærte” Googles neurale netværk, hvordan man forudsiger PUE baseret på konfigurationen af ​​datacentret. Men husk, at denne "læring" -proces ikke var noget mystisk. Det var bare at finpusse parametre - dvs. faktiske tal - i deres neurale netværk for at gøre det til PUE-skøn mere nøjagtige.

Vil du have alle de nyeste fremskridt og teknisk nyheder sendt direkte til din indbakke?

Oprindeligt offentliggjort på www.leverege.com