Hvert enkelt Machine Learning-kursus på internettet, rangordnet efter dine anmeldelser

Trærobot af Kaboompics

For halvandet år siden faldt jeg ud af et af de bedste computervidenskabelige programmer i Canada. Jeg begyndte at oprette min egen datalogi-masterprogram ved hjælp af online ressourcer. Jeg indså, at jeg kunne lære alt, hvad jeg havde brug for gennem edX, Coursera og Udacity i stedet. Og jeg kunne lære det hurtigere, mere effektivt og for en brøkdel af omkostningerne.

Jeg er næsten færdig nu. Jeg har taget mange datavidenskabelige kurser og revideret dele af mange flere. Jeg kender valgmulighederne derude, og hvilke færdigheder der er nødvendige for elever, der forbereder sig til en dataanalytiker eller dataforskerrolle. Så jeg begyndte at oprette en gennemgangsstyret guide, der anbefaler de bedste kurser for hvert emne inden for datavidenskab.

Til den første guide i serien anbefalede jeg et par kodningsklasser til begyndelsesdataforskeren. Derefter var det statistikker og sandsynlighedsklasser. Derefter introduktioner til datavidenskab. Også datavisualisering.

Nu på maskinlæring.

Til denne guide brugte jeg et dusin timer på at prøve at identificere hvert online maskinuddannelseskursus, der blev tilbudt fra maj 2017, på at udtrække nøgledel af oplysninger fra deres pensum og anmeldelser og udarbejde deres vurderinger. Mit slutmål var at identificere de tre bedste tilgængelige kurser og præsentere dem for dig nedenfor.

Til denne opgave henvendte jeg mig til ingen anden end open source Class Central-samfundet og dens database med tusinder af kursusvurderinger og anmeldelser.

Class Centrals hjemmeside.

Siden 2011 har Class Central-grundlægger Dhawal Shah holdt et nærmere øje med onlinekurser end antagelig nogen anden i verden. Dhawal personligt hjalp mig med at samle denne liste over ressourcer.

Hvordan vi valgte kurser at overveje

Hvert kursus skal passe til tre kriterier:

  1. Det skal have en betydelig mængde af maskinindlæringsindhold. Ideelt set er maskinlæring det primære emne. Bemærk, at kurser med kun dyb læring er udelukket. Mere om det senere.
  2. Det skal være on-demand eller tilbydes hvert par måneder.
  3. Det skal være et interaktivt onlinekursus, så ingen bøger eller læseleser. Selvom dette er levedygtige måder at lære, fokuserer denne guide på kurser. Kurser, der strengt taget er videoer (dvs. uden quizzer, opgaver osv.) Er også udelukket.

Vi mener, at vi dækkede alle bemærkelsesværdige kurser, der passer til ovenstående kriterier. Da der tilsyneladende er hundreder af kurser på Udemy, valgte vi kun at overveje de mest gennemgåede og højest rangerede.

Der er dog altid en chance for, at vi gik glip af noget. Så fortæl os venligst i kommentarfeltet, hvis vi udeladte en god kursus.

Hvordan vi evaluerede kurser

Vi udarbejdede gennemsnitlige vurderinger og antal anmeldelser fra Class Central og andre gennemgangssider for at beregne en vægtet gennemsnitlig bedømmelse for hvert kursus. Vi læste tekstanmeldelser og brugte denne feedback til at supplere de numeriske ratings.

Vi foretog en subjektiv studieplanopkald baseret på tre faktorer:

  1. Forklaring af arbejdsgangen til maskinlæring. Kursus skitserer de trin, der kræves for at gennemføre et vellykket ML-projekt? Se det næste afsnit for, hvad en typisk arbejdsgang indebærer.
  2. Dækning af maskinlæringsteknikker og algoritmer. Dækkes en række teknikker (f.eks. Regression, klassificering, klynger osv.) Og algoritmer (f.eks. Inden for klassificering: naive Bayes, beslutningstræer, supportvektormaskiner osv.) Eller bare et udvalgte få? Præferencer gives til kurser, der dækker mere uden at skimpte på detaljer.
  3. Brug af fælles datavidenskab og maskinindlæringsværktøjer. Læres kurset ved hjælp af populære programmeringssprog som Python, R og / eller Scala? Hvad med populære biblioteker inden for disse sprog? Disse er ikke nødvendige, men nyttige, så disse kurser gives en mindre præference.

Hvad er maskinlæring? Hvad er en arbejdsgang?

En populær definition stammer fra Arthur Samuel i 1959: maskinlæring er et underfelt i datalogi, der giver ”computere evnen til at lære uden at være eksplicit programmeret.” I praksis betyder det at udvikle computerprogrammer, der kan fremsætte forudsigelser baseret på data. Ligesom mennesker kan lære af erfaringer, så kan computere også, hvor data = opleve.

En arbejdsgang til maskinlæring er den proces, der kræves for at gennemføre et maskinindlæringsprojekt. Selvom individuelle projekter kan variere, deler de fleste arbejdsgange flere almindelige opgaver: problemevaluering, dataudforskning, dataforarbejdning, modeluddannelse / test / distribution osv. Nedenfor finder du nyttig visualisering af disse kernetrin:

Kernetrinnene i typisk maskinlæringsarbejde via UpX Academy

Det ideelle kursus introducerer hele processen og giver interaktive eksempler, opgaver og / eller quizzer, hvor studerende selv kan udføre hver opgave.

Dækker disse kurser dyb læring?

Lad os først definere dyb læring. Her er en kortfattet beskrivelse:

”Dyb læring er et underfelt i maskinlæring, der beskæftiger sig med algoritmer inspireret af strukturen og funktionen i hjernen kaldet kunstige neurale netværk.”
- Jason Brownlee fra Machine Learning Mastery

Som forventet indeholder dele af nogle af maskinlæringskurserne dybt læringsindhold. Jeg valgte dog ikke at medtage dybe læringskurser kun. Hvis du er interesseret i dyb læring specifikt, har vi dig dækket af følgende artikel:

Mine top tre henstillinger fra denne liste ville være:

  • Kreative applikationer af Deep Learning med TensorFlow af Kadenze
  • Neurale netværk til maskinlæring af University of Toronto (undervist af Geoffrey Hinton) via Coursera
  • Deep Learning A-Z ™: hands-on kunstige neurale netværk
    af Kirill Eremenko, Hadelin de Ponteves og SuperDataScience Team via Udemy

Anbefalede forudsætninger

Flere kurser, der er anført nedenfor, beder de studerende om at have forudgående programmering, beregning, lineær algebra og statistikoplevelse. Disse forudsætninger er forståelige, da maskinlæring er en avanceret disciplin.

Mangler du nogle få emner? Gode ​​nyheder! En del af denne erfaring kan opnås gennem vores anbefalinger i de to første artikler (programmering, statistik) i denne Data Science Career Guide. Flere top-rangerede kurser nedenfor giver også blid beregning og lineære algebrafriskere og fremhæver de aspekter, der er mest relevante for maskinlæring for dem, der er mindre kendte.

Vores valg til det bedste maskinuddannelseskursus er ...

  • Machine Learning (Stanford University via Coursera)

Stanford University's Machine Learning on Coursera er den klare nuværende vinder med hensyn til ratings, anmeldelser og pensumtilpasning. Undervist af den berømte Andrew Ng, Google Brain-grundlægger og tidligere chefforsker ved Baidu, var dette den klasse, der udløste grundlæggelsen af ​​Coursera. Det har en 4,7-stjernet vægtet gennemsnitsklassificering over 422 anmeldelser.

Udgivet i 2011 dækker det alle aspekter af arbejdsgangen til maskinlæring. Selvom det har et mindre omfang end den oprindelige Stanford-klasse, som den er baseret på, formår den stadig at dække et stort antal teknikker og algoritmer. Den estimerede tidslinje er elleve uger, med to uger dedikeret til neurale netværk og dyb læring. Gratis og betalte optioner er tilgængelige.

Ng er en dynamisk, men alligevel blid instruktør med en håndgribelig oplevelse. Han inspirerer selvtillid, især når han deler praktiske implementeringstips og advarsler om fælles faldgruber. Der leveres en lineær algebrafrisker, og Ng fremhæver aspekterne ved beregningen, der er mest relevant for maskinlæring.

Evalueringen sker automatisk og foretages via multiple choice-quizzer, der følger hver lektion og programmeringsopgaver. Opgaverne (der er otte af dem) kan udføres i MATLAB eller Octave, som er en open-source version af MATLAB. Ng forklarer sit sprogvalg:

Tidligere har jeg forsøgt at undervise i maskinlæring ved hjælp af en lang række forskellige programmeringssprog inklusive C ++, Java, Python, NumPy og også Octave ... Og hvad jeg har set efter at have undervist i maskinlæring i næsten et årti, er du lærer meget hurtigere, hvis du bruger Octave som dit programmeringsmiljø.

Selvom Python og R sandsynligvis er mere overbevisende valg i 2017 med den øgede popularitet af disse sprog, bemærker korrekturlæsere, at det ikke burde forhindre dig i at tage kurset.

Et par prominente korrekturlæsere bemærkede følgende:

Af mangeårig anerkendelse i MOOC-verdenen er Stanfords maskinuddannelseskurs virkelig den endelige introduktion til dette emne. Kurset dækker stort set alle de vigtigste områder inden for maskinlæring ... Prof. Ng går forud for hvert segment med en motiverende diskussion og eksempler.
Andrew Ng er en begavet lærer og i stand til at forklare komplicerede emner på en meget intuitiv og klar måde, inklusive matematikken bag alle koncepter. Højt anbefalet.
Det eneste problem, jeg ser med dette kursus, hvis det sætter forventningsbjælken meget høj for andre kurser.

En ny Ivy League-introduktion med en strålende professor

  • Machine Learning (Columbia University via edX)

Columbia University's Machine Learning er et relativt nyt tilbud, der er en del af deres kunstige intelligens MicroMasters på edX. Selvom den er nyere og ikke har et stort antal anmeldelser, er de dem, der har, usædvanligt stærke. Professor John Paisley bemærkes som strålende, klar og klog. Det har en 4,8-stjernet vægtet gennemsnitsklassificering over 10 anmeldelser.

Kurset dækker også alle aspekter af arbejdsgangen til maskinlæring og flere algoritmer end ovennævnte Stanford-tilbud. Columbia's er en mere avanceret introduktion, hvor korrekturlæsere bemærker, at studerende skal være komfortable med de anbefalede forudsætninger (beregning, lineær algebra, statistik, sandsynlighed og kodning).

Quizzer (11), programmeringsopgaver (4) og en afsluttende eksamen er evalueringsformerne. Studerende kan bruge enten Python, Octave eller MATLAB til at gennemføre opgaverne. Kursets samlede estimerede tidslinje er otte til ti timer om ugen over tolv uger. Det er gratis med et bekræftet certifikat, der kan købes.

Nedenfor er et par af de førnævnte glitrende anmeldelser:

I løbet af alle mine år med [at være] studerende har jeg stødt på professorer, der ikke er strålende, professorer, der er strålende, men de ved ikke, hvordan de skal forklare tingene tydeligt, og professorer, der er strålende og ved, hvordan de forklarer de ting klart. Dr. Paisley hører til den tredje gruppe.
Dette er et fantastisk kursus ... Instruktørens sprog er præcist, og det er efter min mening et af kursets stærkeste punkter. Foredragene er af høj kvalitet, og lysbillederne er også gode.
Dr. Paisley og hans vejleder er ... studerende af Michael Jordan, far til maskinlæring. [Dr. Paisley] er den bedste ML-professor ved Columbia på grund af hans evne til at forklare ting klart. Op til 240 studerende har valgt sit kursus dette semester, det største antal blandt alle professorer [lærer] maskinuddannelse i Columbia.

En praktisk introduktion i Python & R fra brancheeksperter

  • Machine Learning A-Z ™: Hands-On Python & R In Data Science (Kirill Eremenko, Hadelin de Ponteves og SuperDataScience Team via Udemy)

Machine Learning A-Z ™ på Udemy er et imponerende detaljeret tilbud, der giver instruktion i både Python og R, hvilket er sjældent og ikke kan siges for nogen af ​​de andre topkurser. Det har en 4,5-stjernet vægtet gennemsnitsklassificering over 8.139 anmeldelser, hvilket gør det til det mest gennemgåede forløb blandt de overvejede.

Det dækker hele arbejdsgangen til maskinlæring og et næsten latterligt (på en god måde) antal algoritmer gennem 40,5 timers on-demand video. Kurset har en mere anvendt tilgang og er lettere matematisk end de to ovennævnte kurser. Hvert afsnit starter med en "intuition" -video fra Eremenko, der opsummerer den underliggende teori om det koncept, der læres. de Ponteves går derefter gennem implementeringen med separate videoer til både Python og R.

Som en "bonus" inkluderer kurset Python- og R-kodeskabeloner, som studerende kan hente og bruge på deres egne projekter. Der er quizzer og hjemmearbejdeudfordringer, selvom dette ikke er de stærke punkter på kurset.

Eremenko og SuperDataScience-teamet er ærbødige for deres evne til at "gøre det komplekse enkle." Desuden er de forudsætninger, der er anført, "bare nogle gymnasiematematik", så dette kursus kan være en bedre mulighed for dem, der er afskrækket af tilbudene fra Stanford og Columbia.

Et par prominente korrekturlæsere bemærkede følgende:

Kursen er professionelt produceret, lydkvaliteten er fremragende, og forklaringerne er klare og kortfattede ... Det er en utrolig værdi for din økonomiske og tidsinvestering.
Det var spektakulært at kunne følge kurset på to forskellige programmeringssprog samtidig.
Kirill er en af ​​de absolut bedste instruktører på Udemy (hvis ikke Internettet), og jeg anbefaler at tage en klasse, han underviser. ... Dette kursus har et ton indhold, ligesom et ton!

Konkurrencen

Vores nummer 1 havde en vægtet gennemsnitsklassificering på 4,7 ud af 5 stjerner i løbet af 422 anmeldelser. Lad os se på de andre alternativer, sorteret efter faldende vurdering. En påmindelse om, at kun dyb læringskurser ikke er inkluderet i denne vejledning - du kan finde dem her.

Analytics Edge (Massachusetts Institute of Technology / edX): Mere fokuseret på analyser generelt, skønt det dækker flere emner om maskinlæring. Bruger R. Stærk fortælling, der udnytter velkendte eksempler fra den virkelige verden. Udfordrende. Ti til femten timer om ugen over tolv uger. Gratis med et bekræftet certifikat, der kan købes. Det har en 4,9-stjernet vægtet gennemsnitsklassificering over 214 anmeldelser.

Python til datavidenskab og maskinlæring Bootcamp (Jose Portilla / Udemy): Har store bidder med maskinindlæringsindhold, men dækker hele datavidsprocessen. Mere af en meget detaljeret introduktion til Python. Fantastisk kursus, dog ikke ideel til anvendelsesområdet for denne guide. 21,5 timers on-demand video. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Det har en 4,6-stjernet vægtet gennemsnitsklassificering over 3316 anmeldelser.

Data Science and Machine Learning Bootcamp med R (Jose Portilla / Udemy): Kommentarerne til Portillas ovenstående kursus gælder også her, bortset fra R. 17,5 timers on-demand-video. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Det har en 4,6-stjernet vægtet gennemsnitsklassificering over 1317 anmeldelser.

Machine Learning Series (Lazy Programmer Inc./Udemy): Undervist af en dataforsker / big data engineer / full stack software engineer med en imponerende CV, Lazy Programmer har i øjeblikket en serie med 16 maskinlæringsfokuserede kurser om Udemy. I alt har kurserne 5000+ ratings og næsten alle har 4,6 stjerner. En nyttig kursusbestilling findes i hvert enkelt kursus beskrivelse. Bruger Python. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige.

Machine Learning (Georgia Tech / Udacity): En samling af, hvad der var tre separate kurser: Vejledt, uovervåget og forstærkningslæring. En del af Udacity's Machine Learning Engineer Nanodegree og Georgia Tech's Online Master's Degree (OMS). Bittestore videoer, ligesom Udacitys stil. Venlige professorer. Estimeret tidslinje på fire måneder. Ledig. Det har en 4,56-stjernet vægtet gennemsnitsklassificering over 9 anmeldelser.

Implementering af forudsigelsesanalyse med gnist i Azure HDInsight (Microsoft / edX): Introducerer kernekoncepterne for maskinlæring og en række algoritmer. Udnytter flere store datavenlige værktøjer, herunder Apache Spark, Scala og Hadoop. Bruger både Python og R. Fire timer om ugen over seks uger. Gratis med et bekræftet certifikat, der kan købes. Det har en 4,5-stjernet vægtet gennemsnitsklassificering over 6 anmeldelser.

Datavidenskab og maskinlæring med Python - Hands On! (Frank Kane / Udemy): Bruger Python. Kane har ni års erfaring hos Amazon og IMDb. Ni timers on-demand video. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Det har en 4,5-stjernet vægtet gennemsnitsklassificering over 4139 anmeldelser.

Scala og gnist til big data og maskinlæring (Jose Portilla / Udemy): “Big data” fokus, specifikt på implementering i Scala og Spark. Ti timers on-demand video. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Det har en 4,5-stjernet vægtet gennemsnitsklassificering over 607 anmeldelser.

Machine Learning Engineer Nanodegree (Udacity): Udacity's flagskib Machine Learning-program, der indeholder et bedst i klassen projektgennemgangssystem og karrieresupport. Programmet er en samling af flere individuelle Udacity-kurser, som er gratis. Medoprettet af Kaggle. Estimeret tidslinje på seks måneder. I øjeblikket koster $ 199 USD pr. Måned med en 50% undervisningsrestitution tilgængelig for dem, der studerer inden for 12 måneder. Det har en 4,5-stjernet vægtet gennemsnitsklassificering over 2 anmeldelser.

Læring fra data (introduktion til maskinindlæring) (California Institute of Technology / edX): Tilmelding er i øjeblikket lukket på edX, men er også tilgængelig via CalTechs uafhængige platform (se nedenfor). Det har en 4,49-stjernet vægtet gennemsnitsklassificering over 42 anmeldelser.

Læring af data (introduktion til maskinindlæring) (Yaser Abu-Mostafa / California Institute of Technology): "Et rigtigt Caltech-kursus, ikke en udvandet version." Professor Yaser Abu-Mostafa er populær blandt studerende og skrev også den lærebog, som dette kursus er baseret på. Videoer er båndforedrag (med forelæsningsbilleder billede-i-billede) uploadet til YouTube. Hjemmearbejdsopgaver er .pdf-filer. Kursusoplevelsen for online-studerende er ikke så poleret som de tre bedste anbefalinger. Det har en 4,43-stjernet vægtet gennemsnitsklassificering over 7 anmeldelser.

Mining Massive Datasets (Stanford University): Maskinlæring med fokus på "big data." Introducerer moderne distribuerede filsystemer og MapReduce. Ti timer om ugen over syv uger. Ledig. Det har en 4,4-stjernet vægtet gennemsnitsklassificering over 30 anmeldelser.

AWS Machine Learning: En komplet guide med Python (Chandra Lingam / Udemy): Et unikt fokus på skybaseret maskinlæring og specifikt Amazon Web Services. Bruger Python. Ni timers on-demand video. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Det har en 4,4-stjernet vægtet gennemsnitsklassificering over 62 anmeldelser.

Introduktion til maskinlæring og ansigtsregistrering i Python (Holczer Balazs / Udemy): Bruger Python. Otte timers on-demand video. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Det har en 4,4-stjernet vægtet gennemsnitsklassificering over 162 anmeldelser.

StatLearning: Statistical Learning (Stanford University): Baseret på den fremragende lærebog, "En introduktion til statistisk læring, med applikationer i R" og undervist af de professorer, der skrev den. Læsere bemærker, at MOOC ikke er så god som bogen, og citerer "tynde" øvelser og middelmådige videoer. Fem timer om ugen over ni uger. Ledig. Det har en 4,35-stjernet vægtet gennemsnitsklassificering over 84 anmeldelser.

Specialisering af maskinlæring (University of Washington / Coursera): Store kurser, men sidste to klasser (inklusive hovedsten-projektet) blev aflyst. Læsere bemærker, at denne serie er mere fordøjelig (læs: lettere for dem uden stærk teknisk baggrund) end andre topkurs i maskinlæring (f.eks. Stanfords eller Caltech). Vær opmærksom på, at serien er ufuldstændig med anbefalingssystemer, dyb læring og manglende resume. Gratis og betalte optioner tilgængelige. Det har en 4,31-stjernet vægtet gennemsnitsklassificering over 80 anmeldelser.

University of Washington underviser i maskinlæringsspecialisering om Coursera.

Fra 0 til 1: Machine Learning, NLP & Python-Cut to the Chase (Loony Corn / Udemy): “En jordnær, genert, men selvsikker overtagelse af maskinlæringsteknikker.” Undervist af fire-personers team med årtier af brancheerfaring sammen. Bruger Python. Omkostningerne varierer afhængigt af Udemy-rabatter, som er hyppige. Det har en 4,2-stjernet vægtet gennemsnitsklassificering over 494 anmeldelser.

Principper for maskinlæring (Microsoft / edX): Bruger R, Python og Microsoft Azure Machine Learning. En del af Microsoft Professional Program Certificate i datavidenskab. Tre til fire timer om ugen over seks uger. Gratis med et bekræftet certifikat, der kan købes. Det har en 4.09-stjernet vægtet gennemsnitsklassificering over 11 anmeldelser.

Big Data: Statistical Inference and Machine Learning (Queensland University of Technology / FutureLearn): Et dejligt kort orienterende kursus i maskinlæring med fokus på big data. Dækker et par værktøjer som R, H2O Flow og WEKA. Kun tre uger varighed på anbefalede to timer om ugen, men en korrekturlæser bemærkede, at seks timer om ugen ville være mere passende. Gratis og betalte optioner tilgængelige. Det har en 4-stjernet vægtet gennemsnitsklassificering over 4 anmeldelser.

Genomic Data Science and Clustering (Bioinformatics V) (University of California, San Diego / Coursera): For dem, der er interesseret i skæringspunktet mellem computervidenskab og biologi, og hvordan det repræsenterer en vigtig grænse i moderne videnskab. Fokuserer på klynger og reduktion af dimensionalitet. En del af UCSD's Bioinformatics-specialisering. Gratis og betalte optioner tilgængelige. Det har en 4-stjernet vægtet gennemsnitsklassificering over 3 anmeldelser.

Intro til Machine Learning (Udacity): Prioriterer emnebredde og praktiske værktøjer (i Python) over dybde og teori. Instruktørerne Sebastian Thrun og Katie Malone gør denne klasse så sjov. Består af bittestore videoer og quizzer efterfulgt af et miniprojekt til hver lektion. I øjeblikket en del af Udacity's Data Analyst Nanodegree. Estimeret tidslinje på ti uger. Ledig. Det har en 3,95-stjernet vægtet gennemsnitsklassificering over 19 anmeldelser.

Maskinindlæring til dataanalyse (Wesleyan University / Coursera): En kort introduktion af maskinmaskiner og et par udvalgte algoritmer. Dækker beslutningstræer, tilfældige skove, lasso-regression og k-betyder klynge. En del af Wesleyans specialisering af dataanalyse og fortolkning. Estimeret tidslinje på fire uger. Gratis og betalte optioner tilgængelige. Det har en 3,6-stjernet vægtet gennemsnitsklassificering over 5 anmeldelser.

Programmering med Python for Data Science (Microsoft / edX): Produceret af Microsoft i partnerskab med Coding Dojo. Bruger Python. Otte timer om ugen over seks uger. Gratis og betalte optioner tilgængelige. Det har en 3,46-stjernet vægtet gennemsnitsklassificering over 37 anmeldelser.

Maskinlæring til handel (Georgia Tech / Udacity): Fokuserer på at anvende probabilistiske maskinlæringsmetoder til handelsbeslutninger. Bruger Python. En del af Udacity's Machine Learning Engineer Nanodegree og Georgia Tech's Online Master's Degree (OMS). Estimeret tidslinje på fire måneder. Ledig. Det har en 3,29-stjernet vægtet gennemsnitsklassificering over 14 anmeldelser.

Praktisk maskinlæring (Johns Hopkins University / Coursera): En kort, praktisk introduktion til en række maskinlæringsalgoritmer. Flere en / to-stjernede anmeldelser, der udtrykker en række forskellige bekymringer. En del af JHUs datalogi-specialisering. Fire til ni timer om ugen over fire uger. Gratis og betalte optioner tilgængelige. Det har en 3,11-stjernet vægtet gennemsnitsklassificering over 37 anmeldelser.

Machine Learning for Data Science and Analytics (Columbia University / edX): Introducerer en bred vifte af maskinlæringsemner. Nogle lidenskabelige negative anmeldelser med bekymringer, herunder indholdsvalg, mangel på programmeringsopgaver og uinspirerende præsentation. Syv til ti timer om ugen over fem uger. Gratis med et bekræftet certifikat, der kan købes. Det har en 2,74-stjernet vægtet gennemsnitsklassificering over 36 anmeldelser.

Specialisering af anbefalingssystemer (University of Minnesota / Coursera): Stærkt fokus på en bestemt type maskinlæring - anbefalingssystemer. En fire-retters specialisering plus et capstone-projekt, som er et casestudie. Undervist ved hjælp af LensKit (en open-source værktøjssæt til anbefalingssystemer). Gratis og betalte optioner tilgængelige. Det har en 2-stjernet vægtet gennemsnitsklassificering over 2 anmeldelser.

Machine Learning With Big Data (University of California, San Diego / Coursera): Forfærdelige anmeldelser, der fremhæver dårlig instruktion og evaluering. Nogle bemærkede, at det tog dem kun timer at gennemføre hele kurset. En del af UCSDs Big Data-specialisering. Gratis og betalte optioner tilgængelige. Det har en 1,86-stjernet vægtet gennemsnitsklassificering over 14 anmeldelser.

Praktisk forudsigelsesanalyse: modeller og metoder (University of Washington / Coursera): En kort introduktion til kernekompetencer for maskinlæring. En korrekturlæser bemærkede, at der var mangel på quizzer, og at opgaverne ikke var udfordrende. En del af UW's Data Science at Scale Specialization. Seks til otte timer om ugen over fire uger. Gratis og betalte optioner tilgængelige. Det har en 1,75-stjernet vægtet gennemsnitsklassificering over 4 anmeldelser.

De følgende kurser havde en eller ingen anmeldelser fra maj 2017.

Machine Learning for musikere og kunstnere (Goldsmiths, University of London / Kadenze): Unik. Studerende lærer algoritmer, software-værktøjer og bedste praksis for maskinlæring for at give mening om menneskelig gestus, musikalsk lyd og andre data i realtid. Syv sessioner i længden. Muligheder for revision (gratis) og præmie ($ 10 USD pr. Måned). Det har en 5-stjernet anmeldelse.

Anvendt maskinlæring i Python (University of Michigan / Coursera): Undervist ved hjælp af Python og scikit-læringsværktøjet. En del af den anvendte datavidenskab med Python-specialisering. Planlagt at starte den 29. maj. Gratis og betalte optioner tilgængelige.

Applied Machine Learning (Microsoft / edX): Undervist ved hjælp af forskellige værktøjer, herunder Python, R og Microsoft Azure Machine Learning (note: Microsoft fremstiller kurset). Inkluderer praktiske laboratorier til at styrke foredragets indhold. Tre til fire timer om ugen over seks uger. Gratis med et bekræftet certifikat, der kan købes.

Maskinlæring med Python (Big Data University): Undervist ved hjælp af Python. Målrettet mod begyndere. Anslået gennemførelsestid på fire timer. Big Data University er tilknyttet IBM. Ledig.

Maskinlæring med Apache SystemML (Big Data University): Undervist ved hjælp af Apache SystemML, som er et deklarativt stilsprog designet til storskala maskinlæring. Anslået gennemførelsestid på otte timer. Big Data University er tilknyttet IBM. Ledig.

Maskinindlæring til datavidenskab (University of California, San Diego / edX): Startes først i januar 2018. Programmeringseksempler og opgaver findes i Python ved hjælp af Jupyter-notebooks. Otte timer om ugen over ti uger. Gratis med et bekræftet certifikat, der kan købes.

Introduktion til Analytics-modellering (Georgia Tech / edX): Kurset annoncerer R som dets primære programmeringsværktøj. Fem til ti timer om ugen over ti uger. Gratis med et bekræftet certifikat, der kan købes.

Predictive Analytics: Få indblik i Big Data (Queensland University of Technology / FutureLearn): Kort oversigt over nogle få algoritmer. Bruger Hewlett Packard Enterprise's Vertica Analytics-platform som et anvendt værktøj. Startdato, der skal annonceres. To timer om ugen over fire uger. Gratis med et opnåelsesbevis, der kan købes.

Introducción al Machine Learning (Universitas Telefónica / Miríada X): Undervist på spansk. En introduktion til maskinlæring, der dækker overvåget og uovervåget læring. I alt tyve anslåede timer over fire uger.

Machine Learning Path Step (Dataquest): Undervist i Python ved hjælp af Dataquests interaktive browser-platform. Flere guidede projekter og et "plus" -projekt, hvor du bygger dit eget maskinindlæringssystem ved hjælp af dine egne data. Abonnement kræves.

De følgende seks kurser tilbydes af DataCamp. DataCamps hybrid undervisningstilstand udnytter video- og tekstbaseret instruktion med masser af eksempler gennem en kode-editor i browseren. Der kræves et abonnement for fuld adgang til hvert kursus.

DataCamp tilbyder flere maskinuddannelseskurser.

Introduktion til maskinindlæring (DataCamp): Dækker klassificerings-, regressions- og klyngealgoritmer. Bruger R. Femten videoer og 81 øvelser med en estimeret tidslinje på seks timer.

Overvåget læring med scikit-learning (DataCamp): Bruger Python og scikit-learning. Dækker klassificerings- og regressionsalgoritmer. Sytten videoer og 54 øvelser med en estimeret tidslinje på fire timer.

Uovervåget læring i R (DataCamp): Giver en grundlæggende introduktion til klynger og dimensionalitetsreduktion i R. Seksten videoer og 49 øvelser med en estimeret tidslinje på fire timer.

Værktøjskasse til maskinlæring (DataCamp): Underviser de "store ideer" i maskinlæring. Bruger R. 24 videoer og 88 øvelser med en estimeret tidslinje på fire timer.

Maskinlæring med eksperterne: Skolebudgetter (DataCamp): En casestudie fra en maskinlæringskonkurrence på DrivenData. Omfatter bygning af en model til automatisk klassificering af genstande på skolens budget. DataCamp's "Supervised Learning with scikit-learning" er en forudsætning. Femten videoer og 51 øvelser med en estimeret tidslinje på fire timer.

Ikke-overvåget læring i Python (DataCamp): Dækker en række uovervågede læringsalgoritmer ved hjælp af Python, scikit-learning og scipy. Kurset afsluttes med, at studerende bygger et anbefalingssystem til at anbefale populære musikartister. 13 videoer og 52 øvelser med en estimeret tidslinje på fire timer.

Maskinindlæring (Tom Mitchell / Carnegie Mellon University): Carnegie Mellons kandidatuddannelseskurser for maskinuddannelse. En forudsætning for deres andet kandidatuddannelse, "Statistisk maskinuddannelse." Tapede universitetsforelæsninger med praksisproblemer, hjemmearbejdeopgaver og en midtvejsperiode (alle med løsninger) lagt ud online. En 2011-version af kurset findes også. CMU er en af ​​de bedste kandidatskoler til studier af maskinlæring og har en hel afdeling dedikeret til ML. Ledig.

Statistisk maskinlæring (Larry Wasserman / Carnegie Mellon University): Sandsynligvis det mest avancerede kursus i denne vejledning. En opfølgning af Carnegie Mellons kursus i maskinuddannelse. Tapede universitetsforedrag med praksisproblemer, lektieopgaver og en midtvejsperiode (alle med løsninger) lagt ud online. Ledig.

CMU er en af ​​de bedste gradskoler til studier af maskinlæring. Machine Learning og statistisk Machine Learning er gratis tilgængelige online.

Undergraduate Machine Learning (Nando de Freitas / University of British Columbia): Et maskinuddannelseskursus i bacheloruddannelse. Forelæsninger filmes og sættes på YouTube med dias, der er lagt ud på kursets websted. Kursusopgaverne indsendes også (dog ingen løsninger). de Freitas er nu fuldtids professor ved University of Oxford og får ros for sine undervisningsevner i forskellige fora. Graduate version tilgængelig (se nedenfor).

Machine Learning (Nando de Freitas / University of British Columbia): Et kandidatuddannelseskurs i maskine. Kommentarer til de Freitas 'bacheloruddannelse (ovenfor) gælder også her.

Indpakning af det

Dette er den femte i en seksdelt serie, der dækker de bedste onlinekurser for at lancere dig selv inden for datavidenskabsfeltet. Vi dækkede programmering i den første artikel, statistikker og sandsynlighed i den anden artikel, intros til datavidenskab i den tredje artikel og datavisualisering i den fjerde.

Det sidste stykke vil være et resumé af disse artikler plus de bedste onlinekurser for andre nøgleemner, såsom datavangling, databaser og endda software engineering.

Hvis du leder efter en komplet liste over Data Science-online-kurser, kan du finde dem på Class Centres datavidenskabs- og Big Data-emneside.

Hvis du nød at læse dette, så tjek nogle af Class Central's andre stykker:

Hvis du har forslag til kurser, jeg har gået glip af, så fortæl mig det i svarene!

Hvis du fandt dette nyttigt, skal du klikke på , så flere vil se det her på Medium.

Dette er en kondenseret version af min originale artikel offentliggjort på Class Central, hvor jeg har inkluderet detaljerede kursusplaner.