
DTL S2A15 - Scikit-LEGO
05/11/20 • 47 min
Wat als je grootgebruiker bent van de Python package scikit-learn, maar je merkt dat jij en je collega's regelmatig handmatig scriptjes maken om iets op te lossen wat niet out-of-the-box in scikit-learn voorkomt? Dan bouw je toch je eigen Python package! In aflevering 15 van seizoen 2 spreken Jurjen en Stephanie met Matthijs Brouns en Vincent Warmerdam, makers van de python package scikit-lego. Scikit-lego is een open source package bestaande uit 'legoblokjes' die data scientists en machine learning engineers kunnen gebruiken in hun projecten. Dit zijn bijvoorbeeld blokjes voor het transformeren of modelleren van data, maar ook om meer 'fairness' toe te voegen in een model. Scikit-lego is ongeveer een jaar oud en heeft op dit moment 28 contributors van over de hele wereld, 300 commits en 2.500 downloads per maand. En dat is zo gaaf aan het bouwen en onderhouden van een open source project; dat mensen die je niet kent je package gaan gebruiken, maar ook hieraan kunnen bijdragen en de package beter kunnen maken. Een leuke toevoeging: als je (net als in Python) from scikit-lego import this uitvoert, krijg je een gedichtje waarin onder andere wordt aangegeven dat scikit-lego geen formele banden heeft met zowel scikit-learn als Lego. :) Matthijs Brouns is data science trainer bij Xccelerated en co-chair van PyData Amsterdam. Twitter: @fishnets88 Vincent Warmerdam is research advocate bij Rasa en co-founder van PyData Amsterdam. Twitter: @MatthijsBrs
De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie.
Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet.
Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
Wat als je grootgebruiker bent van de Python package scikit-learn, maar je merkt dat jij en je collega's regelmatig handmatig scriptjes maken om iets op te lossen wat niet out-of-the-box in scikit-learn voorkomt? Dan bouw je toch je eigen Python package! In aflevering 15 van seizoen 2 spreken Jurjen en Stephanie met Matthijs Brouns en Vincent Warmerdam, makers van de python package scikit-lego. Scikit-lego is een open source package bestaande uit 'legoblokjes' die data scientists en machine learning engineers kunnen gebruiken in hun projecten. Dit zijn bijvoorbeeld blokjes voor het transformeren of modelleren van data, maar ook om meer 'fairness' toe te voegen in een model. Scikit-lego is ongeveer een jaar oud en heeft op dit moment 28 contributors van over de hele wereld, 300 commits en 2.500 downloads per maand. En dat is zo gaaf aan het bouwen en onderhouden van een open source project; dat mensen die je niet kent je package gaan gebruiken, maar ook hieraan kunnen bijdragen en de package beter kunnen maken. Een leuke toevoeging: als je (net als in Python) from scikit-lego import this uitvoert, krijg je een gedichtje waarin onder andere wordt aangegeven dat scikit-lego geen formele banden heeft met zowel scikit-learn als Lego. :) Matthijs Brouns is data science trainer bij Xccelerated en co-chair van PyData Amsterdam. Twitter: @fishnets88 Vincent Warmerdam is research advocate bij Rasa en co-founder van PyData Amsterdam. Twitter: @MatthijsBrs
De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie.
Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet.
Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
Previous Episode

DTL S2A14 - Kennis als Asset omzetten tot waarde met het BrainMatter platform van BrainCreators
Dat Data de nieuwe olie is wordt veel beweerd, maar zonder kennis als bron van de data levert het toepassen van algoritmes op dit data geen meerwaarde. Veel Techbedrijven hebben ‘algoritmes’ ontwikkeld maar algoritmes zonder kennis is niet veel waard. BrainCreators draait dit om. Door kennis en ervaring van medewerkers met domeinkennis als bron van data te zien kun je daadwerkelijk meerwaarde halen met AI. Het BrainMatter platform van BrainCreators is in staat om op een slimme manier domeinkennis van medewerkers te integreren in datasets om zo sneller tot productieve AI inzet te komen. In deze Dataloog spreken we Jasper Wognum CEO van BrainCreators die ons uitlegt hoe het platform (technisch) werkt. Hij neemt ons mee in diverse use cases van het platform. Bijvoorbeeld, als je vele soorten staalplaten produceert, per dag 50 miljoen infrarood fotos maakt van de staalplaten om 50 soorten fouten te classificeren en maar enkele staal experts in je organisatie hebt... Dan zou het duizenden manuren kosten om een bruikbare dataset voor learning in te richten. Met BrainMatter wordt een dergelijk project wel bereikbaar binnen afzienbare tijd. Japer neemt ons terloops mee door de ontwikkeling van AI over de jaren heen. De technologische ontwikkeling laat een analoog aan de ontwikkelingen diverse webplatforms die we nu kennen. Het begon met html en werken nu toe naar platforms. Dit zien we ook met AI, het begon met C+ Scala Python of R maar de plaformisering van AI tools maakt het mogelijk om zonder deze diepgaande kennis toch data gedreven te worden. Als het aan Jasper ligt gaan we een bijzondere tijd tegemoet, maar dan moet de data wel meerwaarde hebben.
De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie.
Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet.
Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
Next Episode

Het Datanieuws ism Computable 14 mei 2020
In deze uitzending van het datanieuws aandacht voor: het AI songfestival van de VPRO / goed nieuws uit Nederland / Hack jezelf rijk met de challenge van Microsoft / De Watercloud / het cloud onderzoek van computable ism Binx.io / Technoslavia en het versnipperde AI landschap / de uit agenda
shownotes op https://www.computable.nl/artikel/informatie/de-dataloog/6928222/6867286/shownotes-de-dataloog-14-mei-2020.html
De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie.
Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet.
Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.
If you like this episode you’ll love
Episode Comments
Generate a badge
Get a badge for your website that links back to this episode
<a href="https://goodpods.com/podcasts/de-dataloog-359463/dtl-s2a15-scikit-lego-51763736"> <img src="https://storage.googleapis.com/goodpods-images-bucket/badges/generic-badge-1.svg" alt="listen to dtl s2a15 - scikit-lego on goodpods" style="width: 225px" /> </a>
Copy