Log in

goodpods headphones icon

To access all our features

Open the Goodpods app
Close icon
De Dataloog - DTL S2A15 - Scikit-LEGO

DTL S2A15 - Scikit-LEGO

05/11/20 • 47 min

De Dataloog

Send us a text

Wat als je grootgebruiker bent van de Python package scikit-learn, maar je merkt dat jij en je collega's regelmatig handmatig scriptjes maken om iets op te lossen wat niet out-of-the-box in scikit-learn voorkomt? Dan bouw je toch je eigen Python package! In aflevering 15 van seizoen 2 spreken Jurjen en Stephanie met Matthijs Brouns en Vincent Warmerdam, makers van de python package scikit-lego. Scikit-lego is een open source package bestaande uit 'legoblokjes' die data scientists en machine learning engineers kunnen gebruiken in hun projecten. Dit zijn bijvoorbeeld blokjes voor het transformeren of modelleren van data, maar ook om meer 'fairness' toe te voegen in een model. Scikit-lego is ongeveer een jaar oud en heeft op dit moment 28 contributors van over de hele wereld, 300 commits en 2.500 downloads per maand. En dat is zo gaaf aan het bouwen en onderhouden van een open source project; dat mensen die je niet kent je package gaan gebruiken, maar ook hieraan kunnen bijdragen en de package beter kunnen maken. Een leuke toevoeging: als je (net als in Python) from scikit-lego import this uitvoert, krijg je een gedichtje waarin onder andere wordt aangegeven dat scikit-lego geen formele banden heeft met zowel scikit-learn als Lego. :) Matthijs Brouns is data science trainer bij Xccelerated en co-chair van PyData Amsterdam. Twitter: @fishnets88 Vincent Warmerdam is research advocate bij Rasa en co-founder van PyData Amsterdam. Twitter: @MatthijsBrs

De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie.

Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet.

Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

plus icon
bookmark

Send us a text

Wat als je grootgebruiker bent van de Python package scikit-learn, maar je merkt dat jij en je collega's regelmatig handmatig scriptjes maken om iets op te lossen wat niet out-of-the-box in scikit-learn voorkomt? Dan bouw je toch je eigen Python package! In aflevering 15 van seizoen 2 spreken Jurjen en Stephanie met Matthijs Brouns en Vincent Warmerdam, makers van de python package scikit-lego. Scikit-lego is een open source package bestaande uit 'legoblokjes' die data scientists en machine learning engineers kunnen gebruiken in hun projecten. Dit zijn bijvoorbeeld blokjes voor het transformeren of modelleren van data, maar ook om meer 'fairness' toe te voegen in een model. Scikit-lego is ongeveer een jaar oud en heeft op dit moment 28 contributors van over de hele wereld, 300 commits en 2.500 downloads per maand. En dat is zo gaaf aan het bouwen en onderhouden van een open source project; dat mensen die je niet kent je package gaan gebruiken, maar ook hieraan kunnen bijdragen en de package beter kunnen maken. Een leuke toevoeging: als je (net als in Python) from scikit-lego import this uitvoert, krijg je een gedichtje waarin onder andere wordt aangegeven dat scikit-lego geen formele banden heeft met zowel scikit-learn als Lego. :) Matthijs Brouns is data science trainer bij Xccelerated en co-chair van PyData Amsterdam. Twitter: @fishnets88 Vincent Warmerdam is research advocate bij Rasa en co-founder van PyData Amsterdam. Twitter: @MatthijsBrs

De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie.

Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet.

Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Previous Episode

undefined - DTL S2A14 - Kennis als Asset omzetten tot waarde met het BrainMatter platform van BrainCreators

DTL S2A14 - Kennis als Asset omzetten tot waarde met het BrainMatter platform van BrainCreators

Send us a text

Dat Data de nieuwe olie is wordt veel beweerd, maar zonder kennis als bron van de data levert het toepassen van algoritmes op dit data geen meerwaarde. Veel Techbedrijven hebben ‘algoritmes’ ontwikkeld maar algoritmes zonder kennis is niet veel waard. BrainCreators draait dit om. Door kennis en ervaring van medewerkers met domeinkennis als bron van data te zien kun je daadwerkelijk meerwaarde halen met AI. Het BrainMatter platform van BrainCreators is in staat om op een slimme manier domeinkennis van medewerkers te integreren in datasets om zo sneller tot productieve AI inzet te komen. In deze Dataloog spreken we Jasper Wognum CEO van BrainCreators die ons uitlegt hoe het platform (technisch) werkt. Hij neemt ons mee in diverse use cases van het platform. Bijvoorbeeld, als je vele soorten staalplaten produceert, per dag 50 miljoen infrarood fotos maakt van de staalplaten om 50 soorten fouten te classificeren en maar enkele staal experts in je organisatie hebt... Dan zou het duizenden manuren kosten om een bruikbare dataset voor learning in te richten. Met BrainMatter wordt een dergelijk project wel bereikbaar binnen afzienbare tijd. Japer neemt ons terloops mee door de ontwikkeling van AI over de jaren heen. De technologische ontwikkeling laat een analoog aan de ontwikkelingen diverse webplatforms die we nu kennen. Het begon met html en werken nu toe naar platforms. Dit zien we ook met AI, het begon met C+ Scala Python of R maar de plaformisering van AI tools maakt het mogelijk om zonder deze diepgaande kennis toch data gedreven te worden. Als het aan Jasper ligt gaan we een bijzondere tijd tegemoet, maar dan moet de data wel meerwaarde hebben.

De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie.

Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet.

Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Next Episode

undefined - Het Datanieuws ism Computable 14 mei 2020

Het Datanieuws ism Computable 14 mei 2020

Send us a text

In deze uitzending van het datanieuws aandacht voor: het AI songfestival van de VPRO / goed nieuws uit Nederland / Hack jezelf rijk met de challenge van Microsoft / De Watercloud / het cloud onderzoek van computable ism Binx.io / Technoslavia en het versnipperde AI landschap / de uit agenda

shownotes op https://www.computable.nl/artikel/informatie/de-dataloog/6928222/6867286/shownotes-de-dataloog-14-mei-2020.html

De Dataloog is de onafhankelijke Nederlandstalige podcast over data & kunstmatige intelligentie.

Hier hoor je alles wat je moet weten over de zin en onzin van data, de nieuwste ontwikkelingen en echte verhalen uit de praktijk. Onze hosts houden het altijd begrijpelijk, maar schuwen de diepgang niet.

Vind je De Dataloog leuk? Abonneer je op de podcast en laat een review achter.

Episode Comments

Generate a badge

Get a badge for your website that links back to this episode

Select type & size
Open dropdown icon
share badge image

<a href="https://goodpods.com/podcasts/de-dataloog-359463/dtl-s2a15-scikit-lego-51763736"> <img src="https://storage.googleapis.com/goodpods-images-bucket/badges/generic-badge-1.svg" alt="listen to dtl s2a15 - scikit-lego on goodpods" style="width: 225px" /> </a>

Copy