AIToday Live

S05E71 - Hell of Excel: de vijand van datakwaliteit

Aigency by Info Support Season 5 Episode 71

Welkom bij een nieuwe aflevering van AIToday Live - de hel genaamd Excel! In deze aflevering bespreken we de problemen rondom het gebruik van Excel als een database en de impact ervan op de kwaliteit van data.

Onze gast(en) leggen uit waarom Excel niet geschikt is als een volwaardig database systeem en delen mogelijke oplossingen, zoals het behandelen van Excel als een applicatie en het gebruik van tools zoals Python of data warehouses. Leer hoe je Excel op de juiste manier kunt gebruiken en ontdek oplossingen om datakwaliteitsproblemen aan te pakken.


Links
  • Podcast: De Dataloog (https://open.spotify.com/show/1147MthgSv9eNx3dkwllCu?si=fe17f1478e9f474b)

Stuur ons een bericht

Aigency
Aigency ontwerpt en ontwikkelt waardevolle, robuuste en betrouwbare Machine Learning-modellen.

Info Support
Info Support is de specialist in maatwerk software en leidend in kunstmatige intelligentie (AI).

Disclaimer: This post contains affiliate links. If you make a purchase, I may receive a commission at no extra cost to you.

Schrijf je in voor onze nieuwsbrief en ontvang exclusieve toegang tot nieuws, blik achter de schermen en meer!

1
00:00:00,000 --> 00:00:06,720
Hoi, welkom bij een nieuwe aflevering van AIToday Live.

2
00:00:06,720 --> 00:00:09,160
Mijn naam is Joop Snijder, CTO bij Aigency.

3
00:00:09,160 --> 00:00:12,280
Mijn naam Niels Naglé, Chapter Lead, Data & AI bij Info Support.

4
00:00:12,280 --> 00:00:17,080
En vandaag hebben we te gast Harm.

5
00:00:17,080 --> 00:00:20,360
Harm, je bent voor de tweede keer bij ons in de studio.

6
00:00:20,360 --> 00:00:21,360
Ja, dat klopt ja.

7
00:00:21,360 --> 00:00:22,360
Ja, geweldig.

8
00:00:22,360 --> 00:00:26,320
En we gaan het vandaag hebben over de hell of Excel.

9
00:00:26,320 --> 00:00:30,640
Maar voordat we daar aan beginnen, zou je jezelf eerst even nog willen voorstellen aan

10
00:00:30,640 --> 00:00:31,640
de luisteraars?

11
00:00:31,640 --> 00:00:32,640
Oh ja, dat is goed.

12
00:00:32,640 --> 00:00:36,040
Ja, voor al die luisteraars die de eerste uitzending niet gehoord hebben.

13
00:00:36,040 --> 00:00:40,360
Het ging vooral over mezelf, maar nu gaan we het meer over inhoud hebben.

14
00:00:40,360 --> 00:00:41,360
Ja toch?

15
00:00:41,360 --> 00:00:42,360
Ja.

16
00:00:42,360 --> 00:00:44,920
Mijn naam is Harm Bodewes, 55 jaar.

17
00:00:44,920 --> 00:00:48,960
Ik heb al een lang carrière in de IT achter de rug.

18
00:00:48,960 --> 00:00:53,880
En ik heb een jaar of drie geleden de switch gemaakt naar Data Science.

19
00:00:53,880 --> 00:01:00,000
En sindsdien werk ik als zelfstandig adviseur Data Analytics, Data Science.

20
00:01:00,000 --> 00:01:03,240
Ja, en je doet ook een podcast toch?

21
00:01:03,240 --> 00:01:04,240
Ja, klopt.

22
00:01:04,240 --> 00:01:07,120
Ik ben ook een van de hosts van de Data Logo.

23
00:01:07,120 --> 00:01:08,760
Ja, om niet te vergeten.

24
00:01:08,760 --> 00:01:09,760
Precies.

25
00:01:09,760 --> 00:01:10,760
Ja.

26
00:01:10,760 --> 00:01:14,320
Nou, we gaan het hebben over de hell of Excel.

27
00:01:14,320 --> 00:01:18,720
Zou je kunnen uitleggen wat je daaronder verstaat, de hell of Excel?

28
00:01:18,720 --> 00:01:19,960
Ja, dat kan ik zeker.

29
00:01:19,960 --> 00:01:22,880
Ik vind het heel moeilijk trouwens om dat in twintig seconden te doen.

30
00:01:22,880 --> 00:01:25,440
Maar wacht, dan gaan we deze hele uitzending aanleggen.

31
00:01:25,440 --> 00:01:26,440
Ja toch?

32
00:01:26,440 --> 00:01:27,440
Zeker.

33
00:01:27,440 --> 00:01:34,200
Nou, wat ik continu merk in mijn werk is dat we last hebben van datakwaliteitsproblemen.

34
00:01:34,200 --> 00:01:40,360
Dus de data scientist kan pas zijn werk doen als hij goede kwaliteit data heeft, bijvoorbeeld.

35
00:01:40,360 --> 00:01:47,640
En die datakwaliteitsproblemen zijn eigenlijk heel vaak een jaar of twintig en daarna

36
00:01:47,640 --> 00:01:52,320
ontstaan door het verschrikkelijke tool Excel.

37
00:01:52,320 --> 00:01:55,600
Ik ga daar een aantal voorbeelden van geven in deze opname.

38
00:01:55,600 --> 00:01:56,600
Heel graag.

39
00:01:56,600 --> 00:02:00,560
Wij komen dat ook in onze dagelijkse praktijk tegen.

40
00:02:00,560 --> 00:02:01,560
Zeker.

41
00:02:01,560 --> 00:02:04,000
Dus in die zin voelen we met je mee.

42
00:02:04,000 --> 00:02:09,560
Wat is je allergrootste frustratie?

43
00:02:09,560 --> 00:02:10,560
Laten we daar eens mee beginnen.

44
00:02:10,560 --> 00:02:15,720
Nou, mijn grootste frustratie is dat Excel op een manier gebruikt wordt waar het helemaal

45
00:02:15,720 --> 00:02:17,440
niet voor bedoeld is.

46
00:02:17,440 --> 00:02:25,640
Toen ik studeerde, heel lang geleden, was ik studentenassistent en ik hielp bij een

47
00:02:25,640 --> 00:02:26,640
werkcollege S2020.

48
00:02:26,640 --> 00:02:30,800
Ik weet niet of jullie dat kennen, maar dat was een spreadsheet.

49
00:02:30,800 --> 00:02:33,600
Dat was toen heel modern op een Vaxcomputer.

50
00:02:33,600 --> 00:02:42,480
En wat de studenten moesten doen is, bijvoorbeeld concept prijselasticiteit.

51
00:02:42,480 --> 00:02:48,200
Je gooit de prijs 1% omhoog, wat betekent dat voor de vraag naar producten?

52
00:02:48,200 --> 00:02:50,920
Gaat die 1% omlaag of gebeurt er niks?

53
00:02:50,920 --> 00:02:58,800
Zo kon je door één variabele in een spreadsheet te wijzigen, een rekenblad, ging dat hele

54
00:02:58,800 --> 00:03:00,200
spreadsheet doorrekenen.

55
00:03:00,200 --> 00:03:02,240
Fantastisch, wat waren we daar blij mee.

56
00:03:02,240 --> 00:03:08,560
We zijn nu 20, 25 jaar later of misschien wel meer.

57
00:03:08,560 --> 00:03:13,360
En op een gegeven moment kwam Excel op de markt, een Microsoft product.

58
00:03:13,360 --> 00:03:17,400
En dat tool wordt op allerlei manieren gebruikt.

59
00:03:17,400 --> 00:03:21,640
Het is niet alleen maar een spreadsheet, het is een database, het is een tekenpakket,

60
00:03:21,640 --> 00:03:23,640
het is een, ik weet niet wat.

61
00:03:23,640 --> 00:03:27,240
Het is gewoon veel te makkelijk, het is veel te toegankelijk.

62
00:03:27,240 --> 00:03:30,120
Een applicatieplatform bijna wordt het gebruikt.

63
00:03:30,120 --> 00:03:34,920
Nou ja, en vooral waar we natuurlijk mee te maken hebben op het gebied van data science

64
00:03:34,920 --> 00:03:37,960
en machine learning, is dat het gebruikt wordt als database.

65
00:03:37,960 --> 00:03:41,040
Het is een gigantische dataopslag.

66
00:03:41,040 --> 00:03:46,560
Ja, en het begint eigenlijk al op het moment dat jij Excel opent en je maakt een nieuw

67
00:03:46,560 --> 00:03:47,560
werkblad.

68
00:03:47,560 --> 00:03:49,040
Op dat moment gaat het eigenlijk al verkeerd.

69
00:03:49,040 --> 00:03:56,840
Want je gaat data invoeren, dus er zit helemaal geen formaat op die data, er zitten geen integriteitsregels

70
00:03:56,840 --> 00:03:58,160
op die data die je invoert.

71
00:03:58,160 --> 00:03:59,400
Je kunt eigenlijk alles invoeren.

72
00:03:59,400 --> 00:04:01,400
En daar begint het eigenlijk al.

73
00:04:01,400 --> 00:04:02,400
En waarom is dat een probleem?

74
00:04:02,400 --> 00:04:10,360
Het probleem is dat we eigenlijk fantastische database systemen hebben die je daarvoor zou

75
00:04:10,360 --> 00:04:15,520
moeten gebruiken, waar wel dit soort controles direct bij invoer gedaan worden, waar wel

76
00:04:15,520 --> 00:04:18,360
referentiële integriteit wordt gecontroleerd.

77
00:04:18,360 --> 00:04:21,160
Ja, waardoor de datakwaliteit eigenlijk gewaarborgd is.

78
00:04:21,160 --> 00:04:23,440
Ja, Excel is gewoon geen database systeem.

79
00:04:23,440 --> 00:04:24,440
Nee.

80
00:04:24,440 --> 00:04:25,440
Punt.

81
00:04:25,440 --> 00:04:26,440
Ja, helemaal mee eens.

82
00:04:26,440 --> 00:04:31,320
Maar er zijn heel veel mensen die het fundamenteel met jou oneens zijn.

83
00:04:31,320 --> 00:04:37,920
Want zeg maar, dit gaat van kleine bedrijven tot de grootst mogelijke enterprises leven

84
00:04:37,920 --> 00:04:38,920
op Excel.

85
00:04:38,920 --> 00:04:41,720
Ja, en de ergste mensen, dat zijn financiële mensen.

86
00:04:41,720 --> 00:04:47,160
Want dit is natuurlijk het enige wat ze snappen, Excel.

87
00:04:47,160 --> 00:04:49,600
En ja, dat is lekker makkelijk.

88
00:04:49,600 --> 00:04:51,840
Ik kan een mooie draaitabel maken.

89
00:04:51,840 --> 00:04:54,880
Ik kan gegevens bij elkaar optellen.

90
00:04:54,880 --> 00:04:55,880
Ik kan vermenigvuldigen.

91
00:04:55,880 --> 00:04:58,480
Ik kan eigenlijk alles wat ik wil.

92
00:04:58,480 --> 00:05:02,240
En ik kan al die data lekker bij mezelf houden.

93
00:05:02,240 --> 00:05:06,520
Ik doe opslaan als, op mijn eigen computer natuurlijk.

94
00:05:06,520 --> 00:05:13,400
En ik heb eigenlijk mijn eigen database gecreëerd, die met geen enkel ander systeem koppelt.

95
00:05:13,400 --> 00:05:14,800
Het is een ramp.

96
00:05:14,800 --> 00:05:15,800
Ja.

97
00:05:15,800 --> 00:05:20,120
Het is voor jullie heel herkenbaar.

98
00:05:20,120 --> 00:05:21,120
Ja, zeker.

99
00:05:21,120 --> 00:05:23,000
Met name hoe het gebruikt wordt.

100
00:05:23,000 --> 00:05:26,480
En invoer geen controles.

101
00:05:26,480 --> 00:05:32,480
Maar ja, hoe ga je er dan mee om als het ingezet is?

102
00:05:32,480 --> 00:05:33,800
Want we hebben er allemaal mee te maken.

103
00:05:33,800 --> 00:05:37,240
Er zit hele belangrijke data in, die niet in een bronsysteem zit.

104
00:05:37,240 --> 00:05:40,600
Voor mij zijn het eigenlijk twee vragen, Niels.

105
00:05:40,600 --> 00:05:45,880
Dus inderdaad, hoe gaan we er mee om als databron, zeg maar.

106
00:05:45,880 --> 00:05:50,440
Maar de tweede vraag is, hoe gaan we dit in de toekomst voorkomen?

107
00:05:50,440 --> 00:05:55,120
Laten we eens beginnen met praktisch nummer één.

108
00:05:55,120 --> 00:05:56,120
Toch?

109
00:05:56,120 --> 00:05:58,160
We hebben het, hè?

110
00:05:58,160 --> 00:05:59,960
Ik bedoel, ze zijn daar.

111
00:05:59,960 --> 00:06:02,160
Ze zullen er voorlopig ook nog zijn, Excel, Sheets.

112
00:06:02,160 --> 00:06:03,960
Hoe gaan we er mee om?

113
00:06:03,960 --> 00:06:07,960
Nou, wat ik zie, wat data scientists vaak doen,

114
00:06:07,960 --> 00:06:13,040
je hebt, als je CRISPR DM gebruikt, een methode voor data scientists,

115
00:06:13,040 --> 00:06:15,800
dan ga je eerst business understanding, dan doe je data understanding.

116
00:06:15,800 --> 00:06:17,560
Op een gegeven moment kom je weer data preparation.

117
00:06:17,560 --> 00:06:21,360
En dat betekent eigenlijk dat je alle data klaarzet,

118
00:06:21,360 --> 00:06:24,440
zodat de data scientist een mooi model kan gaan maken.

119
00:06:24,440 --> 00:06:28,440
Vaak wordt er dan iets van data frames in Pandas,

120
00:06:28,440 --> 00:06:31,840
als je voor Python hebt gekozen, gebruikt.

121
00:06:31,840 --> 00:06:35,720
En dan ga je eigenlijk in Pandas allerlei trucjes uithalen

122
00:06:35,720 --> 00:06:39,040
om die corrupte data, ik noem het maar even zo,

123
00:06:39,040 --> 00:06:42,360
ik vind het altijd leuk om dingen zwart-wit te zeggen, maar dat hoor ik in ieder geval zo,

124
00:06:42,360 --> 00:06:44,640
om die corrupte data te herstellen,

125
00:06:44,640 --> 00:06:50,440
zodat de data scientist vervolgens schone data heeft om zijn model te maken.

126
00:06:50,440 --> 00:06:55,440
De vraag is natuurlijk, hoe is dit probleem überhaupt ontstaan?

127
00:06:55,440 --> 00:07:00,440
Hoe komt het dat die data vies is?

128
00:07:00,440 --> 00:07:04,440
Hoe kunnen we betere kwaliteit data krijgen?

129
00:07:04,440 --> 00:07:07,440
Nou, en niet al onze luisteraars zijn data scientists,

130
00:07:07,440 --> 00:07:10,440
dus ik denk dat het wel goed is om te benoemen waarom dit zo'n probleem is.

131
00:07:10,440 --> 00:07:15,440
Want in dat opschonen moet die data scientist allemaal keuzes maken.

132
00:07:15,440 --> 00:07:20,440
Gooit hij data weg? Gaat hij dingen verzinnen?

133
00:07:20,440 --> 00:07:23,440
Zegt hij nou, laten we de gemiddeldes invullen?

134
00:07:23,440 --> 00:07:27,440
Er worden heel veel keuzes gemaakt onder water, die je misschien helemaal niet weet,

135
00:07:27,440 --> 00:07:30,440
waarbij je ook niet weet wat de functionele impact is.

136
00:07:30,440 --> 00:07:35,440
Dus dat betekent dat er best wel problemen kunnen ontstaan

137
00:07:35,440 --> 00:07:38,440
tussen wat je verwacht en wat er uiteindelijk uitkomt, toch?

138
00:07:38,440 --> 00:07:41,440
Ja, dat klopt helemaal wat je nu zegt.

139
00:07:41,440 --> 00:07:45,440
En problemen die uiteindelijk heel bepalend zijn voor het resultaat van het voorspelmodel.

140
00:07:45,440 --> 00:07:51,440
Want wat jij nu zegt, van nou ja, ik zie allemaal outliers,

141
00:07:51,440 --> 00:07:55,440
ik pak maar even het gemiddelde, of ik haal een aantal outliers uit het model,

142
00:07:55,440 --> 00:07:58,440
of lege velden haal ik gewoon weg.

143
00:07:58,440 --> 00:08:02,440
Ja, dus heel bepalend voor de kwaliteit van de output.

144
00:08:02,440 --> 00:08:06,440
Ja, ik denk dat we daar wel een stapje snel gaan over de business understanding,

145
00:08:06,440 --> 00:08:09,440
en dat we dus eigenlijk het wel echt als een applicatie of een bron moeten zien,

146
00:08:09,440 --> 00:08:11,440
en dat we dus ook zo moeten aanvliegen.

147
00:08:11,440 --> 00:08:15,440
En dus ook met de invoer en de mensen die die Excels creëren,

148
00:08:15,440 --> 00:08:19,440
echt om tafel gaan, maar hoe is dit ontstaan en het als een applicatie behandelen?

149
00:08:19,440 --> 00:08:23,440
En dus ook die vragen die we normaal gesproken aan onze bronnen stellen,

150
00:08:23,440 --> 00:08:27,440
ook aan die Excel gaan stellen en aan die personen die die invoer doen.

151
00:08:27,440 --> 00:08:31,440
Ja, nou volgens mij is het probleem, dat is trouwens een hele goede vraag, Niels.

152
00:08:31,440 --> 00:08:34,440
Volgens mij is het probleem,

153
00:08:34,440 --> 00:08:40,440
dus het laat 20 of 30 jaar geleden al ontstaan, op het moment dat Microsoft Excel op de markt bracht.

154
00:08:40,440 --> 00:08:44,440
Het is gewoon te makkelijk, het is te toegankelijk.

155
00:08:44,440 --> 00:08:51,440
En ik zie op dit moment eigenlijk een vergelijkbaar fenomeen met bepaalde data science platformen,

156
00:08:51,440 --> 00:08:54,440
zoals SAS Viya, ik weet niet of je dat kent.

157
00:08:54,440 --> 00:08:57,440
Dat is ook zo makkelijk in gebruik,

158
00:08:57,440 --> 00:09:05,440
dat mensen eigenlijk niet meer na hoeven denken over wat ze fouten kan doen zijn.

159
00:09:05,440 --> 00:09:07,440
Ik denk dat dat het probleem is.

160
00:09:07,440 --> 00:09:12,440
En het probleem natuurlijk is dat we met machine learning dat gebruiken als fundament,

161
00:09:12,440 --> 00:09:14,440
dus je bent eigenlijk op drijfstand bij je aan het bouwen.

162
00:09:14,440 --> 00:09:19,440
Nou ja, en iedereen snapt wel dat dat niet heel handig is.

163
00:09:19,440 --> 00:09:21,440
Ja, dat klopt.

164
00:09:21,440 --> 00:09:24,440
Maar jij wilde, want ik interrumpeerde jou.

165
00:09:24,440 --> 00:09:25,440
Twee punten, ja.

166
00:09:25,440 --> 00:09:31,440
Nou nee, ik interrumpeerde je, want ik zei van, om even uit te leggen waarom het het probleem is,

167
00:09:31,440 --> 00:09:37,440
dat je überhaupt zeg maar, dat dan het inladen bent en dat de data scientist je keuzes maakt.

168
00:09:37,440 --> 00:09:40,440
Ja, nou het feitelijke probleem is natuurlijk,

169
00:09:40,440 --> 00:09:44,440
we hebben het tegenwoordig allemaal heel veel over data driven decision making,

170
00:09:44,440 --> 00:09:47,440
en over one single source of truth.

171
00:09:47,440 --> 00:09:51,440
En je moet bij het maken van beslissingen in een bedrijf,

172
00:09:51,440 --> 00:09:55,440
waarvan een bepaalde universele waarheid kunnen uitgaan.

173
00:09:55,440 --> 00:09:57,440
En die is er niet.

174
00:09:57,440 --> 00:10:03,440
En nou zijn er in de loop der jaren ook allerlei data quality tools op de markt gekomen,

175
00:10:03,440 --> 00:10:07,440
informatica, information builders, zoveel het is allemaal.

176
00:10:07,440 --> 00:10:11,440
Maar het is eigenlijk dweilen met de kraan open,

177
00:10:11,440 --> 00:10:20,440
zodat we toestaan dat Excel nog steeds als databron, als database systeem gebruikt wordt.

178
00:10:20,440 --> 00:10:33,440
En het gaat nog verder, wat ik eigenlijk ook vind, heel veel BI tools hebben een knop bovenin een menu hangen van export to Excel.

179
00:10:33,440 --> 00:10:38,440
En daar ga je weer. Dus dan heb je een heel mooi BI systeem gemaakt,

180
00:10:38,440 --> 00:10:42,440
en dan denk je, nou dit ziet er mooi uit, ik exporteer die data naar een Excel bestand,

181
00:10:42,440 --> 00:10:46,440
ik ga de output van dat Excel bestand volgens mij weer bewerken,

182
00:10:46,440 --> 00:10:49,440
dan creëer je eigenlijk een nieuwe single source of truth.

183
00:10:49,440 --> 00:10:52,440
En daar gaat het eigenlijk al fout.

184
00:10:52,440 --> 00:10:54,440
Ik heb helaas de oplossing ook niet.

185
00:10:54,440 --> 00:10:59,440
Het is een hele deprimerende uitzending, dus het gaat alleen maar om problemen.

186
00:10:59,440 --> 00:11:01,440
Ja, zonder oplossing.

187
00:11:01,440 --> 00:11:04,440
Want daardoor krijg je een hele rare cirkel wat je zegt.

188
00:11:04,440 --> 00:11:10,440
Dus die Excel wordt ingeladen, daar gaan we allemaal slimme of semi-slimme dingen mee doen,

189
00:11:10,440 --> 00:11:17,440
dan krijg je je rapportje uit, en dat rapportje ga je exporteren naar Excel, en zo om, en zo om.

190
00:11:17,440 --> 00:11:24,440
Je krijgt allemaal nieuwe databronnen die gebaseerd zijn op verkeerde andere databronnen.

191
00:11:24,440 --> 00:11:32,440
Misschien kan de data mesh een oplossing zijn, maar daar gaan we het een andere keer over hebben, volgens mij.

192
00:11:32,440 --> 00:11:37,440
En ik weet overigens ook wel, er zijn veel grotere problemen in de wereld, om het een klein beetje te leren.

193
00:11:37,440 --> 00:11:41,440
De oorlog in de Gaza, noem maar op.

194
00:11:41,440 --> 00:11:45,440
Maar ik vind dit echt wel een hele grote ergernis.

195
00:11:45,440 --> 00:11:53,440
Nou, en het is niet alleen denk ik een ergernis, het is echt een probleem als je daadwerkelijk machine learning systemen hierop wil gaan bouwen.

196
00:11:53,440 --> 00:11:58,440
Want het is natuurlijk ook heel belangrijk om bijvoorbeeld je data te versioneren.

197
00:11:58,440 --> 00:12:05,440
Dat je weet, dit model is gebaseerd op deze data, zodat je altijd weet waar het op gebouwd is.

198
00:12:05,440 --> 00:12:13,440
En als dat iedere keer zomaar andere versies zijn, het is een databron die gewijzigd kan worden,

199
00:12:13,440 --> 00:12:17,440
zonder dat daar enige toezicht op is.

200
00:12:17,440 --> 00:12:19,440
Wat ben je dan nog aan het doen?

201
00:12:19,440 --> 00:12:24,440
Dat is echt een groot probleem als je serieus je professioneel mee aan de slag wil.

202
00:12:24,440 --> 00:12:26,440
Ja, ik denk dat dat wel belangrijk is.

203
00:12:26,440 --> 00:12:32,440
Want in het begin is het ook niet erg, het gemak om te kunnen starten, dat is denk ik ook wel het mooie van Excel.

204
00:12:32,440 --> 00:12:36,440
Want je kan het ergens in kwijt, je hoeft niet een hele applicatie te hebben, dus daar zit een stuk gemak in.

205
00:12:36,440 --> 00:12:41,440
Maar de mate hoe je het gaat inzetten, wat de impact ervan is en het belang ervan is,

206
00:12:41,440 --> 00:12:44,440
dan is op den duur Excel gewoon niet meer de place to be.

207
00:12:44,440 --> 00:12:48,440
En moeten we daar andere materialen voor inzetten, andere technologieën voor inzetten,

208
00:12:48,440 --> 00:12:55,440
om ervoor te zorgen dat die kwaliteit gegarandeerd kan zijn, in plaats van eerste instantie best fit oplossing.

209
00:12:55,440 --> 00:13:03,440
Ja, maar de grote vraag blijft natuurlijk hoe. Ik weet niet hoe jullie dat, vanuit Info Support bijvoorbeeld, jullie klanten adviseren.

210
00:13:03,440 --> 00:13:08,440
Kijk, niet anders dan andere systemen, ga ik ook voor Excel gewoon ervan uit dat het een applicatie is.

211
00:13:08,440 --> 00:13:12,440
Dus dat betekent dat we een datacontract afstemmen, dat we daar bepaalde regels op instellen.

212
00:13:12,440 --> 00:13:17,440
En dan zetten we dus een huishouding eromheen, als Excel nou eenmaal de omgeving is waar ze in werken.

213
00:13:17,440 --> 00:13:23,440
Dan zetten we daar eigenlijk een soort van kaders omheen, met contracten, met datakwaliteit en geven het ook gewoon terug.

214
00:13:23,440 --> 00:13:25,440
Wat staat er in zo'n datacontract?

215
00:13:25,440 --> 00:13:30,440
Datacontract staat in, nou ja, als we het even echt op Excel hebben, welke tabbladen zitten erin?

216
00:13:30,440 --> 00:13:35,440
Wat voor tabellen zitten erin? Wat voor datatype is dat? Is het een lege kolom, betekent dat ook wat?

217
00:13:35,440 --> 00:13:41,440
Allemaal van dat soort zaken, die je ook in een applicatie in de technologie misschien al vastlegt, die maak je ook voor Excel.

218
00:13:41,440 --> 00:13:49,440
Ja, ik denk dat dit wat jij nu zegt, dat werkt misschien in de wat grotere bedrijven, maar in de kleine MKB-bedrijven,

219
00:13:49,440 --> 00:13:53,440
ja, die zullen dat soort mensen jou waarschijnlijk glazig aankijken.

220
00:13:53,440 --> 00:13:55,440
Beste Niels, waar heb je het over?

221
00:13:55,440 --> 00:13:58,440
Ja, en dan is de vraag inderdaad, wat is daar wel een fit?

222
00:13:58,440 --> 00:14:03,440
Ja, Excel, ik heb de oplossing ook nog niet hoor.

223
00:14:03,440 --> 00:14:10,440
We hebben nog een kwartiertje, we gaan die oplossing nu bedenken.

224
00:14:10,440 --> 00:14:21,440
Ja, maar op zich, dat zou nog best wel een hele aardige kunnen zijn, toch?

225
00:14:21,440 --> 00:14:29,440
Ik kijk even naar Niels, weet je, Niels is de dataman in ons midden.

226
00:14:29,440 --> 00:14:36,440
Je bent de MKB, je bent de financiële man. Wat zou een eerste stap kunnen zijn?

227
00:14:36,440 --> 00:14:42,440
Ja, de eerste stap is een inventarisatie. Waar wordt het op dit moment voor ingezet?

228
00:14:42,440 --> 00:14:47,440
En waar gebruiken we het? Dus waar wordt het ingevoerd en waar wordt het gebruikt?

229
00:14:47,440 --> 00:14:52,440
Om daar al een verschil in te gaan maken, dan heb je je eerste stap gezet van waar zit de invoer en waar zit het gebruik?

230
00:14:52,440 --> 00:14:57,440
Ik denk dat dat vaak al heel diffuus is met de Excel-oplossingen die we vaak zien bij organisaties.

231
00:14:57,440 --> 00:15:06,440
En als we dan weten waar de invoer zit, dan zou ik daar op scopen om te gaan kijken van hoe gaan we daar het probleem tackeln.

232
00:15:06,440 --> 00:15:11,440
En ja, tackeln dat kan in heel veel zinnen. Dan ga ik toch nog een ander vies woord roepen, maar XS.

233
00:15:11,440 --> 00:15:14,440
Formulieren maken waar je al wel checks in kan doen.

234
00:15:14,440 --> 00:15:20,440
Voor kleine organisaties denk ik daar al een eerste stap is die je kan maken van Excel naar XS.

235
00:15:20,440 --> 00:15:23,440
Als kleine database.

236
00:15:23,440 --> 00:15:33,440
Als kleine database. Ja, dit is een goeie die je nu noemt, want Microsoft XS, ik vond dat in de kern eigenlijk best wel een mooi product.

237
00:15:33,440 --> 00:15:35,440
Ik kom het alleen nergens meer tegen.

238
00:15:35,440 --> 00:15:43,440
Nee, omdat de andere tools en de SQL-service en de cloud-oplossingen natuurlijk ook veel gebruiksvriendelijker geworden zijn.

239
00:15:43,440 --> 00:15:48,440
Dus ook daar kan je kijken naar wat is een alternatief in de cloud die je gewoon in één keer al tot je beschikking hebt.

240
00:15:48,440 --> 00:15:53,440
Die misschien wel een beetje Excel-achtig aanvoelt en gebruik heeft.

241
00:15:53,440 --> 00:15:57,440
Ik weet niet, ik kan niet zo even 1, 2, 3 en toe opkomen die dat op dit moment heeft.

242
00:15:57,440 --> 00:16:01,440
Ik denk dat er twee oplossingsrichtingen zijn.

243
00:16:01,440 --> 00:16:07,440
En de eerste is Data Mesh, dat noemde ik zelf al eventjes kort.

244
00:16:07,440 --> 00:16:13,440
En wat jij net zegt Niels, contracten, duidelijke specificaties, duidelijke kwaliteitseisen.

245
00:16:13,440 --> 00:16:17,440
Dat zijn eigenlijk ook elementen van het Data Mesh denken.

246
00:16:17,440 --> 00:16:22,440
En Data Mesh is in de kern dat je data als een product beschouwt.

247
00:16:22,440 --> 00:16:27,440
En dat je het eigenaarschap van de data producten in de business legt.

248
00:16:27,440 --> 00:16:35,440
Waarmee de business users, inclusief de financiële mensen, zich ook echt verantwoordelijk voelen voor de kwaliteit van de data.

249
00:16:35,440 --> 00:16:37,440
Ik denk dat dat oplossing 1 is.

250
00:16:37,440 --> 00:16:40,440
En oplossing 2, nou dat ga ik zo anders wel even toe.

251
00:16:40,440 --> 00:16:42,440
Nee, maar ik denk dat je daar een hele belangrijke noemt.

252
00:16:42,440 --> 00:16:44,440
Het stukje verantwoordelijkheidsgevoel.

253
00:16:44,440 --> 00:16:48,440
Alleen ja, je kan zeggen, Joop, jij bent nu verantwoordelijk voor het stukje data.

254
00:16:48,440 --> 00:16:50,440
Ja, ik voel hem niet.

255
00:16:50,440 --> 00:16:53,440
Nee, daar zit wel vaak de uitdaging in.

256
00:16:53,440 --> 00:16:57,440
Het voelen en verantwoordelijk stellen en wat betekent het als die data fout zit.

257
00:16:57,440 --> 00:17:04,440
Dat overbrengen naar de owners van de data, dat is op zich toch wel een hele moeilijke.

258
00:17:04,440 --> 00:17:08,440
Ja, en ik denk dat dat een beetje met de tweede oplossing te maken heeft.

259
00:17:08,440 --> 00:17:13,440
Dat je die owner, moet je ook de tools geven, de gereedschappen.

260
00:17:13,440 --> 00:17:16,440
Zodat die dat ownership kan pakken.

261
00:17:16,440 --> 00:17:18,440
Zodat Joop dat ook gaat voelen.

262
00:17:18,440 --> 00:17:20,440
Ik ben owner van bepaalde data.

263
00:17:20,440 --> 00:17:22,440
En wat raad je mij aan dan?

264
00:17:22,440 --> 00:17:33,440
Nou, dan raad ik aan, niet Excel, maar je hebt wel hele mooie andere tools.

265
00:17:33,440 --> 00:17:36,440
Waarmee je bijvoorbeeld je master data kunt beheren.

266
00:17:36,440 --> 00:17:43,440
Dat kun je ook zelf iets maken in een low-code platform zoals OutSystems of Oracle Apex.

267
00:17:43,440 --> 00:17:45,440
Of weet ik veel wat.

268
00:17:45,440 --> 00:17:50,440
Maar zorg in ieder geval dat je datakwaliteitsproblemen bij de bron aanpakt.

269
00:17:50,440 --> 00:17:55,440
Datakwaliteitsproblemen ontstaan altijd bij invoer, is mijn stelling.

270
00:17:55,440 --> 00:18:00,440
Ja, en wat ik jou dan gun, Joop, als jij owner bent van de data, is inzicht.

271
00:18:00,440 --> 00:18:02,440
Inzicht in wat is nou eigenlijk de kwaliteit.

272
00:18:02,440 --> 00:18:06,440
Zodat jij kan beoordelen van, is dit voor mij voldoende kwaliteit?

273
00:18:06,440 --> 00:18:09,440
Voor mij, om Joop stempel erop te zetten.

274
00:18:09,440 --> 00:18:14,440
Als dit fout is, dan weten jullie, kunnen bij mij terecht, ik ben verantwoordelijk hiervoor.

275
00:18:14,440 --> 00:18:17,440
Nou, ik gooi even wat olie op het vuur.

276
00:18:17,440 --> 00:18:19,440
Want ik heb een andere adviseur gehad.

277
00:18:19,440 --> 00:18:24,440
En die zei van, je kan tegenwoordig Python gaan programmeren in Excel.

278
00:18:24,440 --> 00:18:26,440
Daar kan ik toch alles mee oplossen?

279
00:18:26,440 --> 00:18:28,440
Ja, dat vind ik dus ook een ramp.

280
00:18:28,440 --> 00:18:32,440
Dat moet wettelijk verboden worden, deze optie.

281
00:18:32,440 --> 00:18:36,440
Dat is een beetje hetzelfde verhaal.

282
00:18:36,440 --> 00:18:39,440
En je hebt ook van die zogenaamde solvers in Excel, ken je dat?

283
00:18:39,440 --> 00:18:40,440
Ja, zeker.

284
00:18:40,440 --> 00:18:41,440
Of bedoel je dat nu?

285
00:18:41,440 --> 00:18:44,440
Nee, nee, nee, nee, de solvers zijn natuurlijk echt...

286
00:18:44,440 --> 00:18:47,440
Ik vind de solvers nog wel redelijk.

287
00:18:47,440 --> 00:18:51,440
Want dan kan je ook nog van die what-if scenario's en dat soort dingen, waar Excel eigenlijk voor bedoeld is.

288
00:18:51,440 --> 00:18:54,440
Een doorrekenen van scenario's.

289
00:18:54,440 --> 00:19:01,440
Maar ze gaan echt, dat je naast VBA, dat je ook gewoon in Python kan gaan programmeren.

290
00:19:01,440 --> 00:19:06,440
Om het namelijk nog toegankelijker te maken om te programmeren in Excel.

291
00:19:06,440 --> 00:19:11,440
Ja, en dan de echte data scientists die ik ken.

292
00:19:11,440 --> 00:19:16,440
Dat wil zeggen de wiskundigen en de statistici, die groeien hier natuurlijk van.

293
00:19:16,440 --> 00:19:18,440
Waarom is dat natuurlijk?

294
00:19:18,440 --> 00:19:22,440
Omdat het een soort onderschatting van hun eigen vakgebied is.

295
00:19:22,440 --> 00:19:24,440
Denk ik.

296
00:19:24,440 --> 00:19:29,440
En je kunt, neem ik aan, ik heb dit nooit gebruikt hoor, Python in Excel.

297
00:19:29,440 --> 00:19:31,440
Nee, dat is een heel nieuw werk.

298
00:19:31,440 --> 00:19:39,440
Ik neem aan dat je dan heel makkelijk op basis van de data die je hebt ingevoerd in Excel, waarschijnlijk van slechte kwaliteit.

299
00:19:39,440 --> 00:19:45,440
Dat je daar een decision tree of zo uit kunt halen of een random forest of weet ik veel wat.

300
00:19:45,440 --> 00:19:49,440
Dus je gooit rommeldata in zo'n algoritme.

301
00:19:49,440 --> 00:19:52,440
Je hebt geen idee hoe zo'n algoritme werkt.

302
00:19:52,440 --> 00:19:59,440
En er komt een uitkomst uit van, nou je moet meer dit gaan doen.

303
00:19:59,440 --> 00:20:02,440
Je moet meer van deze producten gaan verkopen.

304
00:20:02,440 --> 00:20:04,440
Ja, bijvoorbeeld.

305
00:20:04,440 --> 00:20:06,440
Het is heel explosief.

306
00:20:06,440 --> 00:20:08,440
Het is rommeldata.

307
00:20:08,440 --> 00:20:11,440
Het is een algoritme waarvan je niet snapt hoe het werkt.

308
00:20:11,440 --> 00:20:13,440
En daarop op basis daarvan ga je beslissingen nemen.

309
00:20:13,440 --> 00:20:15,440
Wat kan daar goed aan doen?

310
00:20:15,440 --> 00:20:22,440
Je zou Python ook in kunnen zetten om juist die data validatie te gaan doen in Excel natuurlijk.

311
00:20:22,440 --> 00:20:26,440
Je kan alle code schrijven die wel net zoals VBA ook al mogelijk was.

312
00:20:26,440 --> 00:20:32,440
Kon je ook al je kwaliteitscontroles in VBA afdichten zodat wat ingevoerd werd weer gecontroleerd.

313
00:20:32,440 --> 00:20:33,440
Daar kan je nu ook Python voor inzetten.

314
00:20:33,440 --> 00:20:36,440
Ik zeg niet dat je het moet doen natuurlijk, maar zo kan je Python ook.

315
00:20:36,440 --> 00:20:38,440
Ik denk dat het juist goed is wat je zegt.

316
00:20:38,440 --> 00:20:40,440
Het komt nu ook al.

317
00:20:40,440 --> 00:20:42,440
En het gebeurt nu niet.

318
00:20:42,440 --> 00:20:47,440
Ik geloof niet dat het een toevoeging gaat zijn.

319
00:20:47,440 --> 00:20:53,440
Nee, maar ik kom nog genoeg Excels tegen waar een hele VBA applicatie achter zit die ook allemaal dingen aan het doen is.

320
00:20:53,440 --> 00:20:55,440
Oh, dat geloof ik zeker.

321
00:20:55,440 --> 00:21:02,440
Dat is misschien al een beter stapje dan alle gewone losse sheets die je hebt.

322
00:21:02,440 --> 00:21:06,440
Wat ik me wel eens afvraag, ik ben wel benieuwd hoe jullie daarover denken.

323
00:21:06,440 --> 00:21:10,440
Microsoft heeft een bepaalde strategie natuurlijk.

324
00:21:10,440 --> 00:21:13,440
En dat is waarschijnlijk een zo groot mag ik de aandeel behalen.

325
00:21:13,440 --> 00:21:21,440
Kun je op een gegeven moment tools een beetje te toegankelijk maken voor Jan met de pet?

326
00:21:21,440 --> 00:21:23,440
Kan dat?

327
00:21:23,440 --> 00:21:25,440
Dat is het al.

328
00:21:25,440 --> 00:21:30,440
Ik denk dat er al veel tools zijn, ook een hele loco platform, waar heel veel voordelen aan zitten.

329
00:21:30,440 --> 00:21:33,440
Maar je hebt niet meer de kijk onder de motorkap.

330
00:21:33,440 --> 00:21:37,440
En als het ergens ingezet wordt waar de impact en waar het heel erg belangrijk is,

331
00:21:37,440 --> 00:21:41,440
dan moet je gewoon weten wat daar gebeurt en wil je daar invloed op hebben.

332
00:21:41,440 --> 00:21:46,440
Dat is ook waarom wat mij betreft maatwerk software in de kern van de organisatie moet zitten.

333
00:21:46,440 --> 00:21:52,440
En dat alles wat je er omheen hebt, prima dat je dat bij of andere low-code oplossingen ervoor neerzet.

334
00:21:52,440 --> 00:21:56,440
Maar is het echt in de kern van de organisatie, ben ik voor maatwerk software,

335
00:21:56,440 --> 00:22:00,440
zodat je het aan je eigen proces kan aanpassen om je impact daarmee enorm te vergroten.

336
00:22:00,440 --> 00:22:04,440
En ook gewoon anders te kunnen zijn dan de organisatie om je heen.

337
00:22:04,440 --> 00:22:09,440
Ik ken IT'ers die gruwelen trouwens van low-code platformen.

338
00:22:09,440 --> 00:22:11,440
Gewoon in het algemeen, maakt niet uit.

339
00:22:11,440 --> 00:22:13,440
Oh daar zit er eentje.

340
00:22:13,440 --> 00:22:23,440
Ja, zeg maar, waar ik in geloof is als je nog in een idee fase zit, in een pilot fase,

341
00:22:23,440 --> 00:22:28,440
pok fase, dat als je heel snel moet itereren, zijn dit soort dingen allemaal geweldig.

342
00:22:28,440 --> 00:22:31,440
En dan kan het niet toegankelijk genoeg zijn,

343
00:22:31,440 --> 00:22:36,440
want dan wil je namelijk zo snel mogelijk weten of je idee, of dat ook levensvatbaar is,

344
00:22:36,440 --> 00:22:38,440
of dat uiteindelijk van waarde is.

345
00:22:38,440 --> 00:22:45,440
Wat je bij al dit soort, daarom volgens mij zeg je ook de hell of excel,

346
00:22:45,440 --> 00:22:48,440
je gaat uiteindelijk iets inzetten waar het niet voor is gemaakt.

347
00:22:48,440 --> 00:22:54,440
Dus je probeert uiteindelijk vierkantjes en rondjes te drukken en dat gaat niet.

348
00:22:54,440 --> 00:22:59,440
Dus ieder low-code platform in welke vorm dan ook, heeft zo zijn grenzen.

349
00:22:59,440 --> 00:23:06,440
En als je serieus business erop gaat uitvoeren, zul je tegen die grenzen aanlopen

350
00:23:06,440 --> 00:23:13,440
en moet je het duwen en het trekken en maak je het, denk ik, kapot.

351
00:23:13,440 --> 00:23:18,440
Dus wat je gaat zien is dat je onderhoudbaarheid wordt heel slecht,

352
00:23:18,440 --> 00:23:20,440
je aanpasbaarheid wordt heel erg slecht.

353
00:23:20,440 --> 00:23:23,440
Dus het wordt steeds moeilijker om daar verder op te bouwen.

354
00:23:23,440 --> 00:23:26,440
Ik noemde net al een fundament van drijfzand.

355
00:23:26,440 --> 00:23:29,440
Nou, dit is dan geen drijfzand, maar het is wel.

356
00:23:29,440 --> 00:23:35,440
Je moet eigenlijk je POC direct opruimen, zeg je.

357
00:23:35,440 --> 00:23:41,440
En low-code platformen moet je eigenlijk dus alleen maar in een POC fase gebruiken,

358
00:23:41,440 --> 00:23:43,440
dat is ook wat je zegt.

359
00:23:43,440 --> 00:23:47,440
En de hell of excel ontstaat eigenlijk door die POC's.

360
00:23:47,440 --> 00:23:48,440
Precies.

361
00:23:48,440 --> 00:23:54,440
Iets wat ontstaat gaat stiekem via allerlei tussenweggetjes toch in productie.

362
00:23:54,440 --> 00:23:58,440
En op een gegeven moment wordt het een soort ERP-systeem, wereldwijd.

363
00:23:58,440 --> 00:24:02,440
Ja, we willen soms ook gewoon te snel en maar doorgaan en maar doorgaan.

364
00:24:02,440 --> 00:24:05,440
Soms moet je gewoon echt even stilstaan, kijken naar wat is de waarde,

365
00:24:05,440 --> 00:24:09,440
dan moet je het daarna ook de waarde geven die het dan ook verdient.

366
00:24:09,440 --> 00:24:13,440
En dat is de stap die dan niet gezet wordt, want dan gaan we weer door naar de volgende POC,

367
00:24:13,440 --> 00:24:14,440
want ja, het werkt toch.

368
00:24:14,440 --> 00:24:18,440
En daar zit het risico wel in van de toegankelijkheid van de tools.

369
00:24:18,440 --> 00:24:21,440
Ja, ik heb het idee dat wij met z'n drieën wel eens zijn.

370
00:24:21,440 --> 00:24:22,440
Ja toch?

371
00:24:22,440 --> 00:24:24,440
Dat is de beste van de wereld.

372
00:24:24,440 --> 00:24:29,440
Nou, en ik denk dat dat weggooien, dat is echt een hele moeilijke stap voor mensen,

373
00:24:29,440 --> 00:24:32,440
want je hebt daar tijd, geld, energie in zitten.

374
00:24:32,440 --> 00:24:35,440
En dan voelt het alsof je waarde weggooit,

375
00:24:35,440 --> 00:24:41,440
terwijl de waarde zat natuurlijk in de validatie van je idee en niet in dat stukje Excel.

376
00:24:41,440 --> 00:24:48,440
Dus die omzetten naar iets wat robuust en schaalbaar en onderhoudbaar is,

377
00:24:48,440 --> 00:24:50,440
dat gaat je zoveel meer opleveren.

378
00:24:50,440 --> 00:24:52,440
Alleen, dat vinden mensen heel moeilijk.

379
00:24:52,440 --> 00:24:56,440
Ja, en dat schaalbare, dat zou een data warehouse kunnen zijn.

380
00:24:56,440 --> 00:24:59,440
Volgens mij gebruiken we nu die term voor het eerst in deze opname.

381
00:24:59,440 --> 00:25:03,440
Dat is toch, denk ik, die robuuste oplossing die je dan kunt hebben.

382
00:25:03,440 --> 00:25:06,440
Die ook real-time kan zijn, real-time data warehouse.

383
00:25:06,440 --> 00:25:10,440
Dus dat is iets wat prima kan met de technologie van tegenwoordig.

384
00:25:10,440 --> 00:25:15,440
Alleen, het kost natuurlijk altijd veel geld en tijd om zoiets goed op te zetten.

385
00:25:15,440 --> 00:25:17,440
En op een gegeven moment wordt management zenuwachtig

386
00:25:17,440 --> 00:25:23,440
en zegt van, ja, met die Excel kan ik ook geen beslissingen nemen.

387
00:25:23,440 --> 00:25:25,440
Sterker nog, eigenlijk vertrouw ik gewoon op mijn onderbuik.

388
00:25:25,440 --> 00:25:27,440
Ik heb helemaal geen IT nodig.

389
00:25:27,440 --> 00:25:29,440
Dat zijn de ergste.

390
00:25:29,440 --> 00:25:35,440
Ja, dat zal nog heel lang een lastig probleem zijn.

391
00:25:35,440 --> 00:25:39,440
Ja, maar we hebben het niet opgelost, denk ik, in deze uitzending.

392
00:25:39,440 --> 00:25:41,440
Denk het ook niet, hè?

393
00:25:41,440 --> 00:25:47,440
Misschien wel wat handvaten, geboden waar mensen mee aan de slag kunnen, toch?

394
00:25:47,440 --> 00:25:51,440
Ja, en luisteraar, heb jij wel echt de Moonshot ID hiervoor?

395
00:25:51,440 --> 00:25:53,440
Neem contact met ons op.

396
00:25:53,440 --> 00:25:56,440
Ik denk dat we het stapje voor stapje moeten zetten, maar wie weet.

397
00:25:56,440 --> 00:25:58,440
Laat het ons weten, inderdaad.

398
00:25:58,440 --> 00:26:02,440
Harm, we hebben ook een nieuw onderdeel in ons programma.

399
00:26:02,440 --> 00:26:04,440
Die had je eerder moeten zeggen.

400
00:26:04,440 --> 00:26:08,440
Ja, toch? Die had jij nog niet meegemaakt.

401
00:26:08,440 --> 00:26:11,440
We hebben onze virtuele co-host Aisha.

402
00:26:11,440 --> 00:26:13,440
O, ja, ja, nee, die heb ik gehoord.

403
00:26:13,440 --> 00:26:15,440
Kijk, zij wil je ook een vraag stellen.

404
00:26:15,440 --> 00:26:17,440
Ben benieuwd.

405
00:26:17,440 --> 00:26:22,440
Aisha. Aisha.

406
00:26:22,440 --> 00:26:26,440
Aisha. Aisha. Aisha.

407
00:26:26,440 --> 00:26:28,440
Een intelligente vraag, Aisha.

408
00:26:28,440 --> 00:26:35,440
Vriendelijke groeten.

409
00:26:35,440 --> 00:26:38,440
Ik ben Aisha, de AI van deze podcast.

410
00:26:38,440 --> 00:26:40,440
Zou ik je een vraag mogen voorleggen?

411
00:26:40,440 --> 00:26:42,440
Ja hoor, tuurlijk.

412
00:26:42,440 --> 00:26:45,440
Ben je ooit te slim afgeweest door een AI?

413
00:26:45,440 --> 00:26:48,440
Zou je dat verhaal kunnen delen?

414
00:26:48,440 --> 00:26:53,440
Dat is een goede vraag.

415
00:26:53,440 --> 00:26:57,440
Zeggen, ben je ooit te slim afgeweest door een AI algoritme?

416
00:26:57,440 --> 00:27:01,440
Dus, met andere woorden, ben je ooit verrast door een AI algoritme?

417
00:27:01,440 --> 00:27:02,440
Ja, bijvoorbeeld.

418
00:27:02,440 --> 00:27:05,440
Waar je zelf niet opgekomen zou zijn.

419
00:27:05,440 --> 00:27:12,440
Ja, ik denk, kan ik dat AI nemen?

420
00:27:12,440 --> 00:27:14,440
Ja, tegenwoordig mag je alles AI nemen.

421
00:27:14,440 --> 00:27:17,440
Ik denk, ik heb een heel simpel voorbeeld.

422
00:27:17,440 --> 00:27:20,440
Strava. Sporters onder ons kennen dat.

423
00:27:20,440 --> 00:27:25,440
Strava heeft een optie om routes voor jou te maken.

424
00:27:25,440 --> 00:27:28,440
Ik was vorig jaar in Italië op vakantie.

425
00:27:28,440 --> 00:27:31,440
Ik had een mooie route in gedachten.

426
00:27:31,440 --> 00:27:33,440
Ik wil van A naar B.

427
00:27:33,440 --> 00:27:37,440
Zonder dat ik over allerlei snelwegen moet en drukke wegen moet oversteken.

428
00:27:37,440 --> 00:27:40,440
En ik druk op een paar knoppen.

429
00:27:40,440 --> 00:27:43,440
Ik heb werkelijk nog nooit zo'n mooie fietstocht.

430
00:27:43,440 --> 00:27:48,440
Dus het antwoord is volmondig, beste Aisha.

431
00:27:48,440 --> 00:27:51,440
Dit was de beste vraag trouwens van het hele interview.

432
00:27:51,440 --> 00:27:53,440
GELACH

433
00:27:53,440 --> 00:27:57,440
Het antwoord is, beste Aisha, ja, dit is gebeurd.

434
00:27:57,440 --> 00:28:01,440
En dit gaat de toekomst veel vaker gebeuren.

435
00:28:01,440 --> 00:28:06,440
Leuk om vanuit jouw perspectief een antwoord op mijn vraag te krijgen. Thanks.

436
00:28:06,440 --> 00:28:10,440
Nou, dat lijkt me een hele mooie, positieve afsluiter.

437
00:28:10,440 --> 00:28:12,440
Leuk dit.

438
00:28:12,440 --> 00:28:14,440
Ja? Ja.

439
00:28:14,440 --> 00:28:18,440
Zij verrast ons ook regelmatig met dit soort vragen.

440
00:28:18,440 --> 00:28:22,440
Ik moet zeggen, ik moest er zelf ook wel even over nadenken.

441
00:28:22,440 --> 00:28:32,440
Wat mij meteen te binnen schoot, is wij maken ook zogenaamde requirements, stellen we op.

442
00:28:32,440 --> 00:28:34,440
Specification by example.

443
00:28:34,440 --> 00:28:40,440
Waarbij je eigenlijk in een soort van semi-formele taal opschrijft wat je verwacht van een model.

444
00:28:40,440 --> 00:28:43,440
En dan geef je voorbeelden in tabelvorm.

445
00:28:43,440 --> 00:28:46,440
Waarmee je het eigenlijk test.

446
00:28:46,440 --> 00:28:54,440
En nou, bij de tweede test, dat begon Copilot, de AI-assistent van Microsoft bij het programmeren.

447
00:28:54,440 --> 00:28:58,440
Die begon gewoon al hele tabellen van voorbeelden te geven.

448
00:28:58,440 --> 00:29:03,440
Dus die begreep de test die ik aan het schrijven was.

449
00:29:03,440 --> 00:29:06,440
En dat verraste mij enorm.

450
00:29:06,440 --> 00:29:11,440
En het grappige was, waarmee ik nog meer misschien verrast werd,

451
00:29:11,440 --> 00:29:14,440
is dat ik op een gegeven moment ook zo'n test aan het schrijven was.

452
00:29:14,440 --> 00:29:16,440
Toen kwam hij niet met die tabellen.

453
00:29:16,440 --> 00:29:18,440
Dat is raar.

454
00:29:18,440 --> 00:29:21,440
En in eerste instantie dacht ik, dat is jammer dat hij dat dan niet begrijpt.

455
00:29:21,440 --> 00:29:27,440
Maar toen dacht ik, misschien ben ik nu te ambigu, het is te onduidelijk in mijn test.

456
00:29:27,440 --> 00:29:33,440
En toen schreef ik hem om en toen kreeg ik echt 10 voorbeelden of zo met hele goede testen.

457
00:29:33,440 --> 00:29:37,440
Dus het was ook een soort van trigger voor mij.

458
00:29:37,440 --> 00:29:40,440
Maar uiteindelijk was ik niet duidelijk genoeg.

459
00:29:40,440 --> 00:29:47,440
Dus eigenlijk wordt je geholpen om je documentatie en je specificatie structureel beter te maken.

460
00:29:47,440 --> 00:29:49,440
Dus dan was hij me behoorlijk te slim af.

461
00:29:49,440 --> 00:29:55,440
Misschien kan Aisha ook helpen om het probleem van de hel af te halen.

462
00:29:55,440 --> 00:29:57,440
Zeg nou iets raars.

463
00:29:57,440 --> 00:30:02,440
Ja, dat gaan we dan een andere keer vragen denk ik.

464
00:30:02,440 --> 00:30:07,440
Harm, hartstikke bedankt voor al je inzichten.

465
00:30:07,440 --> 00:30:10,440
Voor de, ik denk wel, leuke frustraties toch?

466
00:30:10,440 --> 00:30:13,440
Ja, zeker. Het is uiteindelijk toch best een hele gezellige uitzending geworden.

467
00:30:13,440 --> 00:30:14,440
Ja, laten we er vooral ook om lachen.

468
00:30:14,440 --> 00:30:16,440
Zeker, zeker. Dank je wel.

469
00:30:16,440 --> 00:30:17,440
Graag gedaan.

470
00:30:17,440 --> 00:30:23,440
Leuk dat je weer luisterde naar een aflevering van AIToday Live.

471
00:30:23,440 --> 00:30:27,440
Vergeet je niet te abonneren via je favoriete podcast app en mis geen aflevering.

472
00:30:27,440 --> 00:30:28,440
Dank je wel.

473
00:30:28,440 --> 00:30:30,440
 

People on this episode