AIToday Live

S06E29 - Fluisteren als sleutel tot vloeiend spreken

April 08, 2024 Aigency by Info Support Season 6 Episode 29
AIToday Live
S06E29 - Fluisteren als sleutel tot vloeiend spreken
Show Notes Transcript

In deze aflevering van AIToday Live richt de aandacht zich op Whispp, een vooruitstrevende toepassing die kunstmatige intelligentie inzet om spraakbeperkingen te overbruggen. Joris Castermans deelt zijn verhaal en de inspiratie achter Whispp, een app die fluisterspraak transformeert in heldere en begrijpelijke spraak.

De technologische innovatie achter Whispp belooft een nieuw niveau van toegankelijkheid en zelfexpressie voor mensen met spraakmoeilijkheden. De podcast onthult hoe Whispp kunstmatige intelligentie gebruikt om individuele stempatronen te herkennen en deze om te zetten naar natuurlijk klinkende spraak.

Dit technologische wonder wordt niet alleen besproken, maar krijgt ook een praktische demonstratie tijdens de aflevering. Luister mee naar een fascinerend gesprek over de potentie van AI in het verbeteren van menselijke communicatie en de impact ervan op het leven van velen.


Links

Met onze podcast AIToday Live zijn we genomineerd voor de Belgian Podcast Awards ! 🏆🤩 Belgisch? Ja, een Belgische award, want er is een speciale categorie voor Nederlandse podcasts: Prijs van Oranje.

Wil je ons steunen? 🙏❤️ Stem op ons!

Aigency
Aigency ontwerpt en ontwikkelt waardevolle, robuuste en betrouwbare Machine Learning-modellen.

Info Support
Info Support is de specialist in maatwerk software en leidend in kunstmatige intelligentie (AI).

Disclaimer: This post contains affiliate links. If you make a purchase, I may receive a commission at no extra cost to you.

Wil je toegang tot exclusieve toegang voor onze luisteraars? Schrijf je in voor de nieuwsbrief 'AI versterkt de Mens'

Contact AIToday Live


We zijn altijd op zoek naar nieuwe gasten die over AI willen spreken.

1
00:00:00,000 --> 00:00:05,000
Hoi, leuk dat je luistert naar een nieuwe aflevering van AIToday Live.

2
00:00:05,000 --> 00:00:08,000
Mijn naam is Joop Snijder, CTO bij Aigency.

3
00:00:08,000 --> 00:00:11,000
Je denkt vast, waarom fluistert hij nou?

4
00:00:11,000 --> 00:00:14,000
Nou, dat heeft alles te maken met deze uitzending.

5
00:00:14,000 --> 00:00:23,000
Die gaat zo direct over waarom het zo belangrijk is dat je van fluisteren naar je eigen stem kan gaan.

6
00:00:23,000 --> 00:00:26,000
En voor wie dat heel erg behulpzaam is.

7
00:00:26,000 --> 00:00:28,000
Veel plezier!

8
00:00:29,000 --> 00:00:34,000
Hoi, leuk dat je weer luistert naar een nieuwe aflevering van AIToday Live.

9
00:00:34,000 --> 00:00:37,000
Met vandaag de gast Joris Castermans.

10
00:00:37,000 --> 00:00:44,000
Joris heeft een bijzondere app, maar ook bijzondere verhalen eromheen.

11
00:00:44,000 --> 00:00:47,000
Wat hem de afgelopen maanden is overkomen, denk ik.

12
00:00:47,000 --> 00:00:48,000
Daar gaan we het over hebben.

13
00:00:48,000 --> 00:00:50,000
Mijn naam is Joop Snijder, CTO bij Aigency.

14
00:00:50,000 --> 00:00:53,000
Mijn naam is Niels Naglé, chapter lead Data & AI bij Info Support.

15
00:00:53,000 --> 00:00:57,000
Joris, dankjewel dat je bij ons in de studio bent gekomen.

16
00:00:57,000 --> 00:01:01,000
Zou je je aan de luisteraars willen voorstellen?

17
00:01:01,000 --> 00:01:04,000
Goedemiddag of goeieavond.

18
00:01:04,000 --> 00:01:07,000
Dat maakt voor de podcast niet zo veel uit.

19
00:01:07,000 --> 00:01:09,000
Mijn naam is Joris Castermans.

20
00:01:09,000 --> 00:01:14,000
Ik ben de oprichter van Whispp, gevestigd in Leiden.

21
00:01:14,000 --> 00:01:17,000
En wat is Whispp?

22
00:01:17,000 --> 00:01:20,000
Ja, dan moet ik denk ik bij het begin beginnen.

23
00:01:20,000 --> 00:01:25,000
Want ik ben, en dat merk je misschien straks ook wel, dat ik tot stotter.

24
00:01:25,000 --> 00:01:28,000
En ik stotter nu niet zo heel veel meer.

25
00:01:28,000 --> 00:01:30,000
Ik heb soms wel wat blokkades.

26
00:01:30,000 --> 00:01:33,000
En zeker als ik moe ben, dan wordt dat meer.

27
00:01:33,000 --> 00:01:36,000
En als ik gestrest ben.

28
00:01:36,000 --> 00:01:40,000
Maar als kind heb ik gewoon veel, veel meer gestotterd.

29
00:01:40,000 --> 00:01:44,000
En vooral op de middelbare school bijvoorbeeld, vond ik dat echt wel heel vervelend.

30
00:01:44,000 --> 00:01:50,000
En heb ik gewoon, ja, een soort van de pijn gevoeld van, ja, toch niet mezelf eigenlijk te kunnen zijn.

31
00:01:50,000 --> 00:01:55,000
En ik heb ongeveer vijf en een half jaar geleden een idee gehad.

32
00:01:55,000 --> 00:01:59,000
Het centrale idee voor Whispp.

33
00:01:59,000 --> 00:02:04,000
Dat is eigenlijk gebaseerd op het feit dat mensen die heel stevig stotteren, wanneer zij fluisteren,

34
00:02:04,000 --> 00:02:06,000
dat ze dan vloeiend spreken.

35
00:02:06,000 --> 00:02:11,000
En daarbij is niet het doel vloeiend spreken, maar vooral dat je in jezelf kunt zijn.

36
00:02:11,000 --> 00:02:13,000
Dat je je gedachten kunt laten stromen.

37
00:02:13,000 --> 00:02:22,000
En dat je door te fluisteren ook veel meer ontspannend spreekt.

38
00:02:22,000 --> 00:02:31,000
En dat was dus het startpunt, samen met het feit dat mensen die stevig stotteren,

39
00:02:31,000 --> 00:02:33,000
het heel vervelend vinden om te bellen.

40
00:02:33,000 --> 00:02:36,000
Dat is natuurlijk heel vervelend, mensen kunnen je niet zien.

41
00:02:36,000 --> 00:02:38,000
Dus daar kwamen eigenlijk twee dingen samen.

42
00:02:38,000 --> 00:02:43,000
Dan kunnen we niet AI ontwikkelen om fluisterend te kunnen bellen,

43
00:02:43,000 --> 00:02:51,000
maar waarbij dan de gesprekspartner aan de andere kant van de lijn jouw gewone natuurlijke stem hoort.

44
00:02:51,000 --> 00:02:56,000
Dus goed te verstaan, maar ook dat dat jouw stem is.

45
00:02:56,000 --> 00:02:57,000
Ja precies.

46
00:02:57,000 --> 00:03:03,000
Want als je fluistert en dat wordt versterkt, dan klinkt dat heel naar en dat klinkt vervelend.

47
00:03:03,000 --> 00:03:08,000
Dus dat was de kern van het idee.

48
00:03:08,000 --> 00:03:14,000
Die blokkade, want jij hebt het over dat je gedachten kunnen blijven stromen.

49
00:03:14,000 --> 00:03:16,000
Daar heb ik eigenlijk nog nooit zo bij stilgestaan.

50
00:03:16,000 --> 00:03:21,000
Maar op het moment dat je stottert, stopt dat dan?

51
00:03:21,000 --> 00:03:25,000
Omdat je met iets anders bezig bent, qua cognitieve belasting?

52
00:03:25,000 --> 00:03:29,000
Ja, stotteren is wat dat betreft een heel bijzonder fenomeen.

53
00:03:29,000 --> 00:03:38,000
Want wat je vaak hoort, dat is dat mensen wanneer ze met zichzelf spreken,

54
00:03:38,000 --> 00:03:44,000
dus er zijn geen mensen in de ruimte, dat ze dan veel vloeiender spreken.

55
00:03:44,000 --> 00:03:49,000
Dus er is in principe niet zo heel veel mis met je lichaam.

56
00:03:49,000 --> 00:04:01,000
Maar er is een soort van neurologisch weefvouwtje bij de communicatie binnen het spraaksysteem.

57
00:04:01,000 --> 00:04:08,000
Waarbij dus ook stress en spanning, die je ook vanaf jongs af aan hebt geleerd,

58
00:04:08,000 --> 00:04:16,000
die bouwt zich op en die twee samen maken dan dat je gaat stotteren.

59
00:04:16,000 --> 00:04:19,000
En dat is eigenlijk ook het bruggetje naar het fluisteren.

60
00:04:19,000 --> 00:04:23,000
Wanneer je dus gaat fluisteren, dan verandert het neurologisch systeem.

61
00:04:23,000 --> 00:04:28,000
Het spraaksysteem, je gebruikt je stembanden niet, waardoor je dus veel vloeiender spreekt.

62
00:04:28,000 --> 00:04:32,000
Maar je hebt daarnaast ook niet die druk gevoeld vanaf jongs af aan,

63
00:04:32,000 --> 00:04:35,000
van wanneer ik fluister, dan stotter ik.

64
00:04:35,000 --> 00:04:39,000
Dus het is een beetje nature nurture, die combinatie,

65
00:04:39,000 --> 00:04:44,000
dat je veel vloeiender en vooral veel meer ontspannen spreekt.

66
00:04:44,000 --> 00:04:48,000
En geldt dat voor iedereen dan? Iedereen die stottert, als die fluistert dan?

67
00:04:48,000 --> 00:04:56,000
Ja, dat is wetenschappelijk bevestigd, dat eigenlijk gemiddeld gesproken de stotterfrequentie met 85% reduceert.

68
00:04:56,000 --> 00:05:01,000
En dat vind ik toch zelf ook altijd wel heel bijzonder.

69
00:05:01,000 --> 00:05:05,000
Want dat is iets wat ik natuurlijk zelf heb, dus dat ligt heel erg dicht bij mij.

70
00:05:05,000 --> 00:05:10,000
Maar toen we daarmee startten, toen zijn er heel veel mensen die hebben gezegd,

71
00:05:10,000 --> 00:05:15,000
ja maar ik ben mijn stem kwijt door bijvoorbeeld keelkanker of stembandverlamming.

72
00:05:15,000 --> 00:05:18,000
Dat is een hele trits van stemaandoeningen.

73
00:05:18,000 --> 00:05:22,000
Dus daarmee kunnen wij nog veel meer mensen helpen.

74
00:05:22,000 --> 00:05:27,000
En dat is natuurlijk super mooi, dat we beginnen met een persoonlijk idee,

75
00:05:27,000 --> 00:05:36,000
vanuit een persoonlijke behoefte of een pijn die je zelf hebt gevoeld.

76
00:05:36,000 --> 00:05:39,000
En dat je daar vervolgens nog veel meer mensen mee kunt helpen.

77
00:05:39,000 --> 00:05:41,000
Ja, wel waanzinnig.

78
00:05:41,000 --> 00:05:47,000
Want we zitten in een AI-podcast, wat is het AI-element in jouw oplossing?

79
00:05:47,000 --> 00:05:53,000
Ja, nou kijk, je moet je voorstellen dat als jij fluistert,

80
00:05:53,000 --> 00:05:57,000
en voor mensen die bijvoorbeeld stotteren, dan is dat een hele zuivere fluister,

81
00:05:57,000 --> 00:05:59,000
dan fluister je op deze manier.

82
00:05:59,000 --> 00:06:05,000
En nu doe ik dat natuurlijk dicht bij de microfoon hier, dus dat is goed te verstaan.

83
00:06:05,000 --> 00:06:13,000
Wanneer je het spectrogram bekijkt van dit fragment, wat ik net deed,

84
00:06:13,000 --> 00:06:19,000
dan is dat niet te vergelijken met het spectrogram van gewone spraak.

85
00:06:19,000 --> 00:06:25,000
Want daarin heb je een toonhoogte, daar heb je de pitch van je stem,

86
00:06:25,000 --> 00:06:31,000
met de harmonische frequentie, met formanten die dus...

87
00:06:31,000 --> 00:06:37,000
Dat zijn eigenlijk van die pieken die je ziet als je zo'n wavefile ziet op je computer of zo.

88
00:06:37,000 --> 00:06:38,000
Ja, precies.

89
00:06:38,000 --> 00:06:42,000
Want er zit eigenlijk een soort basisfrequentie.

90
00:06:42,000 --> 00:06:47,000
Dat zorgt ervoor dat mijn stem klinkt zoals mijn stem klinkt,

91
00:06:47,000 --> 00:06:54,000
door de stembanden die samen komen, die trillen.

92
00:06:54,000 --> 00:07:03,000
En dan door vervolgens de spraak te articuleren met mijn keel, mijn mond, mijn tong, mijn lippen,

93
00:07:03,000 --> 00:07:11,000
zorg ik ervoor dat dat geluid dat mijn stembanden creëren naar woorden worden gebracht.

94
00:07:11,000 --> 00:07:14,000
Dat is het source-filter model.

95
00:07:14,000 --> 00:07:15,000
Oké.

96
00:07:15,000 --> 00:07:21,000
Dat is misschien een beetje een lange opmaat voor jouw vraag,

97
00:07:21,000 --> 00:07:28,000
want met klassieke methodes, de digitale signaalprocessing,

98
00:07:28,000 --> 00:07:34,000
zou je wel wat frequentiebanden kunnen versterken en je kunt de spraakverstaanbaarheid ook wel verbeteren.

99
00:07:34,000 --> 00:07:42,000
Maar je moet je voorstellen, dat spectrogram van een fluister, dat is zo verschillend,

100
00:07:42,000 --> 00:07:46,000
dat kun je niet meer met de klassieke methodes verrijken.

101
00:07:46,000 --> 00:07:57,000
Dus je hebt AI nodig om dat op een hele slimme manier, die vertaling te maken, de klank zeg maar, in te kleuren.

102
00:07:57,000 --> 00:07:58,000
Ja, precies.

103
00:07:58,000 --> 00:08:04,000
En je geeft ook aan, het is ook een beetje de personen, de stem, het geluid dat je maakt, dat is heel persoonlijk.

104
00:08:04,000 --> 00:08:10,000
Hoe zorgt het ervoor dat het dan de persoonlijke stem is, van fluisteren naar die persoonlijke stem, wat je net zegt?

105
00:08:10,000 --> 00:08:11,000
Goeie vraag.

106
00:08:11,000 --> 00:08:16,000
Kijk, wij hebben een heel groot model, dat is het basismodel.

107
00:08:16,000 --> 00:08:25,000
In principe de fluisterklank of de pathologische klank, die kan ook wat rauwer zijn.

108
00:08:25,000 --> 00:08:35,000
Mensen met keelkanker, die spreken dan ook vaak met een spraakprothese, via de slokdarm.

109
00:08:35,000 --> 00:08:42,000
Dus die slokdarm gaat eigenlijk resoneren, dat is een veel rauwere klank.

110
00:08:42,000 --> 00:08:54,000
En dat is het mooie, Whispp werkt zowel voor die hele zuivere fluister, tot aan, wat ik net beschreef, die hele rauwe spraak.

111
00:08:54,000 --> 00:09:07,000
En het personaliseren van die conversie, daar hebben we twee minuten van je spraak nodig, van je gezonde stem.

112
00:09:07,000 --> 00:09:08,000
Maar twee minuten?

113
00:09:08,000 --> 00:09:09,000
Ja.

114
00:09:09,000 --> 00:09:13,000
Dus dat wordt toegevoegd aan het grote model.

115
00:09:13,000 --> 00:09:23,000
En je moet je voorstellen, mensen die stotteren kunnen dat bijvoorbeeld wel, in de Whispp kunnen ze zinnetjes spreken.

116
00:09:23,000 --> 00:09:33,000
Daar wordt eigenlijk een speaker embedding mee gecreëerd en dat wordt toegevoegd aan het grote model.

117
00:09:33,000 --> 00:09:35,000
Dus daarmee wordt het gepersonaliseerd.

118
00:09:35,000 --> 00:09:41,000
Voor mensen die hun stem kwijt zijn, dan heb je de stemopnames van vroeger nodig.

119
00:09:41,000 --> 00:09:47,000
En dat kost ook wat meer tijd van onderkant, dus dat is meer een service.

120
00:09:47,000 --> 00:09:52,000
En dan vanuit die opnames naar die persoonlijke stem te komen.

121
00:09:52,000 --> 00:10:04,000
Een mooi voorbeeld is trouwens, dat kun je ook op de website bekijken en beluisteren, waarbij we dit hebben gedaan voor een manier met keelkanker.

122
00:10:04,000 --> 00:10:08,000
En dat is best wel een heel emotioneel moment.

123
00:10:08,000 --> 00:10:18,000
Want hij hoort dus, hij had drie jaar geleden keelkanker gehad en hij hoort weer zijn stem op het moment dat hij dus spreekt.

124
00:10:18,000 --> 00:10:21,000
Voor zijn vrouw was dat natuurlijk ook heel emotioneel.

125
00:10:21,000 --> 00:10:24,000
Dus dat raakt mensen heel erg.

126
00:10:24,000 --> 00:10:25,000
Ja, snap ik.

127
00:10:25,000 --> 00:10:26,000
Heel erg.

128
00:10:26,000 --> 00:10:35,000
Hoe verschilt dit van, Apple die heeft in zijn toegankelijkheidsmogelijkheden, hebben zij eigenlijk nu ongeveer ook zoiets.

129
00:10:35,000 --> 00:10:42,000
Ik heb dat uitgeprobeerd, maar dan moest ik bijna een half uur in spreken, 150 zinnen.

130
00:10:42,000 --> 00:10:44,000
Ja, dat is een behoorlijke tijd. Ik heb het ook gedaan.

131
00:10:44,000 --> 00:10:46,000
En dat viel niet mee, moet ik zeggen.

132
00:10:46,000 --> 00:10:52,000
En ik vond de uitkomst wel cool, omdat het kon.

133
00:10:52,000 --> 00:10:54,000
Hoorde ik helemaal mezelf.

134
00:10:54,000 --> 00:11:03,000
Ja, nou moet ik wel zeggen dat wij, wanneer je dat doet, ik zou zeggen ga dat ook doen zelf, vanavond op de bank.

135
00:11:03,000 --> 00:11:08,000
Want het is dus binnen vijf minuutjes ben je er mee bezig.

136
00:11:08,000 --> 00:11:10,000
Laat het zeven zijn.

137
00:11:10,000 --> 00:11:14,000
Maar dat is herkenbaar jouw stem.

138
00:11:14,000 --> 00:11:16,000
Dus dat is nu de status.

139
00:11:16,000 --> 00:11:19,000
Dus daar moeten we natuurlijk ook verder nog in verbeteren.

140
00:11:19,000 --> 00:11:22,000
Maar het is wel herkenbaar jouw stem.

141
00:11:22,000 --> 00:11:30,000
Kijk, het grote verschil met Personal Voice, dat is de naam van, binnen de iPhone.

142
00:11:30,000 --> 00:11:32,000
Dat is echt puur text to speech.

143
00:11:32,000 --> 00:11:37,000
En dat kan natuurlijk voor heel veel mensen ontzettend waardevol zijn.

144
00:11:37,000 --> 00:11:41,000
Mensen die helemaal geen klank meer kunnen voortbrengen.

145
00:11:41,000 --> 00:11:51,000
Mensen die ook, bijvoorbeeld door Ales of Parkinson, heel slecht spreken wat betreft articulatie.

146
00:11:51,000 --> 00:12:07,000
Dus dan heb je dus ook bedrijven, bijvoorbeeld een bekende partij zoals bijvoorbeeld Voice It, die doen ESR voor non-standard speech.

147
00:12:07,000 --> 00:12:14,000
Dus die kunnen van die spraak het tekst maken en dan kun je vervolgens van die tekst dat synthetiseren.

148
00:12:14,000 --> 00:12:17,000
Maar dat komt met een grote vertraging.

149
00:12:17,000 --> 00:12:22,000
Dat is al snel twee, drie, vier seconden, want er zitten taalmodellen in.

150
00:12:22,000 --> 00:12:29,000
En wanneer die spraak niet herkend wordt, dan moet je typen.

151
00:12:29,000 --> 00:12:32,000
En dan heb je niet echt een heel lekker gesprek als je typt.

152
00:12:32,000 --> 00:12:38,000
Dus dat maakt ons zo bijzonder dat het real-time werkt.

153
00:12:38,000 --> 00:12:47,000
Dus je moet je voorstellen, als je nu met WIS belt, dan zit er een latency in van zo'n beetje 250 milliseconden.

154
00:12:47,000 --> 00:12:52,000
Dus dat maakt ons zo bijzonder.

155
00:12:52,000 --> 00:13:06,000
Maar dan moet ik dus wel bijzeggen, wanneer jij op een gegeven moment met een spraak aandoening bijvoorbeeld een hele slechte articulatie hebt, dan kunnen we je op een gegeven moment niet meer helpen.

156
00:13:06,000 --> 00:13:16,000
Dus de spraak moet op zich qua articulatie, het filter, moet nog goed werken.

157
00:13:16,000 --> 00:13:19,000
Maar wij geven stem.

158
00:13:19,000 --> 00:13:20,000
Cool.

159
00:13:20,000 --> 00:13:21,000
Mooi.

160
00:13:21,000 --> 00:13:26,000
Nou en het is natuurlijk niet voor niks dat het iets unieks is.

161
00:13:26,000 --> 00:13:30,000
Dat heb je denk ik wel de afgelopen maanden gemerkt.

162
00:13:30,000 --> 00:13:39,000
Toen we hier naartoe liepen, vertelde je een hele reeks van dingen die je zo overkomen zou je dat ook met de luisteraars willen delen.

163
00:13:39,000 --> 00:13:40,000
Er is nogal wat gebeurd.

164
00:13:40,000 --> 00:13:44,000
Wij hebben elkaar op de World Summit AI in oktober ontmoet.

165
00:13:44,000 --> 00:13:49,000
Toen was ik heel erg onder de indruk van het product dat je haalt.

166
00:13:49,000 --> 00:13:53,000
En toen had ik ook echt zoiets van, ja ik wil dat je dit bij ons komt vertellen.

167
00:13:53,000 --> 00:13:58,000
En in die tussentijd was het best wel moeilijk een afspraak te maken, want dat had een reden.

168
00:13:58,000 --> 00:14:02,000
Ja, we zijn wel druk geweest.

169
00:14:02,000 --> 00:14:08,000
We zijn begin van het jaar naar CES, naar de grote beurs in Las Vegas geweest.

170
00:14:08,000 --> 00:14:10,000
Mee met de Nederlandse missie.

171
00:14:10,000 --> 00:14:14,000
Echt fantastisch trouwens hoe je daar mee wordt genomen.

172
00:14:14,000 --> 00:14:18,000
Dat je op die trein stapt, zeg maar, vliegtuig stapt.

173
00:14:18,000 --> 00:14:23,000
En dat je, ja, dat is gewoon zo ontzettend krachtig.

174
00:14:23,000 --> 00:14:29,000
Dat die hele missie zo eigenlijk voor je wordt georganiseerd.

175
00:14:29,000 --> 00:14:35,000
Met alle PR-kansen die daarbij komen.

176
00:14:35,000 --> 00:14:39,000
Wat daar gebeurde was dat wij benaderd waren door Microsoft.

177
00:14:39,000 --> 00:14:48,000
En daar werd ons gevraagd, ja, we willen graag een persoonlijke demo laten geven door jullie,

178
00:14:48,000 --> 00:14:50,000
door ons baas, werd mij verteld.

179
00:14:50,000 --> 00:14:53,000
En zij kwamen langs met een team, drie, vier man.

180
00:14:53,000 --> 00:14:55,000
En vervolgens nog een keer.

181
00:14:55,000 --> 00:14:56,000
En ze wilden de demo horen.

182
00:14:56,000 --> 00:14:59,000
En wat is dan je pitch? En nog een keer doen.

183
00:14:59,000 --> 00:15:04,000
En vervolgens, de volgende dag zou het plaatsvinden, vier uur.

184
00:15:04,000 --> 00:15:10,000
En kwamen ze twee uur ervoor langs van, ja, it's about Satya Nadella.

185
00:15:10,000 --> 00:15:13,000
De grote baas van Microsoft.

186
00:15:13,000 --> 00:15:19,000
Dus toen voelde ik wel heel mijn hart in mijn keel kloppen van, oh wat mij is zo ontzettend gaaf.

187
00:15:19,000 --> 00:15:23,000
Dus ontzettend bijzonder dat wij door hun waren geselecteerd.

188
00:15:23,000 --> 00:15:30,000
Kijk, voor hen was natuurlijk AI, was natuurlijk, he, bedoel, het is de rode draad.

189
00:15:30,000 --> 00:15:39,000
Eh, bijvoorbeeld naast ons, de stand, er stond het bedrijf PhoneCam.

190
00:15:39,000 --> 00:15:43,000
Die werden ook bezocht door Satya Nadella.

191
00:15:43,000 --> 00:15:44,000
Ja.

192
00:15:44,000 --> 00:15:47,000
Met een hele kleine bodycam.

193
00:15:47,000 --> 00:15:53,000
Dus dat was de rode draad van, he, van zijn personal tour.

194
00:15:53,000 --> 00:16:00,000
Vervolgens hebben we nog iets van vijf groepen met allerlei VC's, eh, VPs gehad.

195
00:16:00,000 --> 00:16:02,000
Dus dat was echt, eh…

196
00:16:02,000 --> 00:16:03,000
De Bobo's kwamen ook nog.

197
00:16:03,000 --> 00:16:05,000
Ja, absoluut. Heel, heel, heel bijzonder.

198
00:16:05,000 --> 00:16:10,000
Daar is dus nu ook contact met het accessibility team.

199
00:16:10,000 --> 00:16:16,000
En, eh, nou, zien wat daar dan verder van, van gaat komen.

200
00:16:16,000 --> 00:16:17,000
Dus dat was CES.

201
00:16:17,000 --> 00:16:18,000
Wat gaaf.

202
00:16:18,000 --> 00:16:22,000
En, eh, ik snap dat je misschien niet alles mag zeggen wat hij, eh, wat hij gezegd heeft.

203
00:16:22,000 --> 00:16:24,000
Maar wat was zijn reactie toen hij dat hoorde?

204
00:16:24,000 --> 00:16:27,000
Ja, hij stond echt te knikken van wauw, he.

205
00:16:27,000 --> 00:16:33,000
Want, want wat we daar deden, was dat we, he, dus een demo hadden, eh, met een studio microfoon.

206
00:16:33,000 --> 00:16:41,000
Waarbij mijn collega Tatsu, hij komt uit Japan trouwens, eh, eh, he, fluisterde.

207
00:16:41,000 --> 00:16:46,000
En we hadden zijn stem gepersonaliseerd, he, zoals ik net vertelde.

208
00:16:46,000 --> 00:16:50,000
En dat is natuurlijk heel bijzonder, dat je vooraf heel even kort dan, he, vertelde, he,

209
00:16:50,000 --> 00:16:53,000
vertelde hij heel kort wat hij dus ging doen, he, met zijn gewone stem.

210
00:16:53,000 --> 00:16:55,000
Dus hij kon, he, zijn gewone stem horen.

211
00:16:55,000 --> 00:17:01,000
Vervolgens ging hij fluisteren, he, en, nou ja, hij zat je nadelen hoorden.

212
00:17:01,000 --> 00:17:02,000
Ja.

213
00:17:02,000 --> 00:17:06,000
Dat werkte, he, de stem, eh, van Tatsu.

214
00:17:06,000 --> 00:17:11,000
En dus hij knikte en het was, he, ja, dus dat werd goed gekeurd, leek het op.

215
00:17:11,000 --> 00:17:17,000
En vervolgens had hij, he, goede vragen en eigenlijk met name over, he, he,

216
00:17:17,000 --> 00:17:21,000
ik bedoel plat geslagen van hoe bijzonder zijn jullie nou eigenlijk?

217
00:17:21,000 --> 00:17:22,000
Ja.

218
00:17:22,000 --> 00:17:26,000
En, eh, nou ja, daar had ik wel, he, ik denk wel goede replieken op.

219
00:17:26,000 --> 00:17:29,000
En, eh, he, maar echt bijzonder.

220
00:17:29,000 --> 00:17:33,000
Die, die, he, die man weet dat natuurlijk vooraf, en niet allemaal precies, maar die schudt.

221
00:17:33,000 --> 00:17:36,000
Dan, he, zo een paar hele goede vragen, he.

222
00:17:36,000 --> 00:17:37,000
Ja.

223
00:17:37,000 --> 00:17:40,000
Ja, eh, eh, uit zijn mouw.

224
00:17:40,000 --> 00:17:46,000
Dus, eh, en het werd ook verteld dat we, dat er best wel veel tijd, dat die best wel heel veel tijd nam, zeg maar.

225
00:17:46,000 --> 00:17:49,000
Dus het was echt, ik denk, vijf minuten dat we daar zo waren.

226
00:17:49,000 --> 00:17:51,000
Dus ik kon best, best wel veel vertellen.

227
00:17:51,000 --> 00:17:52,000
Gaaf.

228
00:17:52,000 --> 00:17:53,000
Het was wel, wel bijzonder.

229
00:17:53,000 --> 00:17:54,000
Ja.

230
00:17:54,000 --> 00:17:58,000
En misschien, eh, kijk normaal gesproken nemen wij het van voor tot achter op, he.

231
00:17:58,000 --> 00:18:03,000
Maar misschien zou dit wel een mooi moment zijn, dat, dat ik hier, eh, ga, erin ga editen.

232
00:18:03,000 --> 00:18:07,000
Dat wij allebei eens eventjes de, de app gaan uitproberen.

233
00:18:07,000 --> 00:18:10,000
En het laten horen van hoe wij fluisteren en dan, hoe het dan klinkt.

234
00:18:10,000 --> 00:18:11,000
Dat lijkt me een heel goed idee.

235
00:18:11,000 --> 00:18:12,000
Ja, heel leuk.

236
00:18:12,000 --> 00:18:13,000
Ja.

237
00:18:13,000 --> 00:18:14,000
Gaan we dat doen.

238
00:18:14,000 --> 00:18:15,000
Zeker.

239
00:18:15,000 --> 00:18:16,000
Ik, ik ben sowieso wel heel benieuwd.

240
00:18:16,000 --> 00:18:17,000
Ja, ik ook.

241
00:18:17,000 --> 00:18:18,000
Ja.

242
00:18:18,000 --> 00:18:19,000
Nou, dit is dus die edit.

243
00:18:19,000 --> 00:18:21,000
Ik ga je zo direct wat laten horen.

244
00:18:21,000 --> 00:18:27,000
Eerst wat ik gefluisterd heb en daarna de omgezette versie met Whispp.

245
00:18:27,000 --> 00:18:32,000
Let op, het knappe van deze technologie is dat het bijna real time is.

246
00:18:32,000 --> 00:18:41,000
Dus tussen het omzetten van het gefluisterd naar mijn stem, de gegenereerde stem, zit 200 milliseconden.

247
00:18:41,000 --> 00:18:45,000
Ik ga je eerst laten horen wat 200 milliseconden is.

248
00:18:45,000 --> 00:18:49,000
Dan hoor je namelijk hoe onwaarschijnlijk kort dat is.

249
00:18:49,000 --> 00:18:52,000
Daarna, fluisteren, omgezet.

250
00:18:53,000 --> 00:18:59,000
Het mooie van AI is dat je het voor heel veel toepassingen kan gebruiken.

251
00:18:59,000 --> 00:19:05,000
En hoe gaaf is het dat je het ook kan inzetten dat je mensen een stem geeft.

252
00:19:05,000 --> 00:19:07,000
Ik fluister dit nu.

253
00:19:07,000 --> 00:19:11,000
Als het goed is hoor je nu mijn stem op een andere manier.

254
00:19:11,000 --> 00:19:19,000
Dit biedt heel veel nieuwe mogelijkheden voor mensen die niet gebruik kunnen maken zomaar van hun stem.

255
00:19:19,000 --> 00:19:22,000
Ik vind dat echt heel erg gaaf.

256
00:19:22,000 --> 00:19:29,000
Het mooie van AI is dat je het voor heel veel toepassingen kan gebruiken.

257
00:19:29,000 --> 00:19:35,000
En hoe gaaf is het dat je het ook kan inzetten dat je mensen een stem geeft.

258
00:19:35,000 --> 00:19:37,000
Ik fluister dit nu.

259
00:19:37,000 --> 00:19:41,000
Als het goed is hoor je nu mijn stem op een andere manier.

260
00:19:41,000 --> 00:19:49,000
Dit biedt heel veel nieuwe mogelijkheden voor mensen die niet gebruik kunnen maken zomaar van hun stem.

261
00:19:49,000 --> 00:19:53,000
Ik vind dat echt heel erg gaaf.

262
00:19:53,000 --> 00:19:56,000
Dat was de omzetting.

263
00:19:56,000 --> 00:20:02,000
En dan moet je dus bedenken dat dit in bijna realtime, met het vertraging van die hele korte piep,

264
00:20:02,000 --> 00:20:07,000
dat je gefluister wordt omgezet naar zo'n gegenereerde stem.

265
00:20:07,000 --> 00:20:10,000
Ik hoor mezelf terug. Ik ben benieuwd of jij dat ook zo hoort.

266
00:20:10,000 --> 00:20:12,000
We gaan verder met de uitzending.

267
00:20:12,000 --> 00:20:14,000
Leuk man.

268
00:20:14,000 --> 00:20:21,000
Dit was dan de CES, de grote beurs in Las Vegas.

269
00:20:21,000 --> 00:20:23,000
Er is nog meer gebeurd toch?

270
00:20:23,000 --> 00:20:30,000
Ja, want we zijn nu net twee weken terug van de Mobile World Congress in Barcelona.

271
00:20:30,000 --> 00:20:35,000
Eigenlijk was dat misschien nog wel een groter succes.

272
00:20:35,000 --> 00:20:37,000
Althans het wordt steeds concreter.

273
00:20:37,000 --> 00:20:40,000
We zijn natuurlijk vorig jaar ook naar CES gegaan.

274
00:20:40,000 --> 00:20:44,000
We hadden een soort proof of concept met een demo ook.

275
00:20:44,000 --> 00:20:47,000
Maar je ziet dat we het steeds concreter hebben.

276
00:20:47,000 --> 00:20:53,000
Je kunt trouwens de Android-app en de iOS-app downloaden in de stores.

277
00:20:53,000 --> 00:20:56,000
Probeer dat vooral zelf ook.

278
00:20:56,000 --> 00:21:03,000
Met een gezonde stem kun je het gewoon proberen en zien hoe het gaat klinken met jouw stem.

279
00:21:03,000 --> 00:21:07,000
Je ziet dus dat het steeds concreter wordt.

280
00:21:07,000 --> 00:21:19,000
Het doel voor ons, ook voor Mobile World Congress, was met name om ook heel dicht tegen de telcos te gaan.

281
00:21:19,000 --> 00:21:22,000
Daar goed contact mee te gaan zoeken.

282
00:21:22,000 --> 00:21:26,000
Omdat wij denken, dat zij natuurlijk miljoenen klanten hebben wereldwijd,

283
00:21:26,000 --> 00:21:31,000
waarvan een deel dus wel betaald voor hun mobiele abonnement,

284
00:21:31,000 --> 00:21:35,000
maar eigenlijk niet in staat zijn om makkelijk en duidelijk te kunnen bellen.

285
00:21:35,000 --> 00:21:40,000
Daar ligt ook een soort van verantwoordelijkheid voor de telcos.

286
00:21:40,000 --> 00:21:49,000
Wat heel mooi was, we waren genomineerd als finalist voor de Four Years From Now Award.

287
00:21:49,000 --> 00:21:52,000
Een ontzettend grote eer.

288
00:21:52,000 --> 00:21:58,000
Want je moet je voorstellen, wereldwijd zijn er duizenden startups die daarvoor zijn gegaan.

289
00:21:58,000 --> 00:22:01,000
We hadden gehoord dat we bij de laatste vijf waren.

290
00:22:01,000 --> 00:22:05,000
Een paar weken later hoorden we dat we bij de vijf finalisten behoorden.

291
00:22:05,000 --> 00:22:16,000
Dat betekende dus dat ik mocht pitchen op het grote event van Four Years From Now.

292
00:22:16,000 --> 00:22:19,000
Op de grote mainstage daar.

293
00:22:19,000 --> 00:22:22,000
Ik heb nog nooit op zo'n grote stage gestaan.

294
00:22:22,000 --> 00:22:25,000
Met een jury van VCs.

295
00:22:25,000 --> 00:22:29,000
Dus dat was echt een stipt vier minuten pitchen.

296
00:22:29,000 --> 00:22:36,000
En daarna vier minuten vragen beantwoorden van VCs.

297
00:22:36,000 --> 00:22:40,000
Daar zijn hele mooie foto's van gemaakt.

298
00:22:40,000 --> 00:22:48,000
Dat staat nu heel hoog in mijn lijstje van mooie dingen die ik heb gedaan.

299
00:22:48,000 --> 00:22:56,000
Daarnaast hadden we ook nog de Pitch to Pitch Award gewonnen.

300
00:22:56,000 --> 00:22:59,000
Het Pitch event van Mobile World Congress.

301
00:22:59,000 --> 00:23:04,000
Wat op de broadcast stage zo werd gedaan.

302
00:23:04,000 --> 00:23:05,000
Ook met een jury.

303
00:23:05,000 --> 00:23:07,000
Dus die hadden we gewonnen.

304
00:23:07,000 --> 00:23:16,000
En we hebben Best of Mobile World Congress 2024 van de Android Authority prijs gewonnen.

305
00:23:16,000 --> 00:23:19,000
Dus een paar van die highlights.

306
00:23:19,000 --> 00:23:21,000
En natuurlijk ook met het team.

307
00:23:21,000 --> 00:23:22,000
We zijn met z'n vieren gegaan.

308
00:23:22,000 --> 00:23:25,000
Natuurlijk ontzettend gaaf om dat samen te doen.

309
00:23:25,000 --> 00:23:29,000
En heel veel waardevolle contacten opgedaan.

310
00:23:29,000 --> 00:23:35,000
Wanneer ik teveel praat moet je het zeggen hoor.

311
00:23:35,000 --> 00:23:38,000
Maar het was fantastisch dat we door die finalist,

312
00:23:38,000 --> 00:23:40,000
dat we finalist waren,

313
00:23:40,000 --> 00:23:43,000
konden we ook met de GSMA Strategy Session.

314
00:23:43,000 --> 00:23:48,000
De GSMA is eigenlijk de vertegenwoordiger van Antons.

315
00:23:48,000 --> 00:23:54,000
De samenwerkende Telcos wereldwijd.

316
00:23:54,000 --> 00:24:01,000
Dus daar waren eigenlijk alle vertegenwoordigers van alle Telcos wereldwijd.

317
00:24:01,000 --> 00:24:05,000
We hebben volgens ons ook van KPN.

318
00:24:05,000 --> 00:24:08,000
Maar ook de grote wereldwijd.

319
00:24:08,000 --> 00:24:09,000
Ze waren er allemaal.

320
00:24:09,000 --> 00:24:11,000
En daar heb ik dus mee mogen kennis maken.

321
00:24:11,000 --> 00:24:13,000
Ik heb daar ook mogen pitchen.

322
00:24:13,000 --> 00:24:16,000
En daar heb ik hele waardevolle contacten nu op gedaan.

323
00:24:16,000 --> 00:24:21,000
Om verder te praten over samenwerking met Telcos.

324
00:24:21,000 --> 00:24:24,000
En ook over de samenwerking met de mensen die daar werken.

325
00:24:36,000 --> 00:24:38,000
En ook over de samenwerking met de mensen die daar werken.

326
00:24:48,000 --> 00:24:51,000
En ook over de samenwerking met de mensen die daar werken.

327
00:24:51,000 --> 00:24:53,000
En ook over de samenwerking met de mensen die daar werken.

328
00:33:37,000 --> 00:33:39,000
Dus dat wij een hele duidelijke positionering hebben van...

329
00:33:39,000 --> 00:33:43,000
Wij geven stem aan stemloze spraak.

330
00:33:43,000 --> 00:33:45,000
En hoe gaven ze dat al toch?

331
00:33:45,000 --> 00:33:47,000
Ik bedoel, dat is een waanzinnig.

332
00:33:47,000 --> 00:33:51,000
Gewoon het idee dat je je mensen mee helpt.

333
00:33:51,000 --> 00:33:53,000
Dat begint inderdaad met je persoonlijke problemen.

334
00:33:53,000 --> 00:33:57,000
Wat je zegt, mensen die hun stem kwijt aan het raken zijn.

335
00:33:57,000 --> 00:34:03,000
Je kan je er geen voorstelling bij maken wat het zou betekenen als je gewoon je stem niet hebt.

336
00:34:03,000 --> 00:34:09,000
En dat is ook, want misschien ken je de termologie voice banking.

337
00:34:09,000 --> 00:34:21,000
Je vertelde net wat die nieuwe functionaliteit van de iPhone, de personal voice,

338
00:34:21,000 --> 00:34:29,000
met die 150 zinnen, dan sla je eigenlijk je stem op voor het geval dat het fout gaat met je stem.

339
00:34:29,000 --> 00:34:33,000
En precies wat je zegt, je stem neem je voor lief.

340
00:34:33,000 --> 00:34:35,000
Dat is gewoon je stem, je weet niet beter.

341
00:34:35,000 --> 00:34:41,000
Maar als je hem kwijt bent, dan merk je pas wat voor gevolgen dat heeft voor je persoonlijk leven.

342
00:34:41,000 --> 00:34:43,000
Voor je werk ook.

343
00:34:43,000 --> 00:34:45,000
Ik wou dat zeggen, heel simpel.

344
00:34:45,000 --> 00:34:49,000
Als je verkouden bent en je stem niet hebt, en mevrouw zit in het basel onderwijs,

345
00:34:49,000 --> 00:34:53,000
die geen klas, je kan wel voor de klas gaan staan, maar als je je stem niet hebt,

346
00:34:53,000 --> 00:34:55,000
dan zit je kinderen aan het werk te krijgen die het juiste ding doen.

347
00:34:55,000 --> 00:34:57,000
Dan kan je gewoon niet aan het werk.

348
00:34:57,000 --> 00:34:59,000
Heel mooi.

349
00:34:59,000 --> 00:35:02,000
We hebben ook een virtual co-host.

350
00:35:02,000 --> 00:35:06,000
En die wil eigenlijk aan onze gasten ook altijd een vraag stellen.

351
00:35:22,000 --> 00:35:30,000
Ik ben Aisha. De AI die je zal begeleiden in deze podcast, heb je er bezwaar tegen als ik je een vraag stel?

352
00:35:30,000 --> 00:35:32,000
Nee hoor.

353
00:35:32,000 --> 00:35:38,000
Heb je ooit een 'happy feet' moment gehad waarop de intelligentie van de AI je blij maakte?

354
00:35:38,000 --> 00:35:50,000
Haha, een happy feet moment? Ja, van een film. Van een film van happy feet. Dat je heel blij bent.

355
00:35:50,000 --> 00:35:54,000
Wij verzinnen ze niet, de vragen.

356
00:35:54,000 --> 00:36:00,000
Dat is, ja. En dan bedoel je, in een generieke zin.

357
00:36:00,000 --> 00:36:05,000
Ja, maar goed, dat is natuurlijk mijn vakdeformatie.

358
00:36:05,000 --> 00:36:14,000
Als je ziet hoe fantastisch de spraaksynthese momenteel door bepaalde partijen wordt gedaan.

359
00:36:14,000 --> 00:36:23,000
Bijvoorbeeld 11 Labs, dat is natuurlijk waanzinnig.

360
00:36:23,000 --> 00:36:28,000
Hoe dat de laatste jaren gigantisch is verbeterd.

361
00:36:28,000 --> 00:36:32,000
En ja, goed. Dat is de happy kant.

362
00:36:32,000 --> 00:36:36,000
Maar natuurlijk ook van, wat gaat dat doen?

363
00:36:36,000 --> 00:36:41,000
Daar heb je misschien het linkje met wat wij doen.

364
00:36:41,000 --> 00:36:45,000
Met Whispp bellen. Je voordoen als iemand anders.

365
00:36:45,000 --> 00:36:52,000
Dat is natuurlijk een risico. Dus wanneer je belt met de Whispp app, dan hoor je beide.

366
00:36:52,000 --> 00:37:01,000
De gebruiker als de ontvangende kant, hoort een klein geautomatiseerd spraakbericht.

367
00:37:01,000 --> 00:37:04,000
Dat dit gesprek gevoerd is met Whispp.

368
00:37:04,000 --> 00:37:07,000
Dat is puur om transparant te zijn.

369
00:37:07,000 --> 00:37:10,000
Dat die technologie wordt gebruikt.

370
00:37:10,000 --> 00:37:17,000
Daarnaast heb je natuurlijk ook nog het personaliseren van die stem.

371
00:37:17,000 --> 00:37:22,000
Dat je niet de fragmenten van jullie mooie podcast, dat mensen dat gaan gebruiken.

372
00:37:22,000 --> 00:37:25,000
Voor dan hun Whispp stem.

373
00:37:25,000 --> 00:37:29,000
Dus dat is ook de reden dat je specifieke zinnetjes moet voorlezen.

374
00:37:29,000 --> 00:37:31,000
Ook echt die zinnetjes.

375
00:37:31,000 --> 00:37:35,000
Dat moet ook binnen een bepaalde tijd.

376
00:37:35,000 --> 00:37:37,000
Dus daarvoor zorg je ervoor.

377
00:37:37,000 --> 00:37:41,000
Dat is een soort van security by design methode.

378
00:37:41,000 --> 00:37:48,000
Dat je zeker weet dat die persoonlijke Whispp stem niet te fake is om te spoofen.

379
00:37:48,000 --> 00:37:49,000
Handig.

380
00:37:49,000 --> 00:37:51,000
Had ik niet eens maar nagedacht.

381
00:37:51,000 --> 00:37:56,000
Ja, sowieso. We hebben nu voor zoveel uur audio opgeleverd.

382
00:37:56,000 --> 00:38:01,000
Met de 11laps moet je in een weeklaat kunnen komen.

383
00:38:01,000 --> 00:38:05,000
Ja, dat soort aspecten zou je snel overheen kunnen kijken.

384
00:38:05,000 --> 00:38:08,000
En het belang daarvan is natuurlijk immens.

385
00:38:08,000 --> 00:38:14,000
Je diepgaande uitleg heeft veel nieuwe inzichten gegeven. Bedankt.

386
00:38:14,000 --> 00:38:16,000
Geen dank.

387
00:38:16,000 --> 00:38:18,000
Ze kwam er even tussendoor.

388
00:38:18,000 --> 00:38:20,000
Leuk.

389
00:38:20,000 --> 00:38:28,000
Je hebt jij vragen. Ik zat nog even in de happy feet.

390
00:38:28,000 --> 00:38:31,000
Ik ben benieuwd. Wat was jouw happy feet?

391
00:38:31,000 --> 00:38:33,000
Mijn happy feet?

392
00:38:33,000 --> 00:38:43,000
Ik heb natuurlijk niet voor niks dat soort dingen uitgeprobeerd.

393
00:38:43,000 --> 00:38:47,000
Zoals die personal voice. Ik ben een Whispp.

394
00:38:47,000 --> 00:38:49,000
Ik vind dit soort dingen.

395
00:38:49,000 --> 00:38:55,000
Dat je AI gaat gebruiken om maatschappelijke problemen op te lossen.

396
00:38:55,000 --> 00:38:58,000
Daar word ik wel heel erg blij van.

397
00:38:58,000 --> 00:39:04,000
We hebben natuurlijk heel veel klanten waarvoor wij maatwerken en AI systemen bouwen.

398
00:39:04,000 --> 00:39:06,000
En de ene keer is dat wel.

399
00:39:06,000 --> 00:39:11,000
Dat je iets maatschappelijks toevoegt. Soms is het om meer geld te verdienen.

400
00:39:11,000 --> 00:39:14,000
Efficiëntie. Kwaliteit.

401
00:39:14,000 --> 00:39:17,000
Ik word daar wel heel erg blij van.

402
00:39:17,000 --> 00:39:22,000
Dat je zo'n intens probleem hebt.

403
00:39:22,000 --> 00:39:25,000
Je begint met je middelbare school.

404
00:39:25,000 --> 00:39:28,000
En dan is het in een heel verhaal achter.

405
00:39:28,000 --> 00:39:30,000
Daar word ik wel heel blij van.

406
00:39:30,000 --> 00:39:32,000
Om het daarop aan te vullen.

407
00:39:32,000 --> 00:39:34,000
Waar ik heel blij van word.

408
00:39:34,000 --> 00:39:38,000
Dat je inderdaad één persoonlijk probleem, wat je zelf ook aangeeft, tackelt.

409
00:39:38,000 --> 00:39:43,000
Maar dat de bijvangst die je erbij kan hebben, dat er allemaal bij komt.

410
00:39:43,000 --> 00:39:45,000
Dat vind ik zo mooi.

411
00:39:45,000 --> 00:39:46,000
Dit is ons probleem.

412
00:39:46,000 --> 00:39:47,000
Met een breder perspectief.

413
00:39:47,000 --> 00:39:49,000
Daar kunnen we het ook voor inzetten.

414
00:39:49,000 --> 00:39:50,000
Daar zien we ook de waarde.

415
00:39:50,000 --> 00:39:52,000
Daar krijg ik happy feet momenten van.

416
00:39:52,000 --> 00:39:55,000
Daar word ik ook vrolijk van hoor.

417
00:39:55,000 --> 00:40:02,000
Wat dat betreft leuk om misschien over een jaar weer dit gesprek te doen.

418
00:40:02,000 --> 00:40:06,000
Je weet ook niet helemaal wat voor use cases er gaan komen.

419
00:40:06,000 --> 00:40:10,000
Stel dat je daar met je VR bril staat.

420
00:40:10,000 --> 00:40:12,000
Met de metaverse.

421
00:40:12,000 --> 00:40:14,000
En je wil lekker praten en doen.

422
00:40:14,000 --> 00:40:16,000
Maar je wil mensen niet storen.

423
00:40:16,000 --> 00:40:20,000
Dan is dit ook wel een feature die van waarde kan zijn.

424
00:40:20,000 --> 00:40:23,000
Tourguides in een museum.

425
00:40:23,000 --> 00:40:26,000
Die wel willen spreken op dat moment.

426
00:40:26,000 --> 00:40:28,000
Maar voor een bepaald deel.

427
00:40:28,000 --> 00:40:30,000
Of interactie.

428
00:40:30,000 --> 00:40:34,000
Nu is het natuurlijk echt zenden in zo'n museum.

429
00:40:34,000 --> 00:40:36,000
Daar heb je oortjes in en je moet maar gaan.

430
00:40:36,000 --> 00:40:39,000
Maar dat je inderdaad ook dingen zou kunnen vragen.

431
00:40:39,000 --> 00:40:41,000
Zonder dat je daar mensen stoort.

432
00:40:41,000 --> 00:40:43,000
Wat slimmer.

433
00:40:43,000 --> 00:40:45,000
Gewoon bellen in de stilte coupé.

434
00:40:45,000 --> 00:40:47,000
Bellen in de stilte.

435
00:40:47,000 --> 00:40:50,000
Als het echt stil is en je fluistert.

436
00:40:50,000 --> 00:40:52,000
Ik weet het niet toch.

437
00:40:52,000 --> 00:40:55,000
Heel erg mooi.

438
00:40:55,000 --> 00:40:57,000
Super bedankt voor dit gesprek.

439
00:40:57,000 --> 00:40:59,000
Heel erg inspirerend.

440
00:40:59,000 --> 00:41:01,000
Heel erg mooi om te zien.

441
00:41:01,000 --> 00:41:05,000
Als het goed is, is het een tussen-ere-knip.

442
00:41:05,000 --> 00:41:08,000
Heb je gehoord wat we gedaan hebben.

443
00:41:08,000 --> 00:41:12,000
Maar op dit moment is het voor ons ook nog even een verrassing.

444
00:41:12,000 --> 00:41:14,000
Ontzettend bedankt dat je hier wilde zijn.

445
00:41:14,000 --> 00:41:16,000
En dat je je verhaal wilde doen.

446
00:41:16,000 --> 00:41:18,000
Jullie bedankt.

447
00:41:18,000 --> 00:41:20,000
En nog eventjes.

448
00:41:20,000 --> 00:41:23,000
Hoe zoek je het?

449
00:41:23,000 --> 00:41:25,000
Hoe spel je Whispp?

450
00:41:25,000 --> 00:41:28,000
Dat we iedereen even aan de app krijgen.

451
00:41:28,000 --> 00:41:32,000
De website is Whispp.com.

452
00:41:32,000 --> 00:41:36,000
Dat is W-H-I-S-P-P.com.

453
00:41:36,000 --> 00:41:38,000
Dus van whisper.

454
00:41:38,000 --> 00:41:41,000
Daar kun je natuurlijk meer lezen.

455
00:41:41,000 --> 00:41:43,000
Daar kun je ook de filmpjes bekijken.

456
00:41:43,000 --> 00:41:45,000
Daar kun je ook samples beluisteren.

457
00:41:45,000 --> 00:41:50,000
Maar ik zou zeggen, download vooral de Whispp-app voor iOS.

458
00:41:50,000 --> 00:41:52,000
Dan wel voor Android.

459
00:41:52,000 --> 00:41:54,000
Waarmee je, dat is gewoon gratis.

460
00:41:54,000 --> 00:41:56,000
Dat kun je gewoon proberen.

461
00:41:56,000 --> 00:42:01,000
De spraakberichtjes die je daarmee kunt confronteren.

462
00:42:01,000 --> 00:42:02,000
Zelf kunt beluisteren.

463
00:42:02,000 --> 00:42:04,000
Dat kun je gewoon doen.

464
00:42:04,000 --> 00:42:07,000
Je kunt ook 10 minuten bellen daarmee.

465
00:42:07,000 --> 00:42:08,000
Dat proberen.

466
00:42:08,000 --> 00:42:11,000
Stel dat je het dan vervolgens zo gaaf vindt.

467
00:42:11,000 --> 00:42:16,000
Dan start er een subscription model per maand.

468
00:42:16,000 --> 00:42:20,000
Dus zegt het voort.

469
00:42:20,000 --> 00:42:24,000
Mensen die dit ook willen gebruiken voor werk.

470
00:42:24,000 --> 00:42:28,000
Daar gaat het vergoed worden door het WV.

471
00:42:28,000 --> 00:42:31,000
Dus dat is denk ik ook goed om te weten.

472
00:42:31,000 --> 00:42:34,000
En natuurlijk moeten de zorgverzekeraars later ook volgen.

473
00:42:34,000 --> 00:42:38,000
Dus dat is bij deze ook de oproep voor degenen die dat horen.

474
00:42:38,000 --> 00:42:41,000
Maar ik zou zeggen, probeer het.

475
00:42:41,000 --> 00:42:45,000
En zelfs ook wanneer je een gezonde stem hebt.

476
00:42:45,000 --> 00:42:48,000
Is het ook best wel leuk om gewoon te testen.

477
00:42:48,000 --> 00:42:50,000
En ermee te spelen.

478
00:42:50,000 --> 00:42:53,000
Wij zullen in ieder geval de linkjes ook opnemen in de show notes.

479
00:42:53,000 --> 00:42:55,000
Dat iedereen daarbij kan.

480
00:42:55,000 --> 00:42:56,000
Dankjewel.

481
00:42:56,000 --> 00:43:02,000
Leuk dat jullie weer luisteren naar een aflevering van AIToday Live.

482
00:43:02,000 --> 00:43:06,000
Vergeet je niet te abonneren via je favoriete podcast-app.

483
00:43:06,000 --> 00:43:09,000
Vergeet ook niet die Whispp-app te downloaden.

484
00:43:09,000 --> 00:43:11,000
En tot de volgende keer.

485
00:43:11,000 --> 00:43:13,000
[Muziek]

486
00:43:13,000 --> 00:43:16,000
[Muziek]