1
00:00:00,000 --> 00:00:13,000
Het is vandaag 30 november en het is de verjaardag van ChatGPT.
2
00:00:13,000 --> 00:00:17,080
Een jaar geleden kwam het uit en daar gaat natuurlijk een hoop veranderen.
3
00:00:17,080 --> 00:00:20,880
Mijn leven is in ieder geval veranderd, mijn werkende leven.
4
00:00:20,880 --> 00:00:25,640
En het is denk ik wel leuk om juist terug te kijken van hoe zijn we hier gekomen.
5
00:00:25,640 --> 00:00:37,280
Want het hangt nogal van een aantal toevalligheden aan elkaar, onverwachte wendingen waarop we
6
00:00:37,280 --> 00:00:39,080
op dit punt zijn gekomen.
7
00:00:39,080 --> 00:00:44,280
Want als dit een aantal dingen niet gebeurd zouden zijn, zou OpenAI nu niet zijn waar
8
00:00:44,280 --> 00:00:45,280
ze nu zouden zijn.
9
00:00:45,280 --> 00:00:52,600
En om zo direct vooruit te kijken moeten we eigenlijk even denken aan Winston Churchill
10
00:00:52,600 --> 00:00:56,880
die zei hoe langer je terug kunt kijken, hoe verder je vooruit kunt kijken.
11
00:00:56,880 --> 00:01:01,440
Dus laten we vandaag eens terugkijken op de verjaardag van ChatGPT.
12
00:01:01,440 --> 00:01:09,960
Je zou kunnen zeggen dat de oorsprong van deze technologie begint bij Google Translate.
13
00:01:09,960 --> 00:01:15,880
Google Translate ging er natuurlijk om om dingen te vertalen.
14
00:01:15,880 --> 00:01:17,840
Dus van de ene taal naar de andere taal.
15
00:01:17,840 --> 00:01:20,600
En dat werkte in het begin behoorlijk matig.
16
00:01:20,600 --> 00:01:27,040
Als je dat in het begin gebruikte, merkte je dat het meer een soort van woord voor woord
17
00:01:27,040 --> 00:01:28,240
vertalen was.
18
00:01:28,240 --> 00:01:31,920
En die best wel hele slechte resultaten gaf.
19
00:01:31,920 --> 00:01:37,360
Tot op een bepaalde dag en een keer de resultaten heel veel beter werden.
20
00:01:37,360 --> 00:01:42,640
En dat had te maken met het zogenaamde sequence to sequence algoritme.
21
00:01:42,640 --> 00:01:46,560
En dit klinkt heel technisch en dat is het ook wel een beetje.
22
00:01:46,560 --> 00:01:56,200
Maar wat hij eigenlijk deed was een tekst gebruiken en die omzetten naar getalletjes.
23
00:01:56,200 --> 00:02:01,240
Dus als een soort van tussentaal waarbij er gekeken werd hoe verhouden de woorden in een
24
00:02:01,240 --> 00:02:02,640
zin zich nou tot elkaar.
25
00:02:02,640 --> 00:02:09,560
En vervolgens kon hij dat eigenlijk weer ontcijferen en daar een andere taal tegenaan houden.
26
00:02:09,560 --> 00:02:12,760
Dus ik gaf bijvoorbeeld in I'm a student.
27
00:02:12,760 --> 00:02:17,040
Daar werden allemaal getalletjes aangekoppeld, zogenaamde vector.
28
00:02:17,040 --> 00:02:21,920
En die konden dan gedecodeerd worden met allerlei andere talen.
29
00:02:21,920 --> 00:02:24,560
Dus dat kon zijn Frans, Nederlands, Duits.
30
00:02:24,560 --> 00:02:26,400
Je kon het zo gek niet verzinnen.
31
00:02:26,400 --> 00:02:30,000
Dus de decoder zou in het Nederlands zeggen ik ben een student.
32
00:02:30,000 --> 00:02:33,800
Nou dat lijkt nog op die woord voor woord vertaling.
33
00:02:33,800 --> 00:02:36,360
Maar in het Frans zou het zijn je suis étudiant.
34
00:02:36,360 --> 00:02:38,360
Als ik dat goed uitspreek.
35
00:02:38,360 --> 00:02:41,280
Het is eigenlijk een hele andere zinsconstructie.
36
00:02:41,280 --> 00:02:46,040
Nou daar zijn ze heel lang mee bezig geweest.
37
00:02:46,040 --> 00:02:50,680
We hebben het hier over 2012 dat dit was.
38
00:02:50,680 --> 00:02:55,320
En op een gegeven moment komt er een paper uit, een wetenschappelijk paper.
39
00:02:55,320 --> 00:02:58,720
En dat paper heet 'Attention is all you need'.
40
00:02:58,720 --> 00:03:02,160
En het gek is, ook weer Google.
41
00:03:02,160 --> 00:03:09,600
Allerlei wetenschappers van Google en de Universiteit van Toronto hebben dan een manier bedacht
42
00:03:09,600 --> 00:03:14,880
dat je zowel naar voren als naar achteren kan kijken.
43
00:03:14,880 --> 00:03:17,640
Waardoor je eigenlijk meer context hebt.
44
00:03:17,640 --> 00:03:24,200
En waarbij de machine die vertaling van het een naar het ander veel beter kan uitvoeren.
45
00:03:24,200 --> 00:03:27,640
Een enorme sprong voorwaarts is dat.
46
00:03:27,640 --> 00:03:32,080
Nou er zijn allerlei bedrijven die hiermee aan de gang gaan.
47
00:03:32,080 --> 00:03:33,080
Waaronder OpenAI.
48
00:03:33,080 --> 00:03:39,060
OpenAI heeft in eerste instantie het idee van ja we gaan onderzoek doen naar Artificial
49
00:03:39,060 --> 00:03:41,060
General Intelligence.
50
00:03:41,060 --> 00:03:44,720
En die bouwen hun eerste GPT.
51
00:03:44,720 --> 00:03:47,520
Dan komt GPT2.
52
00:03:47,520 --> 00:03:51,720
En dan hebben we het eerste toeval te pakken.
53
00:03:51,720 --> 00:03:53,720
Want wat gebeurt er?
54
00:03:53,720 --> 00:03:58,520
Op een dag bij Microsoft krijgen ze een DDoS aanval.
55
00:03:58,520 --> 00:04:04,880
Dat is waarbij servers zo worden bestookt dat ze bijna onderuit gaan of onderuit kunnen
56
00:04:04,880 --> 00:04:05,880
gaan.
57
00:04:05,880 --> 00:04:09,000
En Microsoft analyseert dat natuurlijk.
58
00:04:09,000 --> 00:04:17,280
En heel raar voor hun is in plaats van dat die DDoS aanval vanaf een obscure locatie
59
00:04:17,280 --> 00:04:22,040
kwam, bleek het gewoon van servers uit San Francisco te zijn.
60
00:04:22,040 --> 00:04:25,320
Dus dan gingen ze kijken van wie zit hier nou achter.
61
00:04:25,320 --> 00:04:29,400
Rondbellen bleek OpenAI te zijn.
62
00:04:29,400 --> 00:04:32,760
En die DDoS aanval was namelijk op GitHub.
63
00:04:32,760 --> 00:04:40,160
GitHub is de plek die Microsoft gekocht heeft waar heel veel developers open source code
64
00:04:40,160 --> 00:04:41,160
op zetten.
65
00:04:41,160 --> 00:04:46,520
Dus ze zagen eigenlijk dat OpenAI allemaal programmeercode naar binnen aan het halen
66
00:04:46,520 --> 00:04:47,520
was.
67
00:04:47,520 --> 00:04:49,880
Die was dat aan het scrapen, aan het leegtrekken.
68
00:04:49,880 --> 00:04:54,000
Dus die hebben overlegd van ja wat zijn jullie nou aan het doen?
69
00:04:54,000 --> 00:04:56,160
Waar zijn jullie nou mee bezig?
70
00:04:56,160 --> 00:04:57,440
Lang verhaal kort.
71
00:04:57,440 --> 00:05:01,960
Na een bepaalde periode denkt Microsoft dit zou wel eens wat kunnen worden.
72
00:05:01,960 --> 00:05:05,800
En investeert op dat moment 1 miljard dollar in OpenAI.
73
00:05:05,800 --> 00:05:07,320
Dus groot nieuws.
74
00:05:07,320 --> 00:05:09,920
2019 hebben we het dan over.
75
00:05:09,920 --> 00:05:14,400
En meeste mensen zijn toch wel versteld dat Microsoft hier zoveel geld in stopt.
76
00:05:14,400 --> 00:05:18,320
Nou dan scrollen we eigenlijk een jaar verder.
77
00:05:18,320 --> 00:05:22,200
En dan komt OpenAI uit met GPT-3.
78
00:05:22,200 --> 00:05:24,680
Nog steeds onbekend voor het publiek.
79
00:05:24,680 --> 00:05:29,800
Maar dan geven ze mondjesmaat mensen toegang tot een zogenaamde playground.
80
00:05:29,800 --> 00:05:35,000
En die playground dat is eigenlijk de voorloper, de echte voorloper van chatGPT.
81
00:05:35,000 --> 00:05:36,480
Want dat is een user interface.
82
00:05:36,480 --> 00:05:38,200
Maar nog wel heel technisch.
83
00:05:38,200 --> 00:05:42,320
Waarin je allerlei technische elementen moest instellen.
84
00:05:42,320 --> 00:05:47,080
Zoals de frequency en een inject start text.
85
00:05:47,080 --> 00:05:49,160
En van alles en nog wat.
86
00:05:49,160 --> 00:05:55,120
En omdat dat zo technisch was, kregen we toch minder aandacht en minder tractie.
87
00:05:55,120 --> 00:05:59,440
Ik had het geluk dat ik al eerder toegelaten werd.
88
00:05:59,440 --> 00:06:03,160
Waardoor je zag van dit kan echt wel heel erg groot worden.
89
00:06:03,160 --> 00:06:06,280
Gaan we nog een stapje verder.
90
00:06:06,280 --> 00:06:12,080
En dan waar je ook dat toeval wat er dan gebeurt eigenlijk.
91
00:06:12,080 --> 00:06:17,200
Waardoor dingen heel anders lopen dan misschien de bedoeling was.
92
00:06:17,200 --> 00:06:21,040
Dan krijg je in juni 2020 zijn we dan.
93
00:06:21,040 --> 00:06:24,280
Dan komt er een Google test engineer.
94
00:06:24,280 --> 00:06:29,880
En die zegt, Google die heeft een systeem ontwikkeld.
95
00:06:29,880 --> 00:06:32,840
En dat was eigenlijk een soort van chatGPT.
96
00:06:32,840 --> 00:06:34,720
En die heeft zelfbewustzijn.
97
00:06:34,720 --> 00:06:38,640
Dit wordt groot opgepakt in de media.
98
00:06:38,640 --> 00:06:44,720
En Google is eigenlijk waarschijnlijk hier zo van geschrokken.
99
00:06:44,720 --> 00:06:49,720
Dat ze niet alleen deze test engineer ontslaan.
100
00:06:49,720 --> 00:06:55,240
Maar het project ook in de ijskast zetten of in ieder geval niet naar buiten brengen.
101
00:06:55,240 --> 00:07:00,200
En waar hij mee bezig was, was het testen wat uiteindelijk Google Bart zou worden.
102
00:07:00,200 --> 00:07:05,160
Dus je ziet eigenlijk in de hele historie is het Google, Google, Google.
103
00:07:05,160 --> 00:07:10,040
En toch zijn ze niet de eerste die hier mee naar buiten zijn gekomen.
104
00:07:10,040 --> 00:07:12,200
En daarmee dus ook niet de grootste.
105
00:07:12,200 --> 00:07:17,600
En dan hebben we 30 november 2022.
106
00:07:17,600 --> 00:07:20,400
OpenEye brengt chatGPT uit.
107
00:07:20,400 --> 00:07:25,920
Ze hebben een user interface waardoor je gewoon kan chatten met een taalmodel.
108
00:07:25,920 --> 00:07:29,240
En zij dachten van nou ja weet je, dat zetten we open.
109
00:07:29,240 --> 00:07:32,280
Ze hadden dat gemaakt voor hun eigen testmogelijkheden.
110
00:07:32,280 --> 00:07:38,000
En hebben dat opengezet en verwachten niet dat dit enige aandacht zou krijgen.
111
00:07:38,000 --> 00:07:44,400
En vanaf die dag is het natuurlijk enorm ontploft en zijn we waar we nu zijn.
112
00:07:44,400 --> 00:07:48,360
Microsoft was zelfs geschrokken van hoe moeten we nu gaan schalen.
113
00:07:48,360 --> 00:07:52,760
In het begin kon je nauwelijks accounts aanmaken of was die niet bereikbaar.
114
00:07:52,760 --> 00:07:57,920
Dus het was helemaal niet op voor gesorteerd dat dit zo groot zou zijn.
115
00:07:57,920 --> 00:08:00,400
En dat het zo groot opgepakt zou worden.
116
00:08:00,400 --> 00:08:01,840
Ook een mate van toeval.
117
00:08:01,840 --> 00:08:06,360
Waar ik mee af wil sluiten, want we hebben nu teruggekeken.
118
00:08:06,360 --> 00:08:13,120
En als je nou vooruit kijkt, dan zou je deze hele ontwikkeling moeten zien van 2000.
119
00:08:13,120 --> 00:08:17,400
Nou eigenlijk nog voor 2012, nog veel langer daarvoor.
120
00:08:17,400 --> 00:08:19,400
Vanaf Google Translate tot nu.
121
00:08:19,400 --> 00:08:23,240
Is dat er een soort van spekhoek is gemaakt van technologieën.
122
00:08:23,240 --> 00:08:25,640
Van laagje voor laagje voor laagje.
123
00:08:25,640 --> 00:08:28,800
Die ervoor heeft gezorgd dat we zijn waar we nu zijn.
124
00:08:28,800 --> 00:08:33,120
En die laagjes van zo'n spekhoek is heel erg arbeidsintensief.
125
00:08:33,120 --> 00:08:35,360
En dat zijn deze laagjes ook geweest.
126
00:08:35,360 --> 00:08:39,640
Dus als we nu hele grote doorbraken verwachten, dat is het niet.
127
00:08:39,640 --> 00:08:41,200
We krijgen laagje voor laagje.
128
00:08:41,200 --> 00:08:44,840
Wat wel zo kan zijn, is dat je een aantal van dat soort dingen mist.
129
00:08:44,840 --> 00:08:46,960
En dat je een lekker stuk taart krijgt.
130
00:08:46,960 --> 00:08:47,960
De ChatGPT.
131
00:08:47,960 --> 00:08:52,240
Waarbij je in één keer denkt van wow, dit is echt heel groot, heel nieuw.
132
00:08:52,240 --> 00:08:55,320
Maar bedenk, er zit een grote historie achter.
133
00:08:55,320 --> 00:08:59,400
En zo zal het in de toekomst waarschijnlijk ook gaan.
134
00:08:59,400 --> 00:09:01,200
Dankjewel voor het luisteren.
135
00:09:01,200 --> 00:09:02,680
Hopelijk heb je wat opgestoken.
136
00:09:02,680 --> 00:09:03,960
Tot de volgende keer.
137
00:09:03,960 --> 00:09:05,960
138
00:09:05,960 --> 00:09:08,280