AIToday Live

S05E72 - De Verjaardag van ChatGPT: van toeval naar fortuin

November 30, 2023 Aigency by Info Support Season 5 Episode 72
S05E72 - De Verjaardag van ChatGPT: van toeval naar fortuin
AIToday Live
More Info
AIToday Live
S05E72 - De Verjaardag van ChatGPT: van toeval naar fortuin
Nov 30, 2023 Season 5 Episode 72
Aigency by Info Support

In deze aflevering van AIToday Live staan we stil bij één jaar ChatGPT. We bespreken de ontwikkeling van deze invloedrijke AI, van vroege machinevertaling tot de geavanceerde toepassingen van nu, en overwegen de toekomstmogelijkheden die deze vooruitgang biedt.

Luister naar onze analyse en gedachten over de impact van ChatGPT op de AI-sector en verder.


Links

Met onze podcast AIToday Live zijn we genomineerd voor de Belgian Podcast Awards ! 🏆🤩 Belgisch? Ja, een Belgische award, want er is een speciale categorie voor Nederlandse podcasts: Prijs van Oranje.

Wil je ons steunen? 🙏❤️ Stem op ons!

Aigency
Aigency ontwerpt en ontwikkelt waardevolle, robuuste en betrouwbare Machine Learning-modellen.

Info Support
Info Support is de specialist in maatwerk software en leidend in kunstmatige intelligentie (AI).

Disclaimer: This post contains affiliate links. If you make a purchase, I may receive a commission at no extra cost to you.

Wil je toegang tot exclusieve toegang voor onze luisteraars? Schrijf je in voor de nieuwsbrief 'AI versterkt de Mens'

Contact AIToday Live


We zijn altijd op zoek naar nieuwe gasten die over AI willen spreken.

Show Notes Transcript

In deze aflevering van AIToday Live staan we stil bij één jaar ChatGPT. We bespreken de ontwikkeling van deze invloedrijke AI, van vroege machinevertaling tot de geavanceerde toepassingen van nu, en overwegen de toekomstmogelijkheden die deze vooruitgang biedt.

Luister naar onze analyse en gedachten over de impact van ChatGPT op de AI-sector en verder.


Links

Met onze podcast AIToday Live zijn we genomineerd voor de Belgian Podcast Awards ! 🏆🤩 Belgisch? Ja, een Belgische award, want er is een speciale categorie voor Nederlandse podcasts: Prijs van Oranje.

Wil je ons steunen? 🙏❤️ Stem op ons!

Aigency
Aigency ontwerpt en ontwikkelt waardevolle, robuuste en betrouwbare Machine Learning-modellen.

Info Support
Info Support is de specialist in maatwerk software en leidend in kunstmatige intelligentie (AI).

Disclaimer: This post contains affiliate links. If you make a purchase, I may receive a commission at no extra cost to you.

Wil je toegang tot exclusieve toegang voor onze luisteraars? Schrijf je in voor de nieuwsbrief 'AI versterkt de Mens'

Contact AIToday Live


We zijn altijd op zoek naar nieuwe gasten die over AI willen spreken.

1
00:00:00,000 --> 00:00:13,000
Het is vandaag 30 november en het is de verjaardag van ChatGPT.

2
00:00:13,000 --> 00:00:17,080
Een jaar geleden kwam het uit en daar gaat natuurlijk een hoop veranderen.

3
00:00:17,080 --> 00:00:20,880
Mijn leven is in ieder geval veranderd, mijn werkende leven.

4
00:00:20,880 --> 00:00:25,640
En het is denk ik wel leuk om juist terug te kijken van hoe zijn we hier gekomen.

5
00:00:25,640 --> 00:00:37,280
Want het hangt nogal van een aantal toevalligheden aan elkaar, onverwachte wendingen waarop we

6
00:00:37,280 --> 00:00:39,080
op dit punt zijn gekomen.

7
00:00:39,080 --> 00:00:44,280
Want als dit een aantal dingen niet gebeurd zouden zijn, zou OpenAI nu niet zijn waar

8
00:00:44,280 --> 00:00:45,280
ze nu zouden zijn.

9
00:00:45,280 --> 00:00:52,600
En om zo direct vooruit te kijken moeten we eigenlijk even denken aan Winston Churchill

10
00:00:52,600 --> 00:00:56,880
die zei hoe langer je terug kunt kijken, hoe verder je vooruit kunt kijken.

11
00:00:56,880 --> 00:01:01,440
Dus laten we vandaag eens terugkijken op de verjaardag van ChatGPT.

12
00:01:01,440 --> 00:01:09,960
Je zou kunnen zeggen dat de oorsprong van deze technologie begint bij Google Translate.

13
00:01:09,960 --> 00:01:15,880
Google Translate ging er natuurlijk om om dingen te vertalen.

14
00:01:15,880 --> 00:01:17,840
Dus van de ene taal naar de andere taal.

15
00:01:17,840 --> 00:01:20,600
En dat werkte in het begin behoorlijk matig.

16
00:01:20,600 --> 00:01:27,040
Als je dat in het begin gebruikte, merkte je dat het meer een soort van woord voor woord

17
00:01:27,040 --> 00:01:28,240
vertalen was.

18
00:01:28,240 --> 00:01:31,920
En die best wel hele slechte resultaten gaf.

19
00:01:31,920 --> 00:01:37,360
Tot op een bepaalde dag en een keer de resultaten heel veel beter werden.

20
00:01:37,360 --> 00:01:42,640
En dat had te maken met het zogenaamde sequence to sequence algoritme.

21
00:01:42,640 --> 00:01:46,560
En dit klinkt heel technisch en dat is het ook wel een beetje.

22
00:01:46,560 --> 00:01:56,200
Maar wat hij eigenlijk deed was een tekst gebruiken en die omzetten naar getalletjes.

23
00:01:56,200 --> 00:02:01,240
Dus als een soort van tussentaal waarbij er gekeken werd hoe verhouden de woorden in een

24
00:02:01,240 --> 00:02:02,640
zin zich nou tot elkaar.

25
00:02:02,640 --> 00:02:09,560
En vervolgens kon hij dat eigenlijk weer ontcijferen en daar een andere taal tegenaan houden.

26
00:02:09,560 --> 00:02:12,760
Dus ik gaf bijvoorbeeld in I'm a student.

27
00:02:12,760 --> 00:02:17,040
Daar werden allemaal getalletjes aangekoppeld, zogenaamde vector.

28
00:02:17,040 --> 00:02:21,920
En die konden dan gedecodeerd worden met allerlei andere talen.

29
00:02:21,920 --> 00:02:24,560
Dus dat kon zijn Frans, Nederlands, Duits.

30
00:02:24,560 --> 00:02:26,400
Je kon het zo gek niet verzinnen.

31
00:02:26,400 --> 00:02:30,000
Dus de decoder zou in het Nederlands zeggen ik ben een student.

32
00:02:30,000 --> 00:02:33,800
Nou dat lijkt nog op die woord voor woord vertaling.

33
00:02:33,800 --> 00:02:36,360
Maar in het Frans zou het zijn je suis étudiant.

34
00:02:36,360 --> 00:02:38,360
Als ik dat goed uitspreek.

35
00:02:38,360 --> 00:02:41,280
Het is eigenlijk een hele andere zinsconstructie.

36
00:02:41,280 --> 00:02:46,040
Nou daar zijn ze heel lang mee bezig geweest.

37
00:02:46,040 --> 00:02:50,680
We hebben het hier over 2012 dat dit was.

38
00:02:50,680 --> 00:02:55,320
En op een gegeven moment komt er een paper uit, een wetenschappelijk paper.

39
00:02:55,320 --> 00:02:58,720
En dat paper heet 'Attention is all you need'.

40
00:02:58,720 --> 00:03:02,160
En het gek is, ook weer Google.

41
00:03:02,160 --> 00:03:09,600
Allerlei wetenschappers van Google en de Universiteit van Toronto hebben dan een manier bedacht

42
00:03:09,600 --> 00:03:14,880
dat je zowel naar voren als naar achteren kan kijken.

43
00:03:14,880 --> 00:03:17,640
Waardoor je eigenlijk meer context hebt.

44
00:03:17,640 --> 00:03:24,200
En waarbij de machine die vertaling van het een naar het ander veel beter kan uitvoeren.

45
00:03:24,200 --> 00:03:27,640
Een enorme sprong voorwaarts is dat.

46
00:03:27,640 --> 00:03:32,080
Nou er zijn allerlei bedrijven die hiermee aan de gang gaan.

47
00:03:32,080 --> 00:03:33,080
Waaronder OpenAI.

48
00:03:33,080 --> 00:03:39,060
OpenAI heeft in eerste instantie het idee van ja we gaan onderzoek doen naar Artificial

49
00:03:39,060 --> 00:03:41,060
General Intelligence.

50
00:03:41,060 --> 00:03:44,720
En die bouwen hun eerste GPT.

51
00:03:44,720 --> 00:03:47,520
Dan komt GPT2.

52
00:03:47,520 --> 00:03:51,720
En dan hebben we het eerste toeval te pakken.

53
00:03:51,720 --> 00:03:53,720
Want wat gebeurt er?

54
00:03:53,720 --> 00:03:58,520
Op een dag bij Microsoft krijgen ze een DDoS aanval.

55
00:03:58,520 --> 00:04:04,880
Dat is waarbij servers zo worden bestookt dat ze bijna onderuit gaan of onderuit kunnen

56
00:04:04,880 --> 00:04:05,880
gaan.

57
00:04:05,880 --> 00:04:09,000
En Microsoft analyseert dat natuurlijk.

58
00:04:09,000 --> 00:04:17,280
En heel raar voor hun is in plaats van dat die DDoS aanval vanaf een obscure locatie

59
00:04:17,280 --> 00:04:22,040
kwam, bleek het gewoon van servers uit San Francisco te zijn.

60
00:04:22,040 --> 00:04:25,320
Dus dan gingen ze kijken van wie zit hier nou achter.

61
00:04:25,320 --> 00:04:29,400
Rondbellen bleek OpenAI te zijn.

62
00:04:29,400 --> 00:04:32,760
En die DDoS aanval was namelijk op GitHub.

63
00:04:32,760 --> 00:04:40,160
GitHub is de plek die Microsoft gekocht heeft waar heel veel developers open source code

64
00:04:40,160 --> 00:04:41,160
op zetten.

65
00:04:41,160 --> 00:04:46,520
Dus ze zagen eigenlijk dat OpenAI allemaal programmeercode naar binnen aan het halen

66
00:04:46,520 --> 00:04:47,520
was.

67
00:04:47,520 --> 00:04:49,880
Die was dat aan het scrapen, aan het leegtrekken.

68
00:04:49,880 --> 00:04:54,000
Dus die hebben overlegd van ja wat zijn jullie nou aan het doen?

69
00:04:54,000 --> 00:04:56,160
Waar zijn jullie nou mee bezig?

70
00:04:56,160 --> 00:04:57,440
Lang verhaal kort.

71
00:04:57,440 --> 00:05:01,960
Na een bepaalde periode denkt Microsoft dit zou wel eens wat kunnen worden.

72
00:05:01,960 --> 00:05:05,800
En investeert op dat moment 1 miljard dollar in OpenAI.

73
00:05:05,800 --> 00:05:07,320
Dus groot nieuws.

74
00:05:07,320 --> 00:05:09,920
2019 hebben we het dan over.

75
00:05:09,920 --> 00:05:14,400
En meeste mensen zijn toch wel versteld dat Microsoft hier zoveel geld in stopt.

76
00:05:14,400 --> 00:05:18,320
Nou dan scrollen we eigenlijk een jaar verder.

77
00:05:18,320 --> 00:05:22,200
En dan komt OpenAI uit met GPT-3.

78
00:05:22,200 --> 00:05:24,680
Nog steeds onbekend voor het publiek.

79
00:05:24,680 --> 00:05:29,800
Maar dan geven ze mondjesmaat mensen toegang tot een zogenaamde playground.

80
00:05:29,800 --> 00:05:35,000
En die playground dat is eigenlijk de voorloper, de echte voorloper van chatGPT.

81
00:05:35,000 --> 00:05:36,480
Want dat is een user interface.

82
00:05:36,480 --> 00:05:38,200
Maar nog wel heel technisch.

83
00:05:38,200 --> 00:05:42,320
Waarin je allerlei technische elementen moest instellen.

84
00:05:42,320 --> 00:05:47,080
Zoals de frequency en een inject start text.

85
00:05:47,080 --> 00:05:49,160
En van alles en nog wat.

86
00:05:49,160 --> 00:05:55,120
En omdat dat zo technisch was, kregen we toch minder aandacht en minder tractie.

87
00:05:55,120 --> 00:05:59,440
Ik had het geluk dat ik al eerder toegelaten werd.

88
00:05:59,440 --> 00:06:03,160
Waardoor je zag van dit kan echt wel heel erg groot worden.

89
00:06:03,160 --> 00:06:06,280
Gaan we nog een stapje verder.

90
00:06:06,280 --> 00:06:12,080
En dan waar je ook dat toeval wat er dan gebeurt eigenlijk.

91
00:06:12,080 --> 00:06:17,200
Waardoor dingen heel anders lopen dan misschien de bedoeling was.

92
00:06:17,200 --> 00:06:21,040
Dan krijg je in juni 2020 zijn we dan.

93
00:06:21,040 --> 00:06:24,280
Dan komt er een Google test engineer.

94
00:06:24,280 --> 00:06:29,880
En die zegt, Google die heeft een systeem ontwikkeld.

95
00:06:29,880 --> 00:06:32,840
En dat was eigenlijk een soort van chatGPT.

96
00:06:32,840 --> 00:06:34,720
En die heeft zelfbewustzijn.

97
00:06:34,720 --> 00:06:38,640
Dit wordt groot opgepakt in de media.

98
00:06:38,640 --> 00:06:44,720
En Google is eigenlijk waarschijnlijk hier zo van geschrokken.

99
00:06:44,720 --> 00:06:49,720
Dat ze niet alleen deze test engineer ontslaan.

100
00:06:49,720 --> 00:06:55,240
Maar het project ook in de ijskast zetten of in ieder geval niet naar buiten brengen.

101
00:06:55,240 --> 00:07:00,200
En waar hij mee bezig was, was het testen wat uiteindelijk Google Bart zou worden.

102
00:07:00,200 --> 00:07:05,160
Dus je ziet eigenlijk in de hele historie is het Google, Google, Google.

103
00:07:05,160 --> 00:07:10,040
En toch zijn ze niet de eerste die hier mee naar buiten zijn gekomen.

104
00:07:10,040 --> 00:07:12,200
En daarmee dus ook niet de grootste.

105
00:07:12,200 --> 00:07:17,600
En dan hebben we 30 november 2022.

106
00:07:17,600 --> 00:07:20,400
OpenEye brengt chatGPT uit.

107
00:07:20,400 --> 00:07:25,920
Ze hebben een user interface waardoor je gewoon kan chatten met een taalmodel.

108
00:07:25,920 --> 00:07:29,240
En zij dachten van nou ja weet je, dat zetten we open.

109
00:07:29,240 --> 00:07:32,280
Ze hadden dat gemaakt voor hun eigen testmogelijkheden.

110
00:07:32,280 --> 00:07:38,000
En hebben dat opengezet en verwachten niet dat dit enige aandacht zou krijgen.

111
00:07:38,000 --> 00:07:44,400
En vanaf die dag is het natuurlijk enorm ontploft en zijn we waar we nu zijn.

112
00:07:44,400 --> 00:07:48,360
Microsoft was zelfs geschrokken van hoe moeten we nu gaan schalen.

113
00:07:48,360 --> 00:07:52,760
In het begin kon je nauwelijks accounts aanmaken of was die niet bereikbaar.

114
00:07:52,760 --> 00:07:57,920
Dus het was helemaal niet op voor gesorteerd dat dit zo groot zou zijn.

115
00:07:57,920 --> 00:08:00,400
En dat het zo groot opgepakt zou worden.

116
00:08:00,400 --> 00:08:01,840
Ook een mate van toeval.

117
00:08:01,840 --> 00:08:06,360
Waar ik mee af wil sluiten, want we hebben nu teruggekeken.

118
00:08:06,360 --> 00:08:13,120
En als je nou vooruit kijkt, dan zou je deze hele ontwikkeling moeten zien van 2000.

119
00:08:13,120 --> 00:08:17,400
Nou eigenlijk nog voor 2012, nog veel langer daarvoor.

120
00:08:17,400 --> 00:08:19,400
Vanaf Google Translate tot nu.

121
00:08:19,400 --> 00:08:23,240
Is dat er een soort van spekhoek is gemaakt van technologieën.

122
00:08:23,240 --> 00:08:25,640
Van laagje voor laagje voor laagje.

123
00:08:25,640 --> 00:08:28,800
Die ervoor heeft gezorgd dat we zijn waar we nu zijn.

124
00:08:28,800 --> 00:08:33,120
En die laagjes van zo'n spekhoek is heel erg arbeidsintensief.

125
00:08:33,120 --> 00:08:35,360
En dat zijn deze laagjes ook geweest.

126
00:08:35,360 --> 00:08:39,640
Dus als we nu hele grote doorbraken verwachten, dat is het niet.

127
00:08:39,640 --> 00:08:41,200
We krijgen laagje voor laagje.

128
00:08:41,200 --> 00:08:44,840
Wat wel zo kan zijn, is dat je een aantal van dat soort dingen mist.

129
00:08:44,840 --> 00:08:46,960
En dat je een lekker stuk taart krijgt.

130
00:08:46,960 --> 00:08:47,960
De ChatGPT.

131
00:08:47,960 --> 00:08:52,240
Waarbij je in één keer denkt van wow, dit is echt heel groot, heel nieuw.

132
00:08:52,240 --> 00:08:55,320
Maar bedenk, er zit een grote historie achter.

133
00:08:55,320 --> 00:08:59,400
En zo zal het in de toekomst waarschijnlijk ook gaan.

134
00:08:59,400 --> 00:09:01,200
Dankjewel voor het luisteren.

135
00:09:01,200 --> 00:09:02,680
Hopelijk heb je wat opgestoken.

136
00:09:02,680 --> 00:09:03,960
Tot de volgende keer.

137
00:09:03,960 --> 00:09:05,960
 
138
00:09:05,960 --> 00:09:08,280