Wordt het tijd om A.I. goed in de gaten te houden?
zaterdag 28 januari 2023

An old golden retriever wearing a headphone talkin into a big microfoon on a desk and the is a ham radio set sitting on the desk in steam punk style on a black background 

Ineens is A.I. weer veel in het nieuws, terwijl het al heel lang een belofte is dat het "de techniek van de toekomst is". Wat is er nu veranderd?

Volgens mij komt het vooral omdat er nu een aantal projecten zijn die in het oog springen waar we zelf mee kunnen testen en die het niveau halen van praktiche bruikbaarheid. De meest in het oog springende projecten die we zelf kunnen testen zijn: teksten genereren (ChatGPT), programma code genereren (Github Copilot) en foto’s generen (DALL-E 2, Google Imagen en Midjourney).

In deze blog onderzoeken we de status; is het een rage of een trend? Raken we allemaal ons werk kwijt? Of is het een storm in een glas water?

Tip: de input die we geven aan de AI noemen (indien tekstueel) we een prompt 

Voor uw gemak en vermaak heb ik ze allemaal getest, hier een paar simpele voorbeelden

Chatbox / teksten genereren

ChatGPT - https://openai.com/blog/chatgpt/

We beginnen met een vrij simpele opdracht
Prompt: schrijf een blog over het land van cuijk

Het land van Cuijk is een prachtig gebied in de provincie Noord-Brabant in Nederland. Het is gelegen tussen de steden Nijmegen en 's-Hertogenbosch en bestaat uit verschillende dorpen en steden, waaronder Cuijk, Boxmeer, Mill en Gennep.

Het gebied is rijk aan historie en cultuur. De oudste sporen van menselijke bewoning dateren uit de prehistorie, zoals te zien is in de archeologische opgravingen in Cuijk en Boxmeer. In de middeleeuwen was het gebied van groot strategisch belang, met verschillende kastelen en vestingwerken die nog steeds te bezichtigen zijn, zoals het kasteel van Cuijk en het kasteel van Boxmeer.

Het land van Cuijk is ook bekend om zijn prachtige natuur. Er zijn veel wandel- en fietspaden door de bossen en langs de Maas. De Maasplassen, een gebied met vele meren, zijn populair bij watersporters. Het gebied is ook een belangrijke plek voor vogelaars, met vele soorten vogels die er komen overwinteren.

Culinair genieten is ook een groot onderdeel van het leven in het land van Cuijk. Er zijn vele restaurants die lokale specialiteiten serveren, zoals het beroemde 'Cuijkse worst'. Er zijn ook vele boerderijwinkels en markten waar je verse producten kunt kopen, zoals kaas, vlees en groenten.

Het land van Cuijk is een prachtige plek om te bezoeken, met veel historie, cultuur en natuur. Of je nu op zoek bent naar een rustige wandeling, een actief dagje uit of een culinaire ervaring, het land van Cuijk heeft iets voor iedereen te bieden.
 

Kunnen we hier een korte versie van maken?
Prompt: summarize

Het land van Cuijk is een gebied in Noord-Brabant, Nederland, tussen de steden Nijmegen en 's-Hertogenbosch. Het is rijk aan historie en cultuur, met oude opgravingen en kastelen die nog steeds te bezoeken zijn. Het is ook bekend om zijn prachtige natuur, wandel- en fietspaden en de Maasplassen, een gebied met vele meren. Culinair genieten is ook een belangrijk onderdeel van het leven in het land van Cuijk, met vele restaurants die lokale specialiteiten serveren en boerderijwinkels waar je verse producten kunt kopen.

We proberen nu een wat minder algemeen blog item te maken
Prompt: schrijf een blog over vissen aan de maas in het land van cuijk op een mooie zonnige dag

Er is geen twijfel over dat vissen aan de Maas in het land van Cuijk een geweldige manier is om een mooie zonnige dag door te brengen. De Maas is een van de belangrijkste rivieren van Nederland en biedt een grote diversiteit aan vissoorten, waaronder snoek, baars, paling, karper en zalm.

Voor degenen die nog niet eerder hebben gevist aan de Maas, is het verstandig om te beginnen met een begeleide visreis. Er zijn veel gidsen beschikbaar die ervaren zijn in het vissen aan de Maas en die u kunnen helpen om de juiste technieken te leren en de beste plekken om te vissen te vinden. U kunt ook gebruik maken van hun materiaal zoals hengels, reels, lijnen en kunstaas.

Als u al ervaren bent in het vissen aan de Maas, dan kunt u uw eigen uitrusting meenemen en op zoek gaan naar de beste plekken. Er zijn veel openbare visstekken beschikbaar langs de oevers van de Maas, zowel in de steden als in de landelijke gebieden. Let wel op de regelgeving van het vissen, zoals het aantal vis dat u mag vangen en de seizoensregels.

Het vissen aan de Maas in het land van Cuijk is niet alleen een leuke manier om de natuur te genieten, maar het is ook een geweldige manier om te ontspannen en te ontsnappen aan de drukte van het dagelijks leven. Dus, trek uw waders aan, neem uw hengel en ga op avontuur in het land van Cuijk.

Een aanrader is om een picknick mee te nemen en te genieten van de zonnige dag tijdens het vissen, en als u een vis vangt, kunt u deze direct op het vuur grillen, een heerlijke en smaakvolle beloning voor uw inspanningen.

In conclusie, vissen aan de Maas in het land van Cuijk is een geweldige manier om een mooie zonnige dag door te brengen, of u nu een beginner of een ervaren visser bent, er is voor ieder wat wils. Dus, pak uw hengel en ga op avontuur in het prachtige land van Cuijk.
 

Je ziet hier wel de zwaktes in de gegenereerde tekst, heel algemeen, veel herhalingen en fouten (steden?). Het is duidelijk dat het over vissen in het algemeen gaat en niet specifiek in het Land van Cuijk (daar is zws geen trainingsdata over geweest).

Maar het feit dat er met een hele simpele opdracht binnen een paar seconden deze tekst wordt gegenereerd is al bijzonder.

Er zijn talloze inspirerende voorbeelden te vinden online die veel meer doen dan alleen blog/nieuws items generen. De mogelijke onderwerpen zijn heel divers; examenvragen maken / antwoorden, berekeningen maken, blogs of nieuws schrijven, programmeer code schrijven of debuggen, enz

Toch is het belangrijk dit niet te zien als een Artificial general intelligence (AGI), GPT is een taalmodel, heel simplistisch gezegd: deze heeft geleerd op basis van heel veel voorbeeld teksten (trainings maeteriaal) wat het volgende woord moet zijn. Er is geen controle op de juistheid van de data (en daar zijn ook genoeg voorbeelden van te vinden). De antwoorden zijn ook vaak heel “verbose” (te uitgebreid en algemeen).

Code generatie

Github Copilot - https://github.com/features/copilot

Gitlab is met een plugin gekomen voor IDE's (programmeer editors) waarin je geholpen wordt code / functies te schrijven, en dit werkt verbazend goed.

Het beste werkt het om relatief kleine snippets te generen, maar het werkt ook met OOP en probeerd bestaande methodes te gebruiken en zich aan te passen aan coding style. Voor de flow werkt het als autocomplete op steroïden. 


// prompt: a list of number 1 to 1000 
const numbersList = Array.from(Array(1000).keys());
console.log(numbersList);

// prompt:  an array with days of the week in dutch
const days = ["maandag", "dinsdag", "woensdag", "donderdag", "vrijdag", "zaterdag", "zondag"];
console.log(days);

// promopt: an array with months of the year in dutch
const months = ["januari", "februari", "maart", "april", "mei", "juni", "juli", "augustus", "september", "oktober", "november", "december"];
console.log(months);

// prompt: a function to calculate pi using the Monte Carlo method
function calculatePi(iterations: number) {
  let inside = 0;
  let outside = 0;
  for (let i = 0; i < iterations; i++) {
    const x = Math.random();
    const y = Math.random();
    const distance = Math.sqrt(x * x + y * y);
    if (distance <= 1) {
      inside++;
    } else {
      outside++;
    }
  }
  return 4 * inside / (inside + outside);
}

Foto’s genereren

Dall-E -https://labs.openai.com/
Midjourney - https://docs.midjourney.com/

Grafische afbeeldingen generen met A.I. gebeurd al wat langer, de resultaten zijn heel wisselend maar af en toe komen er wel genialen dingen uit. De manier van prompts schrijven is cruciaal. De voorbeelden zijn met Midjourney, je krijgt steeds 4 previews waarop je verder kunt werken.


Prompt: Golden retriever talkin into a big microfoon of a ham radio set with an antenna and wearing a headphone in steam punk style on a black background.

pa1bh_golden_retriever_talkin_into_a_big_microfoon_of_a_ham_rad_3961ff68-7daf-44ee-827b-e34e47b1e0a0-2.png

Ik heb zelf wat minder succes met Dall-E, zie hier bijvoorbeeld dezelfde prompt
scherm-afbeelding-2023-01-28-om-202051.jpg

Prompt: a strange communication device with Vacuum tube's, lots of cables and a long antenna in cyberpunk style

pa1bh_a_strange_communication_device_with_vacuum_tubes_lots_of__3b66e50b-0090-4fa3-af57-102f10f9bebf.png

Het gaat niet altijd even goed, hier de prompt: a classic logo for a webdesign company called "Cybox" on a black background

pa1bh_a_classic_logo_for_a_webdesign_company_called_cybox_on_a__86d84b62-b892-4ad1-8b7e-7659d3bb3402.png

Hier zie je dat het model de input niet echt "snapt", waarschijnlijk komt Cybox niet voor in de trainingsdata en die kan hier niet echt iets van maken.

Ik heb ook mooie voorbeelden gezien waar de prompt geschreven wordt door ChatGPT.

Toekomst


De voorbeelden die weer hier bespreken zijn waarschijnlijk net de grens van “werkelijk bruikbaar” gepasseerd, maar we moeten kijken naar het grotere plaatje: Het verschil tussen GPT 2 en GPT 3 (en 3.5) is enorm, als we die lijn doortrekken in de komende jaren (lees decennia) is dit zeker een “disruptive technology”.

De tijdspanne is onduidelijke, maar de manier van werken voor bv content creators, designers en programmeurs gaat zeker veranderen. En niet perse negatief, ik voorzie dat we meer architecten worden dan uitvoerders. Maar we moeten wel willen meebewegen.

Omdat het zo makkelijk wordt om (vaak kwalitatief lage) content te maken zal dit helaas zal dit ook gepaard gaan met veel onzin en misbruik wat de signaal / ruis verhouding op het internet (nog) slechter zal maken.

Bij nieuwe technologieën loopt wetgeving altijd achter, je ziet dat sommige landen waar wat minder overleg nodig is hier al op acteren: in China moet een uiting die door AI gemaakt is een watermerk of waarschuwing moet hebben, dat klinkt wel logisch. Maar ook dat het door de overheid goedgekeurd moet worden, dat is misschien niet ideaal.  

Hoe zit het met merkrecht / copyright?


Gegenereerde afbeeldingen kunnen niet gecopyright worden (niet door een persoon gemaakt), maar hoe zit het met de trainingsdata? Het is duidelijk dat veel veel materiaal gebruikt wordt waar copyright op berust, is dan het werk wat er uit komt een afgeleide? En berust daar dan copyright op?

Waarschijnlijk niet, maar daar zullen ongetwijfeld een aantal interesante proefprocessen over komen in de nabije toekomst, zie hier een voorbeeld van Getty images.


Het bekende Youtube channel LegalEagle besteed hier aandacht aan https://www.youtube.com/watch?v=G08hY8dSrUY

Dit is wel vrij specifiek gericht op Amerika, maar wel interessant.

Tenslotte

We hebben hier nog maar het oppervlakte geraakt, als er interesse is voor verdieping in een bepaalde richting hoor ik het graag!

Ik kan deze video ook aanbevelen: https://www.youtube.com/watch?v=0uQqMxXoNVs

Maar wees nieuwsgierig en ga ook vooral zelf eens spelen!

index