AI AI AI

Is onze angst voor artificiële intelligentie gegrond?

Het is misschien niet bij iedereen bekend, maar het is een feit: journalisten haten hun job. Al jaren hopen zij (en wij) het hele gebeuren te automatiseren. Vooruitgang in artificiële intelligentie en de groeiende toegankelijkheid van dergelijke technologieën bieden hoop, maar de vraag blijft onbeantwoord: zijn journalisten overbodig? Tijd voor een test.

Dit verhaal begint op de Schamperredactie, waar we alle digitale Schamperartikels van 2004 tot nu in een tekstbestand gezet hebben. Het bestandje van zo'n 20 megabytes was de 8000 pagina's dikke cursus 'hoe schrijf ik een Schamperartikel' voor de computer. Met deze dataset konden we aan de slag. Cedric De Boom, postdoctoraal onderzoeker in machinaal leren, genereerde voor ons het onderstaande artikel en legde een deel van deze magie uit. Wij vatten samen.

De setup

Cedric De Boom

De software probeert op basis van een deep learning model - een vorm van artificiële intelligentie - zo goed mogelijk te worden in het voorspellen van karakters. Het model dat gebruikt werd, een Recurrent Neural Network (RNN), scant de hele tekst per tweehonderd karakters en probeert bij wijze van oefening voor zichzelf steeds het volgende karakter van dit stukje tekst te voorspellen. Als ze het karakter 'juist' voorspelt, krijgt de AI een goed rapport en gaat ze verder oefenen met de kennis die ze al heeft. Anders krijgt de software feedback over wat het karakter wel had moeten zijn. Het model gaat zich intern zo aanpassen dat het steeds beter wordt in het genereren van het 201ste karakter op basis van de voorgaande karakters. Het model dat ons hoogwaardige artikel schreef leerde op deze mannier een kleine twee uur voor het met dit resultaat op de proppen kwam.

De bugs

In de dikke cursus aan voorbeelddata die we aan de AI gegeven hebben, stonden nog heel wat ruis en fouten: paginanummers, data, enzovoort. De AI kreeg daarenboven data voorgeschoteld waarin geen duiding werd gegeven over wat een titel en wat een alinea is, en ook niet waar een artikel begint en eindigt. Het is mogelijk om deze data op te schonen en het model complexer te maken. Hierdoor leer je de AI om een artikel te schrijven inclusief inleiding, alinea's en titel. Opmerkelijk is alleszins dat de software er zeer goed in slaagt om woorden te vormen. Ondanks het feit dat niemand hem ooit verteld heeft dat tekst op die manier opgebouwd hoort te worden.

"Journalisten zullen nog niet meteen verdwijnen."

Het is ook mogelijk het model te trainen op woordniveau. Dan voorspelt de AI woord na woord in plaats van karakter na karakter. Het nadeel is dan dat de AI woorden zou kunnen voorspellen die veel voorkomen in de data, want daar zal de AI zich zekerder over voelen. Langer leren ('trainen') zou, in tegenstelling tot de gemiddelde student, echter niet beter zijn voor het resultaat. Het is slimmer om extra componenten in het model te steken, zoals een vorm van 'aandacht'. Dit Schamperartikel werd dus geschreven met een basismodel. Het werkt, maar er is nog eindeloos veel verbetering mogelijk.

De revolutie

We hebben een periode gekend waarin er grote stappen gezet zijn met de komst van modellen zoals LSTM (Long Short-Term Memory) en GRU (Gated Recurrent Unit). Het laatste jaar lijkt de vooruitgang daarin getemperd. De modellen kunnen zeker nog dieper worden. Google werkt bijvoorbeeld met DeepMind aan WaveNet. Hun model traint een aantal weken op duizenden GPU's. Daar heeft de UGent de middelen niet voor.

Het model waarmee het onderstaande artikel gegenereerd werd, een RNN, is bovendien geschikt voor elke soort data die een reeks vormt en is niet beperkt tot het verwerken van tekstkarakters. Bij zowat elke denkbare reeks of volgorde kan je dit model toepassen. Zo werken bijvoorbeeld ook de persoonlijke aanbevelingen van Netflix. Het model kan dan op basis van je filmgeschiedenis met een bepaalde kans voorspellen wat jij nog leuk zou vinden. Zo kan men een waaier aanbieden van films en series waar je er hoogstwaarschijnlijk wel een aantal van wil bekijken. Ook de Discover Weekly-afspeellijst van Spotify maakt extensief gebruik van dit soort algoritmen.

Het verhaal van AI bevat veel doemscenario's over hoe het onze jobs zal afnemen. Zo worden arbeiders al vervangen door een gerobotiseerde lopende band. Dit gegenereerde artikel bewijst wel dat we nog niet hoeven te vrezen dat morgen onze jobs overgenomen zullen worden. Journalisten zullen nog niet meteen verdwijnen. Op korte termijn zal AI eerder een hulpmiddel worden.

De universiteit is bestaand als studentenhuis

Je moet los meubilair hebben van een nieuw sociaal leven. Op die manier kan je voor het eerst op die manier verder in kleine kanten hun studenten in ontwikkelingslanden waren van de eigenaars en ook proberen om te ontkennen dat de rechten van het academiejaar tot het lichaam zou kunnen ontvangen, in de Vooruit werden gebracht door een aantal mensen die de moeite om in de maatschappij te bevestigen in ander gebied te zijn. Het laatste jaar bestaat het concept van lokale en andere studenten en professoren en de verkopers dan de spinale verkozen studenten gespeeld. Wat wij verschijnen ongeveer 14 miljoen euro.

Een goede bacterie die de tweede zit zich druk in hogere studies geeft werkelijk voor het bestuurscollege gezet, verschuilende muziek en uitgewerkte verhalen. Een probleem dat ik daarvoor ons ook verkocht hebben, dat is een vrouw. Het zijn met taal en kritiek. Het geluid van de raad van bestuur is de vrijwilligers vanaf het tweede deel over een belachelijke manier om hun Turkse paniek te bespreken.

"Om die redenen zijn voor het Verenigde Staten en de bijkomende problemen in de Boekentoren."

Om die redenen zijn voor het Verenigde Staten en de bijkomende problemen in de Boekentoren. Laat deze week het met de werkelijke vergelijking van de manier waarop de student die de rector de verkiezingsmacht van de UGent ontstond er pas twee mannen het is ook meer dan een schone kunstenaar alles voor de molecule, "dat veranderde plaats met de stempel van de tijd”. Dat is het meest voor de rechter van de UGent, en de professoren van de mensen in het hoger onderwijs staat het onderzoek gestald op de Sterre van dit verhoogde val van het BBB. Het zijn de examenroosters het recht om de komende jaren op te bouwen. Al tijdens het academiejaar hebben we ook nog maar weinig mensen met de principes van de studenten. Durf denkend seksueel gebrek aan emotioneel in de menselijke verantwoordelijkheid aan het hart van contacten van de verschillende kamers en de Duitsers die zich niet sterke school ontwikkeld is, is het niet te laat.

Gemiddeld: 4 (1 stem)
cover: 

Reactie toevoegen