Probleemstelling
Artificiële intelligentie heeft als nadeel de noodzaak tot dataconcentratie. Om een A.I.-algoritme zinvolle voorspellingen te laten maken dient deze namelijk éérst getraind te worden met – bij voorkeur een grote hoeveelheid – aan nuttige gelabelde data. We spreken over gelabelde data wanneer data voorzien is van de nodige beschrijving (Bijvoorbeeld: een foto van een appel met hierbij de tekst “appel”, de tekst is hier het label bij de data). Dataconcentratie in dit voorbeeld is het feit dat een hele reeks aan foto’s van appels met hun label in dezelfde database moeten terechtkomen zodat ze aan het A.I.-algoritme gevoed kunnen worden. Merk op dat dataconcentratie dus niet enkel voorkomt bij A.I. doch bij deze laatste wel altijd aanwezig is.
Dataconcentratie is voor meerdere redenen geen goed idee. Enerzijds legt het de macht in de handen van één partij, die deze data niet noodzakelijk ten onze voordele zal gebruiken... Denk hierbij aan bekende misbruiken ervan door de ‘BigTech’-bedrijven. Anderzijds worden deze databanken bijzonder attractief voor hackers, met één succesvolle cyberaanval ligt hierdoor bijzonder vaak veel gevoelige data voor het grijpen.
Centrale onderzoeksvraag
Wie ‘blockchain’ hoort zal dit vaak gelijkstellen met ‘bitcoin’, doch blockchain is slechts de onderliggende technologie van bitcoin, een technologie die meer bepaald toelaat om data – dus data in het algemeen – op een vertrouwelijke manier op een gedistribueerde wijze op te slaan.
Dit maakt begrijpelijk dat “Distributed” of “Decentralized Artificial Intelligence” (D.A.I.) de poging is om A.I.-systemen te bouwen waarbij de data zich niet centraal maar decentraal op een blockchain gaat bevinden. Dient worden opgemerkt dat wanneer we spreken over data bij A.I. dit kan gaan om twee zaken: enerzijds de gelabelde data zoals hiervoor besproken en anderzijds ‘de kennis’, of dat wat het algoritme uit de data kunnen leren heeft (want, ook dat moet ergens worden opgeslagen).
Nu wordt A.I., meer bepaald “Machine Learning”, ook steeds vaker ingezet in “Internet-of-Things” of IoT-toepassingen en dat brengt ons tot de vraag: In welke mate – en hoe – zijn dergelijke D.A.I.-systemen ook in te zetten in Machine Learning toepassingen specifiek voor het Internet-of-Things?
Methodologie
Met het oog op het beantwoorden van de centrale onderzoeksvraag zal er een literatuurstudie worden uitgevoerd alsook zal er een experiment worden opgezet.
- De literatuurstudie heeft voornamelijk als doel het bestuderen hoe nu juist de getrainde resultaten van een Machine Learning algoritme in een gedistribueerd datamodel kunnen functioneren. Dit is namelijk het grootste complicatiepunt in dergelijk systeem daar IoT-devices vaak slechts beperkte communicatiemiddelen hebben en een heel beperkte rekenkracht. Bovendien moeten IoT-devices ook vaak nog uit batterijen gevoed worden en dus elk extra stroomverbruik – zoals het zenden en ontvangen van data – zal voor een levensduurbeperking van het IoT-device zorgen.
- Het doel van het experiment is m.b.v. Machine Learning een eenvoudige symboolherkenning te doen op een symbool afkomstig van een IoT-sensor waarbij niet enkel de data van de trainingsset zich decentraal op een blockchain bevindt – bijvoorbeeld door middel van het op het Etherium crypto netwerk gebaseerde “IPFS” bestandssysteem – maar waarbij eveneens de trainingsresultaten nodig voor de herkenning zich decentraal op een blockchain bevinden.