De meest succesvolle bedrijven in de toekomst zullen degenen zijn die hun AI-investeringen optimaliseren. Nu bedrijven hun reis naar AI-gereedheid beginnen, moeten ze robuuste datamanagementstrategieën ontwikkelen om het toegenomen datavolume en de toenemende complexiteit aan te kunnen, en ervoor te zorgen dat betrouwbare data beschikbaar zijn voor zakelijk gebruik. Gegevens van slechte kwaliteit zijn een last voor gebruikers die betrouwbare modellen proberen te bouwen om inzichten te extrapoleren voor inkomstengenererende activiteiten en betere bedrijfsresultaten.
Het is niet ongebruikelijk dat zakelijke gebruikers prioriteit geven aan de toegang tot de gegevens die ze nodig hebben boven de kwaliteit of bruikbaarheid ervan. De simpele waarheid is dat een organisatie gegevens van slechte kwaliteit heeft en deze gebruikt om te voeden AI-hulpmiddelenzal het onvermijdelijk slechte kwaliteit en onbetrouwbare resultaten opleveren.
Chief Product Officer, Ataccama.
Waarom datakwaliteit belangrijk is
Datakwaliteit is van cruciaal belang omdat het fungeert als brug tussen technische en zakelijke teams, waardoor effectief kan worden gewerkt samenwerking en het maximaliseren van de waarde die uit gegevens wordt afgeleid. Afhankelijk van de gegevensbron en de governancevereisten vormt dit een tijdrovende uitdaging voor datawetenschappers, die tot 80 procent van hun tijd kunnen besteden aan het opschonen van de gegevens voordat ze er zelfs maar mee aan de slag kunnen.
Het samenvoegen van gegevensbronnen is een enorme opgave. Het werk dat gepaard gaat met het combineren en transformeren van meerdere datasets, zoals ruwe data uit reguliere bedrijfsactiviteiten, oude data in allerlei formaten, of nieuwe datasets die zijn verkregen na een overname of fusie, mag niet worden onderschat.
Dit is belangrijk werk voor bedrijfsontwikkelingsdoeleinden. Gegevens zijn van cruciaal belang voor een betere targeting marketing En verkoopdirecte productinnovatie en marktuitbreiding, verbetering van de klantenservice en zelfs het creëren van een AI-chatbot of agent om de merkervaring te verbeteren. Het is ook van cruciaal belang om naleving van de nieuwste regelgeving te garanderen en om zich voor te bereiden op waarschijnlijke toekomstige vereisten op belangrijke gebieden, waaronder gegevensprivacy en -bescherming. Bedrijven moeten dus weten welke gegevens gevoelige informatie bevatten om deze te beveiligen en lekken of inbreuken te voorkomen.
Maar niet alle data zijn gelijk en organisaties moeten in staat zijn de hoogwaardige data die bedrijfskritisch zijn te onderscheiden van de laagwaardige data met een laag risico die geen beheer of bescherming behoeven. De enige manier om dit te doen is ervoor te zorgen dat de gegevens schoon en van hoge kwaliteit zijn.
Het cultiveren van een datagedreven cultuur
Datagedreven zijn betekent het ontwikkelen van een organisatiebrede cultuur die waarde uit data begrijpt en er actief naar streeft om alle besluitvorming te onderbouwen en zo betere bedrijfsresultaten te garanderen. Het gaat minder om het hebben van de gegevens, maar meer om het weten hoe u deze kunt optimaliseren.
Dit vereist een hoge mate van volwassenheid en toewijding om dit vermogen in de loop van de tijd te ontwikkelen. Een van de belangrijkste uitdagingen voor organisaties die meer datagedreven worden, is het verbinden van technische en bedrijf teams effectief. Dit is geen nieuw probleem, maar veel bedrijven hebben het nog niet met succes aangepakt en het belemmert hun vermogen om datagedreven te worden.
Datateams zijn vaak gefocust op het bouwen van een fundament voor data governance en het opzetten van verschillende tools en processen om hun organisatie te helpen. De zakelijke teams kunnen echter de gegevens ze krijgen is te technisch, niet van de juiste kwaliteit, niet in het juiste formaat, of simpelweg niet de juiste gegevens die ze nodig hebben. Het datateam begrijpt mogelijk niet de zakelijke context van het verzoek en dus niet welke gegevens nodig zijn, en deze onbedoelde verkeerde afstemming is een enorme uitdaging voor organisaties om te overwinnen.
Het resultaat is dat bedrijven uiteindelijk datateams krijgen die hun best doen om robuuste data-governancesystemen te bouwen, maar bedrijfsteams blijven ontevreden en maken onvoldoende gebruik van de data. Dit is waar het versnellen van datatransformatie met AI-verbeterde datakwaliteitsinitiatieven van cruciaal belang wordt. Zakelijke gebruikers hebben oplossingen nodig waarmee ze zelfstandig met gegevens kunnen werken: formaten kunnen wijzigen, deze kunnen verrijken en problemen automatisch kunnen oplossen via slimme algoritmen. Dit biedt de betrouwbare databasis die nodig is voor het implementeren van succesvolle AI-projecten.
Succesvolle AI begint met databeheer
Ondanks de huidige hype rond AI schat Gartner echter een verlies aan vertrouwen in generatieve AI-projecten als gevolg van de slechte datakwaliteit als een van de belangrijkste redenen. Er wordt voorspeld dat ten minste 30 procent in 2025 in de proof of concept-fase zal zijn verlaten. .
Het waarborgen van de datakwaliteit komt voort uit het opzetten van een organisatiebrede data governance-strategie. Dit zorgt ervoor dat het bedrijf zich kan concentreren op de gewenste resultaten van het gebruik van AI en generatieve AI, in plaats van AI uit te rollen, ongeacht de staat van de gegevens die zullen worden gebruikt om AI te trainen. AI is echter ook een hulpmiddel dat zal helpen de gegevens in een staat van AI-gereedheid te brengen door het handmatige toezicht en de arbeid te verminderen die traditioneel nodig is om gegevens te transformeren en op te schonen door processen en regels te automatiseren. Het kan ook helpen bij het profileren en classificeren van gegevens en het opsporen van afwijkingen, wat bijdraagt aan de algehele gezondheid van datasets.
GenAI kan gegevens vastleggen in niet-standaardformaten, waaronder tabellen, afbeeldingen en zelfs audio, om ervoor te zorgen dat de regels voor gegevenskwaliteit universeel worden toegepast. AI stelt niet-technische gebruikers ook in staat om zelfbediening te geven en de data-inzichten te vinden die ze nodig hebben door natuurlijke taal te gebruiken om vragen te verwerken, waardoor de creatie van bedrijfswaarde voor een organisatie op al haar afdelingen wordt ondersteund. Dit proces van datademocratisering staat centraal in het succes van alle AI-initiatieven, omdat het beperken van de toepassing en voordelen ervan voor technische teams hun impact ernstig zal beperken.
Uiteindelijk is kwaliteit belangrijker dan kwantiteit als het gaat om AI-trainingsgegevens. Elke opname van slechte kwaliteit zal verwarring toevoegen aan de LLM, waardoor het risico op hallucinaties toeneemt, en wanneer gegevens van slechte kwaliteit consequent worden gebruikt, zal de betrouwbaarheid van de resultaten afnemen. Tegenwoordig is er een keerpunt ontstaan door de snelle vooruitgang van AI-toolsets, de exponentiële toename van data en digitale en AI-regelgeving, wat betekent dat organisaties een kans hebben om hun datastrategie op punt te stellen. Nu concurrentievoordeel, marktuitbreiding, klantervaring en bedrijfsgroei allemaal op het spel staan, zullen de winnaars degenen zijn die nu prioriteit geven aan deze transformatie.
We vermelden de beste tools voor datavisualisatie.
Dit artikel is geproduceerd als onderdeel van TechRadarPro's Expert Insights-kanaal, waar we de beste en slimste koppen in de huidige technologie-industrie in beeld brengen. De hier geuite standpunten zijn die van de auteur en zijn niet noodzakelijkerwijs die van TechRadarPro of Future plc. Als u geïnteresseerd bent om een bijdrage te leveren, kunt u hier meer lezen: https://www.techradar.com/news/submit-your-story-to-techradar-pro