Text: Jan Hygstedt, Nordenchef på Denodo
I början av året lanserades GenAI-lösningen Deepseek R1 och uppmärksamheten blev stor – på goda grunder. Med en blandning av expertakitekturer (Mixture-of-Experts) och öppen källkod har den nämligen potential att påverka AI-marknaden överlag.
Med många års erfarenhet inom branschen för data management ser jag dessutom stora möjligheter med att kombinera Deepseek R1 med moderna dataplattformar.
Lägre kostnader och färre hinder för GenAI
Trots den enorma boosten kring Gen AI, har höga kostnader medfört att GenAI:s genomslag hittills inte gått ännu snabbare. Deepseek R1 sänker kostnaderna avsevärt och gör tekniken mer tillgänglig vilket främjar innovation inom området. Min arbetsgivare, Denodo, är specialister på datahantering och vi välkomnar utvecklingen.
En av de största utmaningarna inom GenAI idag är att göra företagsdata redo för AI på ett effektivt sätt och utan onödig komplexitet. Med moderna dataplattformar kan företag, via retrieval-augmented generation (RAG), få tillgång till relevant data snabbt och utan att de behöver omstrukturera sin befintliga infrastruktur. De flesta RAG-implementationer lagrar data i vektoriserad form för att AI-modellen ska kunna återanvända informationen. Problemet är bara att det kan vara dyrt, tidskrävande och kan leda till att data snabbt blir inaktuell.
Genom att istället lagra vektoriserad metadata kan AI-modellen använda datan för att generera queries, vilket möjliggör snabb och exakt hämtning av realtidsdata. Denna metod, ”Query RAG”, minskar kraven på dataduplicering och förbättrar både precision och aktualitet – utan att kompromissa med prestanda.
Deepseek R1 och datahantering: Lovande men med utmaningar
Min arbetsgivare, Denodo, har testat Deepseek R1 inom vår Query RAG-lösning och sett både fördelar och nackdelar med lösningen i förhållande till datahantering.
Fördelar: Modellen genererar mer precisa queries och hämtar relevanta dataset, vilket leder till mer exakta svar än många andra LLM:er.
Nackdelar: Queries genererades något långsammare i Deepseek än hos konkurrenter, vilket är en effekt av hur den här typen av modeller hanterar mindre vektoriserade dataset. Företag bör därför väga precision mot svarstid vid val av AI-modell.
Säkerhetsaspekter
Det har funnits en del skepsis kring Deepseek, särskilt på grund av dess kopplingar till kinesiska företag. USA har till och med förbjudit vissa applikationer som använder tekniken, med hänvisning till säkerhetsrisker.
För att hantera detta problem är det viktigt att använda en dataattform som inte använder Deepseek-klienter eller servrar, utan istället förlitar sig enbart på R1 LLM-modellen, vilken är tillgänglig via etablerade molnleverantörer som AWS och Azure. För organisationer med särskilt höga säkerhetskrav kan Deepseek R1 dessutom köras i en helt isolerad miljö.
Vad betyder detta för svenska företag?
AI-marknaden utvecklas snabbt och öppnar nya möjligheter, men varje teknikval har sina för- och nackdelar. Svenska företag bör därför ta del av erfarenheter av företag som Perkins Coie och Festo, vilka redan är igång med GenAI-agenter och där Denodos dataplattform hanterar den underliggande datan.
Det gäller sedan att ställa sig följande frågor:
Hur viktiga är realtidsdata och exakthet för våra AI-applikationer?
Vilken balans mellan svarstid och precision behöver vi?
Vilka säkerhets- och sekretesskrav måste vår AI-lösning uppfylla?
Denodo har positionerat sig som en ledare inom datahantering och AI-integration, och sammanfattningsvis kan sägas att Deepseek R1 kan bli viktig för datahantering och AI-integrering. Men som alltid gäller det att ta hänsyn till för- och nackdelar för just sin organisation innan man hoppar på AI-tåget.