Fine-tuning van LLMs
GPT, Claude, Llama of Mistral fijn-gesteld op jullie data en domein-taal. Van juridisch jargon tot productie-logs, het model leert schrijven en redeneren zoals jullie mensen dat doen.
Je eigen AI, je eigen regels
Fine-tuned op jouw data, getraind op jouw domein, gehost op jouw infra. Geen data naar Microsoft of OpenAI, geen vendor lock-in, geen verrassingsfacturen bij volume. Als standaard-modellen te algemeen zijn, bouw je er één die past.
Skrepr traint AI-modellen voor bedrijven die een standaard-LLM uitgegroeid zijn en eigen weights willen.
10-30%
Accuracy-winst
<10%
Kosten vs LLM-API
100%
Data-soeverein
Even eerlijk zijn
GPT en Claude zijn goed in algemene taal, maar ze weten niks van jullie producten, jullie jargon, jullie compliance-regels. En ze draaien op servers in de VS, onder voorwaarden die jullie niet kennen.
En dan krijg je de security-officer op bezoek met een printje van de AVG.
Jargon wordt niet begrepen
Je domein-taal (juridisch, medisch, industrie-sector) is te niche. Het standaard-model hallucineert of schrijft als een stagiair.
Data mag de EU niet uit
AVG, klant-contracten of compliance-eisen verbieden dat jullie data naar een US cloud-provider gaat. De DPO zegt nee.
Per-token-kosten ontploffen
Bij miljoenen calls per maand tikt de OpenAI-factuur harder dan je had begroot. Een eigen model is na training een fractie.
Tenders vragen eigen AI
Klanten vragen expliciet naar "bij jullie privaat getrainde AI" in RFP's. Met een OpenAI-wrapper win je die aanbesteding niet.
Zo bouwen we jullie model
Vier bouwstenen die samen maken dat jullie model past bij jullie data en bij jullie compliance-afdeling.
GPT, Claude, Llama of Mistral fijn-gesteld op jullie data en domein-taal. Van juridisch jargon tot productie-logs, het model leert schrijven en redeneren zoals jullie mensen dat doen.
Niet elk probleem vraagt een LLM. Classifiers, regressors of tijd-serie-modellen in sklearn of PyTorch zijn vaak sneller, goedkoper en net zo precies voor gestructureerde data.
Training draait op jullie infra of in een EU-cloud van jullie keuze. Geen trainings-data naar Microsoft of OpenAI, geen verborgen re-training op jullie prompts. Weights blijven van jullie.
Monitoring, drift-detectie, re-training en model-versioning zitten in de deal. Een model is geen CD-rommel die je brandt en vergeet, het leeft mee met jullie data.
Niet zeker of een custom model de juiste zet is? Begin met AI-advies of een afgebakende pilot, dan toetsen we eerst of de business-case klopt.
Start AI-scanWat het oplevert
Typische accuracy-winst van een fine-tuned model ten opzichte van een generieke LLM, gemeten op domein-specifieke taken.
Fine-tune versus generiek
10-30%
accuracy-winst
Scoort 10-30% hoger op jullie use-case. Plus volume-kosten die een fractie zijn van commerciële LLM-API's na training.
Kosten na training
<10%
Data-soevereiniteit
100%
Deployment
On-prem
Vendor lock-in
Geen
"Met GPT-4o liepen we tegen een muur, het kon ons juridisch jargon niet aan. Skrepr trainde een Llama-variant op onze dossiers. Het model schrijft nu conclusies in onze huisstijl, on-prem, en we zijn af van de per-token-factuur."
Vier stappen, geen zes maanden
We scopen eerlijk, kiezen de juiste techniek, trainen en leveren op met MLOps. Geen vage AI-roadmap van een consultancy die zelf nog nooit een model getraind heeft.
Stap 1, scoping
We kijken naar de business-vraag en wat er aan data ligt. Hoeveel, welke kwaliteit, welke labels, welke privacy-beperkingen. Eerlijk antwoord of het kan, soms is het nog te vroeg.
Stap 2, model-keuze
Niet elk probleem is een fine-tune. Soms is RAG voldoende, soms wil je een classifier, soms écht een custom LLM. We kiezen op basis van data, budget en latency, niet op basis van hype.
Stap 3, training
We draaien training op een EU-GPU-cluster of jullie infra. Evaluatie op een hold-out set, vergelijking met baseline-modellen, metrics die jullie business snapt. Geen black-box-benchmarks.
Stap 4, go-live
Model draait waar jullie willen: eigen datacenter, AWS EU, air-gapped omgeving. Monitoring, drift-alerts en re-training-scripts zetten we ernaast, zodat het model blijft kloppen.
Vast de vragen die je hebt
Klaar om jullie eigen model te bouwen?
Een AI-scan is gratis en concreet. We kijken naar jullie data, jullie use-case en jullie infra, en geven eerlijk antwoord of een custom model zinvol is. Zo niet, dan horen jullie dat ook.
Bellen werkt altijd. Ciao!