Le contexte
Neuralk-AI développe des modèles de fondation spécialisés dans les données tabulaires — bases de données, tableurs, catalogues produits. Leur technologie permet de générer des prédictions (classification, régression, séries temporelles) sans fine-tuning, directement exploitables par des acteurs comme Leclerc ou Auchan.
Mais un modèle, aussi bon soit-il, ne devient un produit qu'au moment où un utilisateur peut l'appeler facilement, lui envoyer ses données, suivre le traitement et récupérer les résultats. Cette couche d'interface est tout sauf triviale.
« Un modèle de pointe sans interface soignée reste une démo. Le produit, c'est ce qui se passe entre le data scientist et le GPU. »
Le défi
Trois contraintes spécifiques au monde de l'IA tabulaire :
- Volumes massifs : les modèles s'alimentent de fichiers pouvant atteindre plusieurs gigaoctets. Un simple upload ne suffit pas.
- Adoption data scientist : la cible n'utilise pas une UI, elle appelle un SDK depuis ses notebooks. La friction doit être quasi nulle.
- Coût GPU : faire tourner des machines haute performance en continu, hors usage, coûte prohibitivement cher. L'infra doit suivre la demande réelle.
Neuralk-AI avait besoin d'une couche d'interface robuste, sobre et scalable, pour laisser ses équipes se concentrer sur la recherche.
Notre rôle
TBDS a pris en charge la conception et le développement de l'ensemble de la couche d'interface entre les modèles de Neuralk-AI et leurs utilisateurs data scientists : API, SDK Python orienté adoption, pipeline d'ingestion de fichiers volumineux, et système de suspension/réveil automatique des GPUs.
Sur un partenariat avec une équipe de recherche, le rôle d'un cabinet d'ingénierie n'est pas de prescrire l'algorithme — c'est de tenir la couche produit pour que la recherche puisse se concentrer sur ce qu'elle fait de mieux.
Le dispositif
Trois chantiers structurants, traités de bout en bout :
- Pipeline d'ingestion gigaoctets : découpage en chunks, reprise sur erreur, gestion des timeouts, optimisation côté client. Un fichier de plusieurs Go monte sans drame et sans surveiller l'écran.
- SDK Python pensé pour l'adoption : en quelques lignes de code, un data scientist visualise l'état de ses traitements, suit la progression en temps réel, accède à ses fichiers, monitore les durées restantes. Les administrateurs ont une vue globale de l'activité.
- Suspension / réveil automatique des GPUs : les machines s'éteignent quand personne ne les utilise, se réveillent à la demande, et la facture suit l'usage réel — sans dégradation perçue côté utilisateur.
« Si un data scientist doit lire la doc plus de cinq minutes avant son premier appel, on a raté l'adoption. »
L'IA, au bon endroit
Sur ce projet, l'IA n'est pas ce qu'on ajoute au produit : elle est le produit. Notre travail consiste à la rendre exploitable — à transformer un modèle en service appelable, prévisible, et économiquement soutenable.
La même boussole qu'ailleurs s'applique : poser l'ingénierie au bon endroit pour que la valeur du modèle se traduise en usage. Sans pipeline d'ingestion solide, sans SDK ergonomique, sans scaling GPU intelligent, le meilleur modèle reste une promesse.
La valeur d'une IA tabulaire se mesure à la fluidité avec laquelle un data scientist peut l'appeler depuis son notebook, et à la stabilité du coût qu'elle représente pour son éditeur.
Résultats & impact
Le partenariat se mesure d'abord à ce qu'il a permis : Neuralk-AI s'est concentré sur sa recherche et ses modèles pendant que TBDS construisait la couche produit. Une mise sur le marché accélérée, une expérience développeur soignée, une infrastructure dont les coûts suivent l'usage.
Ce projet illustre ce que TBDS apporte aux équipes deep tech : transformer un modèle de recherche en produit utilisable, sans en altérer la valeur scientifique, et avec une infrastructure dimensionnée pour durer.