ZelixAI Tokenomics › Profil du modèle

Mistral Small 3.2 — 24B

Snel, Europees, geschikt voor de meeste klantvragen.

via ZelixAI Privacy Cluster →

Vitesse Rapide

Catégorie de coût Très abordable

Contexte 128K tokens

Outils oui

Satisfaction

95%

Qu'est-ce que ce modèle ?

Mistral Small 3.2 est le modèle de langage à 24 milliards de paramètres de Mistral AI à Paris. Open-weight (licence Apache 2.0), instruction-tuned sur un large corpus avec une forte attention aux langues européennes, il atteint 60 à 100 tokens par seconde sur du matériel GPU moderne. Nous exécutons ce modèle au sein du ZelixAI Privacy Cluster — votre requête ne quitte jamais l'UE.

Points forts

Points forts : vitesse d'inférence élevée, instruction-following solide pour les conversations professionnelles, performance fiable en français, allemand, néerlandais, italien et espagnol, et zéro composant cloud américain dans le chemin de requête. Pour la majorité des questions clients, ce modèle produit dans nos tests des résultats qui n'ont rien à envier aux modèles cloud plus lourds — à un coût nettement inférieur et avec une résidence UE.

Adapté pour

Questions clients générales et conversations chatbot
Gestion des FAQ et requêtes de base de connaissances
Résumés courts et détection d'intention

Comment ZelixAI utilise ce modèle

Au sein de ZelixAI, Mistral Small est le modèle par défaut du Privacy Cluster — quand vous activez le mode privacy (ou quand votre forfait le fait par défaut), nous routons vers ce modèle pour les questions clients, la gestion des FAQ, les résumés courts et les conversations chatbot générales. Vous pouvez à tout moment basculer vers un autre modèle de la même catégorie ou monter en Cloud Premium.

Exemples pratiques au sein de ZelixAI

Concrete praktijkvoorbeelden voor dit model worden binnenkort hier gepubliceerd. Stel intussen vragen via onze contactpagina — we delen graag relevante use-cases uit onze klantbasis.

Limites et points d'attention

Limites : sur des questions très spécifiques sans contexte de grounding, le modèle peut halluciner. Pas le premier choix pour la génération de code complexe ou le raisonnement multi-étapes — Llama 3.3 70B (Privacy) ou Claude Sonnet 4 (Cloud) sont plus performants. La date de coupure des connaissances précède la date d'entraînement ; combinez toujours avec notre couche RAG (votre propre base de connaissances) pour des informations à jour.

Spécifications techniques

Fournisseur	ZelixAI Privacy Cluster
Fenêtre de contexte	128K tokens
Débit	40–100 tokens/s (Rapide)
Catégorie de coût	Très abordable
Tool / function-calling	oui
Résidence des données	UE (Pays-Bas · Allemagne · France)

Autres modèles dans cette catégorie

GPT-OSS — 120B

Grand modèle open-source, performant en analyse juridique et médicale.

Llama 3.3 — 70B

Modèle phare polyvalent ; excellent en conversations multilingues et tool-use.