scaleway exploite l’API compatible OpenAI de Scaleway AI. Il fonctionne avec les agents et workflows AI Kit.
Installation
Configuration
Utilisation avec un agent
Modèles proposés
| Modèle | Description | Taille |
|---|---|---|
gpt-oss-120b | Modèle généraliste performant | 120B |
llama-3.3-70b-instruct | Meta Llama 3.3 orienté instruction | 70B |
llama-3.1-8b-instruct | Llama compact | 8B |
mistral-small-3.2-24b-instruct-2506 | Mistral Small récente | 24B |
mistral-nemo-instruct-2407 | Mistral Nemo optimisé | 12B |
qwen3-235b-a22b-instruct-2507 | Qwen 3 grande capacité | 235B |
qwen3-coder-30b-a3b-instruct | Qwen 3 spécialisé code | 30B |
deepseek-r1-distill-llama-70b | DeepSeek R1 distillé | 70B |
gemma-3-27b-it | Google Gemma 3 instruction | 27B |
voxtral-small-24b-2507 | Voxtral Small | 24B |
devstral-small-2505 | Devstral pour le dev | 25B |
pixtral-12b-2409 | Pixtral multimodal | 12B |
Exemples
Sortie structurée
Dans un workflow
Streaming
Choisir le bon modèle
- Génération de code :
qwen3-coder-30b-a3b-instruct,devstral-small-2505. - Tâches générales :
gpt-oss-120b,llama-3.3-70b-instruct. - Charges légères :
llama-3.1-8b-instruct,mistral-nemo-instruct-2407. - Raisonnement complexe :
deepseek-r1-distill-llama-70b,qwen3-235b-a22b-instruct-2507. - Multimodal :
pixtral-12b-2409.
Bonnes pratiques
- Sécurité – stockez la clé API dans un secret, jamais dans le code.
- Gestion d’erreurs – entourez les appels d’un
try/catchet journalisez les erreurs. - Contrôle des coûts – définissez
maxOutputTokenset surveillez l’utilisation. - Température – adaptez selon la créativité souhaitée (
0.0-0.3précis,0.4-0.7équilibré,0.8+très créatif).