La nostra offerta Large Language Model as a Service (LLMaaS) vi dà accesso a modelli linguistici all'avanguardia, la cui inferenza viene eseguita con un'infrastruttura qualificata SecNumCloud, certificata HDS per l'hosting di dati sanitari, e quindi sovrana, calcolata in Francia. Beneficiate di prestazioni elevate e di una sicurezza ottimale per le vostre applicazioni AI. I vostri dati rimangono strettamente confidenziali e non vengono né sfruttati né conservati dopo l'elaborazione.
Chat e ragionamento
I nostri modelli di grandi dimensioni offrono prestazioni all'avanguardia per i compiti più impegnativi. Sono particolarmente adatti alle applicazioni che richiedono una comprensione profonda del linguaggio, ragionamenti complessi o l'elaborazione di documenti lunghi.
qwen3.6:27b
gpt-oss:120b
lama3.3:70b
nemotron-3-super:120b
qwen3-2507:235b
mistral-small4:119b
qwen3-2507-pensiero:4b
Programmazione e agenti
I nostri modelli di programmazione e di agenti sono appositamente ottimizzati per l'ingegneria del software agenziale, la generazione di codice su larga scala e l'automazione del flusso di lavoro di sviluppo.
qwen3.6:35b
qwen-coder-next:80b
qwen3-next:80b
devstral-small-2:24b
funzione gemma: 270 m
Visione e multimodalità
I nostri modelli di visione e multimodali possono analizzare immagini, video e documenti visivi. Eccellono nell'OCR, nel rilevamento di oggetti, nell'estrazione di strutture e nel ragionamento spazio-temporale.
qwen3-vl:235b
qwen3-vl:30b
qwen3-vl:4b
gemma4:31b
gemma4:12b-it-qat
Incorporazione
I nostri modelli di embedding trasformano il testo in rappresentazioni vettoriali per la ricerca semantica, il clustering e le pipeline RAG (Retrieval-Augmented Generation).
bge-m3:567m
qwen3-embedding:4b
qwen3-embedding:8b
qwen3-embedding:0.6b
granito-embedding:278m
embeddinggemma:300m
Reranking
I nostri modelli di reranking riordinano i risultati della ricerca in base alla rilevanza per affinare la qualità delle pipeline RAG. Compatibile con l'API Cohere.
nvidia/llama-nemotron-rerank-vl-1b-v2
qwen3-reranker:4b
qwen3-reranker:0.6b
bge-reranker-grande
Sicurezza
I nostri modelli di sicurezza sono specializzati nel rilevamento di contenuti problematici, nella prevenzione di jailbreak e nella garanzia di conformità alle normative (RGPD, HDS). Possono essere utilizzati come pre-filtri o post-filtri nei vostri flussi di lavoro.
granito3-guardia:8b
granito3-guardiano:2b
Traduzione
I nostri modelli di traduzione offrono un'elevata fedeltà in 55 lingue, rispettando la grammatica, le sfumature culturali e le specificità tecniche dei documenti.
translategemma:27b
Audio e immagini
I nostri modelli audio e immagine consentono la trascrizione vocale in tempo reale (streaming ASR) e la generazione di immagini da descrizioni testuali, compatibili con le API OpenAI.
voxtral
immagine z:16b
Modello a confronto
Questa tabella di confronto vi aiuterà a scegliere il modello più adatto alle vostre esigenze, in base a vari criteri come le dimensioni del contesto, le prestazioni e i casi d'uso specifici.
| Modello | Editore | Parametri | Contesto (token) | Visione | Agente | Ragionamento | Sicurezza | Rapido * | Efficienza energetica * |
|---|---|---|---|---|---|---|---|---|---|
| Chat e ragionamento | |||||||||
| qwen3.6:27b | Squadra Qwen | 27B | 1 000 000 | ||||||
| gpt-oss:120b | OpenAI | 120B | 120 000 | ||||||
| lama3.3:70b | Meta | 70B | 132 000 | ||||||
| nemotron-3-super:120b | NVIDIA | 120B | 1 000 000 | ||||||
| qwen3-2507:235b | Squadra Qwen | 235B | 200 000 | ||||||
| mistral-small4:119b | Mistral AI | 119B | 262 144 | ||||||
| qwen3-2507-pensiero:4b | Squadra Qwen | 4B | 250 000 | ||||||
| Programmazione e agenti | |||||||||
| qwen3.6:35b | Squadra Qwen | 35B | 1 000 000 | ||||||
| qwen-coder-next:80b | Squadra Qwen | 80B | 250 000 | ||||||
| qwen3-next:80b | Squadra Qwen | 80B | 250 000 | ||||||
| devstral-small-2:24b | Mistral AI e All Hands AI | 24B | 200 000 | ||||||
| funzione gemma: 270 m | 270M | 32 768 | |||||||
| Visione e multimodalità | |||||||||
| qwen3-vl:235b | Squadra Qwen | 235B | 200 000 | ||||||
| qwen3-vl:30b | Squadra Qwen | 30B | 250 000 | ||||||
| qwen3-vl:4b | Squadra Qwen | 4B | 250 000 | ||||||
| gemma4:31b | 31B | 250 000 | |||||||
| gemma4:12b-it-qat | 12B | 250 000 | |||||||
| Incorporazione | |||||||||
| bge-m3:567m | BAAI | 567M | 8 192 | ||||||
| qwen3-embedding:4b | Squadra Qwen | 4B | 40 000 | ||||||
| qwen3-embedding:8b | Squadra Qwen | 8B | 40 000 | ||||||
| qwen3-embedding:0.6b | Squadra Qwen | 0.6B | 32 768 | ||||||
| granito-embedding:278m | IBM | 278M | 512 | ||||||
| embeddinggemma:300m | 300M | 2 048 | |||||||
| Reranking | |||||||||
| nvidia/llama-nemotron-rerank-vl-1b-v2 | NVIDIA | 1B | 4 096 | N.C. | |||||
| qwen3-reranker:4b | Squadra Qwen | 4B | 4 096 | N.C. | |||||
| qwen3-reranker:0.6b | Squadra Qwen | 0.6B | 4 096 | N.C. | |||||
| bge-reranker-grande | BAAI | 335M | 512 | N.C. | |||||
| Sicurezza | |||||||||
| granito3-guardia:8b | IBM | 8B | 8 192 | ||||||
| granito3-guardiano:2b | IBM | 2B | 8 192 | ||||||
| Traduzione | |||||||||
| translategemma:27b | 27B | 120 000 | |||||||
| Audio e immagini | |||||||||
| voxtral | Mistral AI | 4B | 32 768 | N.C. | |||||
| immagine z:16b | Comunità | 16B | N.C. | N.C. | |||||
Casi d'uso consigliati
Ecco alcuni casi d'uso comuni e i modelli più adatti per ciascuno di essi. Queste raccomandazioni si basano sulle prestazioni e sulle capacità specifiche di ciascun modello.
Dialogo multilingue
- nemotron-3-super:120b
- qwen3.6:27b
- gpt-oss:120b
Analisi di documenti lunghi
- nemotron-3-super:120b
- qwen3.6:27b
- qwen3-2507:235b
Programmazione e sviluppo
- qwen3.6:35b
- qwen-coder-next:80b
- devstral-small-2:24b
- nemotron-3-super:120b
Analisi visiva
- qwen3-vl:235b
- gemma4:31b
- qwen3-vl:30b
Sicurezza e conformità
- granite4.1-guardian:8b
- granito3-guardia:8b
- granito3-guardiano:2b
- mistral-small4:119b
Impieghi leggeri
RAG (Generazione Aumentata dal Recupero)
- bge-m3:567m
- nvidia/llama-nemotron-rerank-vl-1b-v2
- qwen3.6:27b