Ebbene sì, abbiamo un nuovo agente. Arriva MuleRun in partnership (o forse no?) con Alibaba.
Di cosa parleremo..
Cos’è MuleRun e perché ne stiamo parlando
Se seguite il mondo delle intelligenze artificiali, avrete sentito parlare di MuleRun, una piattaforma di AI Agent che sta facendo parlare di sè nelle comunità di sviluppatori e professionisti. La particolarità? Non è un semplice chatbot, ma un agente AI sempre attivo che lavora su un computer dedicato (VPS), 24 ore su 24, anche mentre voi dormite.
Ho avuto l’opportunità di testarlo in anteprima, grazie a un contatto diretto con il team Alibaba dedicato all’AI (sì, Alibaba: ne parliamo tra poco). In questo articolo vi racconto cos’e MuleRun, come funziona, quanto costa e perché potrebbe essere il più serio competitor di Manus e TRAE Work.
MuleRun non è un altro chatbot
Il posizionamento di MuleRun è chiarissimo: non vogliono competere con ChatGPT o Copilot. Lo dicono esplicitamente nella loro comparison table sul sito, e dopo averlo provato posso confermare che hanno ragione.
Mentre ChatGPT principalmente risponde a domande in una finestra di chat e solo in parte lavora come agente multimodale, MuleRun completa l’intero task utilizzando un computer dedicato nel cloud, aprendo strumenti, eseguendo passaggi e consegnando risultati pronti all’uso con più agenti avviati contemporaneamente quasi come in un MoE.
Funziona 24/7, non solo mentre state chattando. Impara dai workflow reali degli utenti, non da dati di training generici. Dopo ore, non smette di funzionare: monitora, invia alert e agisce in modo proattivo. Descrivete il task una volta e lui lo esegue automaticamente. A voi resta solo il compito di revisionare, approvare e decidere.
Questa differenza sostanziale lo rende più simile a Manus e TRAE Work (o ad Hermes e OpenClaw se vogliamo andare sul Self-hosted) che a qualsiasi assistente conversazionale. E non è un caso che l’interfaccia utente ricordi molto da vicino quella di TRAE, con la stessa organizzazione a sidebar, task eseguibili e computer virtuale dedicato.
Il legame con Alibaba: non solo una partnership
Durante le mie ricerche, ho scoperto che MuleRun partecipa attivamente agli eventi del Qwen Conference 2026 e ha co-presentato la challenge creativa “Dive Into Your World” con World Aquatics e Alibaba Cloud. Il loro sito utilizza Aliyun CAPTCHA (il servizio di sicurezza di Alibaba Cloud) è il traffico passa attraverso Alibaba Cloud ESA (Edge Security Acceleration).
Ma la conferma più diretta mi è arrivata da una email del reparto AI di Alibaba, con cui ho un rapporto per Qwen e Alibaba Cloud. Il contatto mi ha presentato MuleRun come un prodotto che il team sta attivamente promuovendo ai propri partner business, suggerendo un legame molto più profondo di una semplice partnership tecnica.
La domanda che molti si stanno facendo è:
MuleRun è un prodotto incubato da Alibaba, o in futuro verrà acquisito?
Al momento l’azienda conta 14 dipendenti su LinkedIn, usa modelli di Google (Gemini), Anthropic (Claude), OpenAI (Codex, GPT Image 2), Qwen e Kling, ma l’infrastruttura cloud è chiaramente Alibaba. La presenza a eventi globali come SAP NOW Beijing, SuperAI Singapore, Bosch Connected World Berlin e NYC Tech Week (a16z) suggerisce un prodotto che guarda al mercato enterprise, non solo al consumer.
Come funziona MuleRun
L’ho testato personalmente con i miei crediti di benvenuto.
Ecco cosa ho trovato.
L’interfaccia principale è una chat con una sidebar sinistra che offre accesso a:
- Nuovo Task,
- Search,
- Studio,
- CLI,
- Computer,
- Drive e
- Toolbox.
Il computer dedicato (chiamato “MuleRun Computer”) è in beta e permette al vostro agente di funzionare 24/7 su una Virtual Machine personale nel cloud, con la possibilità di dargli un nome è una personalità proprio come facciamo con OpenClaw. Supporta sezioni come Investment, Image Creation, Coding & Building, Marketing e Research Report. Potete interagirci anche via Telegram, WhatsApp e Discord.

Ecco una panoramica delle funzionalità principali emerse dal test:
Studio creativo una sezione per generare immagini, video e audio con oltre 15 template divisi per categoria (Fashion, Kitchen, Automotive, Travel, Luxury, Beauty, Game, Tech e altre). Supporta risoluzione fino a 1080P e usa il modello Wan (quello di Alibaba, guarda un po’) per la generazione video.
Drive un archivio personale da 10 GB nel piano gratuito, con la possibilità di caricare file e organizzarli in cartelle. Durante il test ho visto che l’agente crea automaticamente uno spazio di lavoro dedicato (Agent Workspace) per i file generati.
Multi-modello MuleRun non usa un singolo modello AI. Integra Gemini, Claude, Codex, Qwen e Kling. Potete chiedere esplicitamente “genera un’immagine con Gemini” o “usa Claude per questa analisi”. Questa flessibilità è un punto di forza notevole rispetto alla concorrenza.
Modalita Flash e Pro due modalità di esecuzione: Flash per task rapidi e leggeri, Pro per task complessi che richiedono più potenza computazionale.
Cosa si può fare con MuleRun
I casi d’uso sono molteplici e coprono praticamente ogni esigenza lavorativa.
Ecco quelli che ho potuto verificare direttamente o tramite la documentazione:
Siti web e applicazioni generazione di siti web completi, web app interattive, marketplace, dashboard. Tra gli esempi presenti: Educational Course to Webapp, ScholarGuard AI, Reseller Growth Dashboard, Off-Peak Marketplace, Restaurant Shift AI, Quarterly Tax Estimator.
Report e documenti creazione di report di ricerca professionali, analisi documentali, piani strategici. Presente anche un caso d’uso per il riutilizzo di contenuti podcast.
Presentazioni generazione automatica di PPTX brandizzate. Basta descrivere il tipo di presentazione è il tono, e l’agente produce slide pronte all’uso.
Analisi finanziaria analisi di mercato azionario USA con report HTML visuali, grafici e tabelle. L’agente cerca i dati in tempo reale e produce un report completo.
Video e creatività generazione di video animati (fino a 5 secondi) usando il modello Wan, creazione di giochi, immagini con GPT Image 2.

Un test di sviluppo software: un videogame
Nella pagina degli Use Case sono presenti tantissimi esempi, ma come ormai da regola con i prodotti Made in China, ovviamente non ne funziona neppure uno.
Ad ogni modo, ho preso uno degli spunti “un endless game con protagonista un mulo” e ho avviato l’agente con un mio prompt.

Diciamoci la verità: al di là di qualche bug, il gioco c’è.
Non è sicuramente un titolo A+, ma in neppure 5 minuti e con un solo prompt ho avuto un gioco graficamente gradevole e funzionante. Non è da tutti! Con Manus questi risultati sono inarrivabili, spesso neppure compilano gli applicativi, mentre con TRAE Work (ex TRAE Solo) funzionano ma solo un po’, bisogna sempre insistere nella correzione.
Un test di sviluppo video
Ho provato a sviluppare un video di 5 secondi tramite Mule Studio, ma mi ha bloccato richiedendo un abbonamento attivo.
Alchè sono passato in chat e.. gli ho chiesto di farmi un video. L’ha fatto.
Ho chiesto di produrre un video cinematografico di un cavallo che corre nel deserto, un classico test. Ecco il risultato.
Qualitativamente prende un 7, magari un 7+. Non è male, c’è coerenza, c’è fluidità ed è aderente al prompt. Che sia un prodotto di Wan è chiaro come il sole, lo uso tantissimo e sono abituato ai suoi video, tra luci soffuse e rifletti molto accesi, quasi “umidi”.
Perchè io abbia potuto generare il video senza l’abbonamento, non mi è chiaro.
Quanto costa MuleRun?
MuleRun adotta un sistema a crediti (1 dollaro = 100 crediti). Il piano gratuito offre 500 crediti di benvenuto più 200 crediti al giorno.
Ma attenzione; con meno di 80 crediti ho sviluppato il video game, con 40 crediti il video. Quindi 500 crediti sono davvero tanti.
Ecco i piani disponibili:
Free 0 dollari al mese. Include 500 crediti di benvenuto, 200 crediti aggiornati ogni giorno, nessun credito mensile, fino a 5 pagine deployabili, 10 GB di spazio Drive, fino a 10 task in parallelo, 1 browser locale connesso e supporto community Discord.
Plus 16 dollari al mese (192 dollari all’anno con sconto del 20%). Aggiunge 2.000 crediti mensili, una VM personale con 2 core e 4 GB di RAM, fino a 10 pagine con dominio personalizzato, 100 GB di Drive, task paralleli illimitati, browser locali illimitati e supporto email con risposta in 72 ore lavorative.
Super 32 dollari al mese (384 dollari all’anno). Aumenta a 4.500 crediti mensili è una VM con 4 core e 8 GB di RAM, fino a 40 pagine.
Pro 160 dollari al mese (1.920 dollari all’anno). Offre 23.000 crediti mensili, VM con 8 core e 16 GB di RAM, fino a 100 pagine, 1 TB di Drive e accesso anticipato alle nuove funzionalità.
Sono disponibili anche piani Team ed Enterprise per chi ha esigenze più grandi, con prezzi personalizzati.
MuleRun vs Manus vs TRAE Work
Il confronto con Manus e TRAE Work è inevitabile, dato che tutti e tre si posizionano come AI Agent autonomi e non come chatbot. Ecco le differenze principali che ho individuato:
Rispetto a Manus, MuleRun offre un’interfaccia più rifinità è un ecosistema di template più ricco (Studio creativo, template predefiniti) è una maggior completezza del lavoro svolto. Come già detto, il videogioco funzionava alla prima run, con Manus questo è impossibile. Manus è più focalizzato sull’esecuzione pura di task complessi, mentre MuleRun punta anche sulla creatività (video, immagini, giochi).
Rispetto a TRAE Work, le somiglianze sono evidenti. Entrambi offrono computer virtuale dedicato, automazione browser e interfaccia a sidebar. MuleRun però ha il vantaggio di integrare più modelli AI, inclusi Gemini e Claude, e di offrire una integrazione con Telegram, WhatsApp e Discord.
Il vero punto di forza di MuleRun è il legame con Alibaba. La distribuzione globale, l’infrastruttura cloud e le relazioni enterprise di Alibaba danno a MuleRun un vantaggio competitivo che Manus e TRAE, da soli, faticano a eguagliare. D’altro canto, è ancora una startup con 14 dipendenti: la scala è la sostenibilità sono domande aperte.
Criticità e domande aperte
Nonostante le promesse, ci sono alcuni punti che meritano attenzione:
Startup piccola con soli 14 dipendenti su LinkedIn, la capacità di MuleRun di scalare e mantenere il servizio e tutta da dimostrare. Un’infrastruttura basata su VM dedicate per ogni utente è costosa, e i piani a 16 dollari al mese sembrano sostenibili solo se i costi di calcolo sono sussidiati (da Alibaba?).
Ecosistema acerbo alcune sezioni come Toolbox e CLI sono ancora in beta o non funzionanti ( Toolbox restituisce addirittura un 404. Come dobbiamo fare con questi cinesi? I dettagli sono importanti! ). Il marketplace degli agenti non è ancora disponibile. Il prodotto è evidentemente in evoluzione.
Sistema a crediti il modello di pricing a crediti può diventare costoso per carichi di lavoro pesanti. 200 crediti al giorno nel piano gratuito sono sufficienti per i test, ma per un uso professionale bisogna passare ai piani a pagamento.
Lock-in e trasparenza con l’infrastruttura su Alibaba Cloud, c’è il rischio di lock-in verso l’ecosistema cinese. La trasparenza sui modelli utilizzati e buona (elencano Gemini, Claude, Qwen), ma la governance dei dati merità attenzione per utenti europei sensibili al GDPR.
Concorrenza agguerrità Manus, TRAE Work, Devin, AutoGPT, CrewAI e gli stessi ChatGPT Tasks stanno tutti inseguendo la stessa visione di agenti autonomi. MuleRun deve distinguersi rapidamente o rischia di essere fagocitato dal mercato.
Qualche FAQ su MuleRun
MuleRun è un prodotto ufficiale Alibaba?
Non è ufficialmente un prodotto Alibaba, ma il rapporto è molto stretto. Il team Alibaba dedicato all’AI lo sta promuovendo ai propri partner, e l’infrastruttura è basata su Alibaba Cloud. La risposta più onesta e che si tratta di una startup fortemente legata ad Alibaba, probabilmente incubata o in procinto di essere acquisità.
Serve saper programmare per usarlo?
No. MuleRun è progettato per funzionare con linguaggio naturale. Descrivete cosa volete fare in italiano o inglese e l’agente esegue. La sezione CLI e pensata per sviluppatori, ma non è obbligatoria.
Quali modelli AI usa MuleRun?
Integra Gemini, Claude, Codex, Qwen e Kling. Potete scegliere esplicitamente quale modello usare per ogni task specificando “usa Gemini per questa immagine” o “usa Claude per questa analisi”.
I dati degli utenti sono al sicuro?
L’infrastruttura è su Alibaba Cloud, con server nella regione Singapore. Per utenti europei, è consigliabile verificare la policy sulla gestione dei dati è la conformità GDPR, dato che i dati transitano su cloud cinese.
Quanto costa veramente MuleRun?
Il piano gratuito permette di testare il servizio senza spendere nulla. Per un uso professionale, il piano Plus a 16 dollari al mese è il punto di partenza consigliato. I crediti consumati dipendono dalla complessità dei task: un’immagine semplice costa poco, un video o un’analisi complessa consuma di più.
Funziona in italiano?
Durante il test ho trovato l’interfaccia principalmente in inglese, ma il sito supporta multiple lingue (EN, ZH-CN, ZH-Hant, ES, PT-BR, JA, KO). L’italiano non è ancora tra le lingue supportate ufficialmente, ma l’agente comprende input in italiano.
Come funziona
La differenza sostanziale tra MuleRun è un chatbot tradizionale sta nell’architettura. Mentre ChatGPT genera testo (o altro) in una finestra di chat usando pressappoco un singolo modello alla volta con funzionalità multimodali senza “computer dedicato” (mi si conceda l’approssimazione), MuleRun orchestra una flotta di agenti specializzati che operano su una macchina virtuale dedicata.
Ogni agente può utilizzare un modello diverso a seconda del task: Qwen per la comprensione del linguaggio, Gemini per l’analisi visiva, Kling o WAN per la generazione video, Claude per il ragionamento complesso.
Questa architettura ricorda il pattern Mixture of Agents, dove diversi modelli collaborano alla risoluzione di un problema, ognuno specializzato in un aspetto diverso.
Alibaba ha integrato i propri modelli Qwen come motore principale, ma la flessibilità nel scegliere provider terzi (Gemini, Claude) è un elemento distintivo rispetto a piattaforme chiuse come TRAE Work.

