seojuice

Come monitorare quando ChatGPT, Perplexity e Claude citano il tuo brand

Vadim Kravcenko
Vadim Kravcenko
· Updated · 14 min read

TL;DR Monitorare le menzioni di marca nella ricerca AI non è la stessa cosa che monitorare le posizioni. ChatGPT, Perplexity, Claude, Google AI Mode e Gemini mostrano citazioni in modi diversi, con cadenze diverse e stabilità diversa. Un programma sostenibile nel 2026 ha tre livelli: un diario manuale dei prompt da compilare ogni settimana, una scansione giornaliera automatizzata che registra il testo delle risposte e gli URL citati, e un’analisi competitiva trimestrale. La ricerca di Profound ha rilevato che il Turno 1 di una conversazione con ChatGPT genera citazioni con una probabilità 2,5 volte superiore rispetto al Turno 10; di conseguenza i prompt di monitoraggio devono assomigliare a vere domande di primo turno degli utenti, non a ricerche per parola chiave. Il tool conta meno del set di prompt e della frequenza con cui lo esegui. L’AI Visibility Checker di SEOJuice copre la scansione giornaliera; il diario manuale e la lettura competitiva restano un lavoro umano.

Perché il monitoraggio delle menzioni di marca conta adesso

Gli AI Overviews di Google hanno ridotto i click-through sulle query informative in misura che molti operatori stanno ancora misurando. Perplexity ha superato 20 milioni di utenti attivi mensili. Le risposte con browsing di ChatGPT citano in media 8-12 fonti, e quelle citazioni sono la nuova prima pagina. Se il tuo brand non compare tra le fonti, in quella risposta non esisti.

Il rank tracking è una disciplina con 25 anni di storia. Il mention tracking nella ricerca generativa somiglia più alla misurazione PR che alla misurazione SEO. Le citazioni sono non deterministiche: due utenti che pongono la stessa domanda a distanza di 30 secondi possono ottenere fonti diverse perché il modello recupera e ri-classifica in tempo reale. Un programma di monitoraggio deve tenere conto di questa varianza invece di fingere che non esista.

Esiste anche una componente competitiva che la ricerca classica non aveva. In una SERP ordinata, la posizione 1 è la posizione 1. In una risposta AI, il tuo brand può essere citato una volta in un riassunto di 400 parole mentre un concorrente ottiene tre citazioni e un virgolettato diretto. La share of voice all’interno della risposta generata è un vero KPI e non compare in Google Search Console.

Diagramma che mostra come la stessa query di brand produca superfici di citazione diverse su ChatGPT, Perplexity, Claude, Google AI Mode e Gemini, con frecce che collegano il prompt ai diversi formati di risposta di ciascun motore
Lo stesso prompt produce cinque superfici di citazione diverse. Il monitoraggio deve leggere ciascuna secondo le sue regole.

Dove compaiono davvero le menzioni di marca, motore per motore

I cinque motori non si comportano allo stesso modo e trattarli come un unico blocco fa perdere la maggior parte di ciò che accade.

ChatGPT (con browsing o Search). Quando ChatGPT esegue una ricerca web all’interno di una risposta, restituisce citazioni inline come piccoli numeri e un pannello Sources a lato. Il pannello elenca in genere 6-12 URL. Brandon Punturo di Profound ha evidenziato un fatto che molti operatori dimenticano:

"Il Turno 1 ha una probabilità 2,5 volte superiore di generare citazioni rispetto al Turno 10 e quasi 4 volte rispetto al Turno 20." — Brandon Punturo, Research Lead, Profound, "How ChatGPT sources the web", 3 febbraio 2026

Se il tuo prompt di monitoraggio è immerso in una lunga conversazione sintetica, misurerai una distribuzione diversa da quella che vedono gli utenti reali. Solo prompt di primo turno.

Perplexity. Ogni risposta cita. Le citazioni sono numerate inline e l’elenco completo delle fonti compare in cima alla risposta. Perplexity è il motore più semplice da tracciare perché ha il formato più deterministico: ogni risposta include un elenco di URL che si può fare scraping. È anche il più severo sulla qualità dei contenuti: pagine con struttura debole o contenuto scarno difficilmente rientrano tra le citazioni, anche se posizionano bene in Google classico.

Claude (con web search o su Claude.ai). Anthropic ha aggiunto la ricerca web a Claude nel 2025. Claude elenca le fonti in un riepilogo compatto alla fine della risposta, con marcatori stile nota nel corpo. Cita meno fonti per risposta (spesso 3-6) e pesa i domini autorevoli più di ChatGPT. Se il tuo brand viene citato da Claude, è un segnale più forte della stessa citazione in ChatGPT, dove la soglia è più ampia.

Confronto affiancato del comportamento delle citazioni in ChatGPT, Perplexity, Claude, Google AI Mode e Gemini: numero tipico di fonti per risposta, formato di citazione, frequenza di aggiornamento e difficoltà di tracciamento per ciascun motore
Come differiscono i cinque motori per formato di citazione, numero di fonti e difficoltà di tracciamento.

Google AI Mode e AI Overviews. AI Mode è l’esperienza di ricerca in chat lanciata da Google nel 2025; gli AI Overviews sono i riquadri di sintesi sopra i risultati tradizionali. Entrambi attingono a contenuti web. Robby Stein, VP Product di Google Search, ha descritto così il mix di fonti nel post di lancio:

"È possibile accedere non solo a contenuti web di alta qualità, ma anche a fonti fresche e in tempo reale come il Knowledge Graph, informazioni sul mondo reale e dati di shopping per miliardi di prodotti." — Robby Stein, VP Product Google Search, "Expanding AI Overviews and introducing AI Mode"

Conseguenza pratica: una citazione in AI Mode è in parte un segnale di ranking organico e in parte un segnale di entità-graph. Se il tuo brand non è nel Knowledge Graph di Google, AI Mode fa fatica a citarti con sicurezza.

Gemini (chat e integrazione in Google). Gemini cita meno di Perplexity ma più di ChatGPT senza browsing. Le citazioni appaiono come chip di origine in stile Google con favicon. Gemini è il più difficile da tracciare in scala perché la stessa query tramite l’app Gemini, AI Mode in Search e le integrazioni in Google Workspace può produrre tre formati di risposta diversi.

Il metodo manuale di audit dei prompt (parti da qui)

Prima di qualsiasi automazione, esegui un audit manuale. Serve a calibrare il tuo set di prompt su come gli utenti reali pongono domande sulla tua categoria. Se salti questo passaggio, finirai per automatizzare prompt che nessuno digiterebbe mai.

Parti da 15-20 prompt presi da quattro fonti:

  1. Le tue 20 migliori query organiche degli ultimi 90 giorni in Google Search Console, riscritte in domande in linguaggio naturale che un essere umano farebbe a un chatbot.
  2. Cinque prompt di confronto che nominano il tuo brand e i concorrenti diretti ("come si confronta X con Y per…").
  3. Cinque prompt di raccomandazione che chiedono al modello di suggerire uno strumento, un fornitore o un approccio nella tua categoria, senza citare alcun brand.
  4. Cinque prompt con intento d’acquisto ("miglior X per uso Y nel 2026").

Esegui ogni prompt manualmente su cinque superfici: ChatGPT (con Search), Perplexity, Claude (con web search), Google AI Mode e Gemini. Registra tre cose per ogni run: se il tuo brand appare nel testo della risposta, se il tuo dominio compare tra le fonti citate e quali concorrenti compaiono. Un foglio di calcolo con colonne per i motori e righe per i prompt è tutto lo strumento. Non stai ancora misurando il ranking: stai osservando la forma reale delle risposte.

L’audit manuale di solito fa emergere tre cose che l’automazione non rileva. Voice drift: come il modello descrive il tuo brand. Se ChatGPT caratterizza costantemente in modo errato ciò che vendi, è un problema di ancoraggio fatti che il tracking delle citazioni non risolve; servono correzioni sui tuoi contenuti autorevoli. Il pattern "quasi lì": prompt in cui eri citato il mese scorso ma non questo mese, spesso perché un concorrente ha pubblicato nuovi contenuti. E i buchi nei prompt di raccomandazione: query in cui la risposta è ragionevole ma nessuno tra le fonti citate è un player che ti aspetteresti.

Pattern di tracking automatizzato che reggono

Dopo che l’audit manuale ha calibrato il set di prompt, automatizza. Tre pattern funzionano bene in produzione:

Esecuzioni programmate dei prompt. Esegui i tuoi 15-20 prompt ogni giorno sui motori che ti interessano. Acquisisci l’intero testo della risposta, l’elenco degli URL citati e un timestamp. Conserva tutto. Il segnale vive nel diff del testo settimana su settimana.

Diff delle citazioni. Confronta l’insieme di URL citati di oggi con quello di ieri, per prompt e per motore. Contano tre stati: stabile (citato ieri e oggi), nuovo (non citato ieri, citato oggi) e perso (citato ieri, assente oggi). Le citazioni perse sono l’allarme precoce che un concorrente ha preso uno slot che occupavi tu.

Punteggio di sentiment e accuratezza. Quando il testo della risposta menziona il tuo brand, valutalo per sentiment (positivo, neutro, negativo) e accuratezza (la descrizione è corretta?). Il sentiment di default è quasi sempre neutro; la metrica più utile è l’accuratezza. Un controllo programmato che passa il testo a un secondo modello con rubric "la descrizione è corretta?" intercetta le distorsioni in anticipo.

Diagramma a tre livelli del tracking: diario dei prompt manuale con cadenza settimanale in alto, scansione giornaliera automatizzata dei prompt al centro, revisione competitiva trimestrale in basso, con frecce che mostrano i flussi fra i livelli
Lo stack a tre livelli. Il manuale imposta i prompt, l’automazione li esegue, la revisione competitiva ti dice se la tua share of voice sale o scende.

Nessuno di questi pattern richiede infrastruttura sofisticata. Uno script Python che chiama le API di OpenAI, Anthropic e Perplexity, un cron job e una tabella Postgres coprono un programma da 20 prompt. La complessità arriva alla scala: 200 prompt su 5 motori al giorno significano 1.000 chiamate API quotidiane, e il costo sale. È qui che gli strumenti dedicati valgono il prezzo.

Confronto tra gli strumenti di tracking

Il mercato dei tool per il mention tracking AI ha circa 18 mesi. Cinque categorie contano per chi deve scegliere uno stack.

ToolMotori copertiDiff citazioniSentiment / accuratezzaVista competitivaIdeale per
SEOJuice AI Visibility CheckerChatGPT, Perplexity, Claude, Google AI Mode, GeminiSentiment sì, accuratezza via rubricSì, affiancataTeam SEO che aggiungono AI tracking a una dashboard esistente
ProfoundChatGPT, Perplexity, Claude, Google AISì (Share of Voice)Team enterprise con programmi da 500+ prompt
OtterlyChatGPT, Bing Chat, Perplexity, Google AISolo sentimentTeam brand mid-market
AthenaHQChatGPT, Perplexity, Claude, GeminiAgenzie che tracciano più clienti
Diario dei prompt manualeTutti i motori, manualeManualeManualeManualeValidazione dei prompt prima dell’automazione; reality check continuo

Una nota: i motori cambiano. L’analisi di Profound su un aggiornamento ChatGPT 2026 è stata schietta su quanto possa muoversi tutto in un rilascio:

"La visibilità media è scesa del 31% e oltre l’85% dei brand ha registrato cali complessivi." — Ralfi Berk, Josh Blyskal e Sartaj Rajpal, Profound, "ChatGPT's Entity Update"

Un calo medio del 31% in un solo update è il tipo di oscillazione che manda in crisi set di prompt fragili. Scegli un tool che gestisca il versioning dei modelli, o implementalo. Se il tuo programma presume che i prompt siano costanti, passerai settimane a debug di "drop" che in realtà sono update di modello.

La linea build-vs-buy sta intorno ai 50 prompt. Sotto, uno script Python più un Google Sheet battono la maggior parte dei tool a pagamento perché iteri i prompt più in fretta. Sopra, serve un vendor che abbia risolto storage, dashboarding e rate limit così puoi concentrarti sulle azioni contenutistiche che i dati indicano. In ogni caso, preferisci un AI visibility tracker dedicato piuttosto che riadattare una piattaforma SEO classica: i data shape sono troppo diversi.

Cosa gli AI Overviews sbagliano sul tracking delle citazioni

Se cerchi "come tracciare le menzioni di marca in ChatGPT", l’AI Overview ti dirà di impostare Google Alert. Non è sbagliato, solo inutile: Google Alert indicizza pagine web, non risposte AI, quindi non vede mai una citazione di ChatGPT. Lo stesso Overview consiglierà Brand24 o Mention; entrambi sono ottimi per il monitoring open-web, nessuno dei due vede le superfici di risposta AI a meno che non abbiano costruito un prodotto ad hoc.

Altri tre equivoci comuni negli AI Overview da correggere:

"Traccia il tuo ranking in ChatGPT." ChatGPT non ha ranking. Ha insiemi di citazioni che cambiano per query, sessione e versione di modello. Parlare di "ranking" applica il modello mentale sbagliato. Traccia la share di citazione, non la posizione.

"Usa la stessa lista di keyword della SEO." Le keyword non sono prompt. Una keyword è "best CRM for startups". Un prompt è "Sto creando un SaaS B2B con un team di 12 persone, quale CRM dovremmo scegliere?". I prompt reali sono più lunghi, contestuali e producono set di citazioni diversi. Se riusi la tua lista keyword SEO alla lettera, perderai i prompt che contano davvero.

"Traccia le menzioni AI ogni mese." Il mensile è troppo lento. Gli insiemi di citazioni si muovono su cadenza giornaliera o persino oraria all’interno di una versione di modello. Non coglierai il pattern di citazione persa a ritmo mensile. Il minimo è giornaliero; la revisione settimanale dei dati giornalieri è lo sweet spot.

Il problema più profondo è che gli AI Overview riassumono il sapere SEO convenzionale su un argomento, e l’AI tracking è un tema in cui il sapere convenzionale è indietro di 12 mesi. L’Overview è un indicatore ritardato, non anticipatore.

Piano di rollout di 4 settimane per un piccolo team

Se parti da zero, il primo mese conta più di tutto. Distribuisci il lavoro così.

Settimana 1: audit manuale. Scegli i tuoi 15-20 prompt. Eseguili una volta su tutti e cinque i motori. Crea il foglio di baseline. Annota tre cose che non sapevi: un concorrente che compare spesso, una query in cui la risposta è sbagliata sulla tua categoria, un prompt in cui nessuno del tuo settore viene citato.

Settimana 2: scegli un motore di partenza. Resisti alla tentazione di tracciare tutto subito. Per la maggior parte dei brand SaaS e B2B, Perplexity è il motore giusto da cui partire: massima densità di citazioni, formato più stabile, più facile da automatizzare. Imposta run giornaliere automatizzate per i tuoi 20 prompt su Perplexity. Archivia risposte e URL citati in una tabella.

Settimana 3: aggiungi ChatGPT e Claude. Quando Perplexity è stabile, integra le altre due superfici native. Prima ChatGPT per il volume, poi Claude per la qualità del segnale. Salta per ora Google AI Mode e Gemini: sono più difficili da tracciare in modo affidabile senza API che la maggior parte dei team non ha.

Settimana 4: scrivi il template di report. La parte più dura del tracking AI non è raccogliere dati, ma produrre un riepilogo settimanale di una pagina su cui tutti possano agire. Il report deve rispondere a quattro domande: quali prompt hanno guadagnato citazioni, quali le hanno perse, com’è la share di citazione rispetto ai tre principali concorrenti, qual è un’azione di contenuto per la settimana successiva.

Layout di un report settimanale AI mention su una pagina con quattro quadranti: citazioni guadagnate, citazioni perse, share of voice vs concorrenti e intervento di contenuto raccomandato
Il template di report settimanale. Quattro quadranti, una pagina. Se non sta in una pagina, il team non lo leggerà.

Dopo la settimana 4 hai un programma funzionante. L’espansione è lineare: più prompt, più motori, analisi di sentiment più profonda, A/B test sugli interventi di contenuto rispetto agli outcome di citazione tracciati.

Cosa fare davvero con i dati

Un tracking che non cambia i contenuti è teatro. Il loop di intervento deve chiudersi.

Tre pattern di intervento sono abbastanza affidabili da essere ripetuti. Il "rescue" della citazione persa: quando un prompt che ti citava smette di farlo, trova la nuova pagina citata e individua cosa contiene che alla tua manca. Di solito un dato specifico, una tabella di confronto o un aggiornamento recente. Aggiorna la tua pagina, aspetta una settimana, ricontrolla. Vediamo la citazione tornare in circa metà dei casi entro 7-14 giorni.

Il pattern "competitor displacement": prompt in cui un concorrente è citato e tu no, ma il contenuto citato è debole. Una pagina che viene citata perché non esiste niente di meglio è un’occasione per scalzarla pubblicando qualcosa di superiore. È il lavoro AI a maggior payoff che molti team ignorano perché richiede di leggere le citazioni dei concorrenti invece che le proprie.

Il pattern "categoria senza citati": prompt in cui la risposta AI tratta correttamente la tua categoria ma non cita nessuno che riconosceresti. È un topic con copertura autorevole scarsa; il brand che pubblica il riferimento canonico tende a prendersi una quota di citazioni sproporzionata quando il modello si ri-addestra o aggiorna l’indice. Le guide correlate su ottimizzare per le citazioni negli AI Overviews e su come la multisource SEO fa emergere il tuo brand nelle AI spiegano la forma di contenuto che guadagna citazioni; il tracking indica dove applicarla.

Se vuoi una lettura terza su quanto il tuo brand sia già citabile sui motori prima di costruire il programma, il pezzo su AI visibility audit methodology mostra una versione da un giorno dell’audit manuale.

Domande frequenti

Con quale frequenza i motori AI aggiornano le loro fonti di citazione? ChatGPT e Perplexity si aggiornano praticamente a ogni query perché richiamano la ricerca live; l’insieme di fonti può cambiare in pochi minuti. Gemini e AI Mode usano anch’essi retrieval live. Le citazioni di ricerca web di Claude sono analogamente live. I pesi del modello si aggiornano ogni pochi mesi, ma le fonti recuperate si muovono molto più rapidamente.

Posso tracciare le menzioni AI senza una API key per ogni motore? In parte. Perplexity, OpenAI e Anthropic offrono API a pagamento. Google AI Mode non ha una API pubblica per l’esperienza chat, quindi il tracking di AI Mode e AI Overview avviene tramite scraping dei risultati. La maggior parte dei team parte dalle API di ChatGPT, Claude e Perplexity, poi aggiunge le superfici Google tramite un vendor.

I motori AI attingono dalle mie posizioni su Google o da altre fonti? Da entrambe. Perplexity ha un proprio crawler; ChatGPT usa l’indice di Bing per la ricerca web; Claude usa la sua infrastruttura di web search; Google AI Mode e Gemini attingono all’indice Google più il Knowledge Graph. Posizionarsi bene su Google aiuta in AI Mode e Gemini, aiuta meno in ChatGPT e aiuta pochissimo in Perplexity.

Qual è un tasso di citazione realistico da puntare? Dipende dalla categoria. Per i prompt brandizzati (con il nome del brand) è raggiungibile l’80-100% di citazione sui motori. Per i prompt di categoria (senza brand) anche i brand forti stanno al 20-40%. Oltre il 40% in una nicchia competitiva è eccellente.

LLMs.txt o lo schema markup spostano davvero l’ago? Lo schema markup aiuta Google AI Mode e gli AI Overviews perché usano il Knowledge Graph. LLMs.txt ha prove contrastanti. Il fattore di contenuto più importante su tutti i motori è avere contenuto autorevole, chiaro, ben strutturato e aggiornato di recente.

In cosa questo differisce dal social listening? Gli strumenti di social listening (Brand24, Mention, Sprinklr) scandagliano l’open web e le piattaforme social. Il mention tracking AI analizza le risposte generate nei motori di chat, che non vengono mai indicizzate dagli strumenti social. Entrambi servono in uno stack di misurazione del brand; nessuno sostituisce l’altro.

<script type="application/ld+json"> { "@context": "https://schema.org", "@type": "FAQPage", "mainEntity": [ { "@type": "Question", "name": "Quanto spesso i motori AI aggiornano le fonti di citazione?", "acceptedAnswer": { "@type": "Answer", "text": "ChatGPT e Perplexity si aggiornano praticamente a ogni query perché usano la ricerca live. Gemini e AI Mode sfruttano ugualmente il retrieval live. Anche le citazioni di ricerca web di Claude sono in tempo reale. I pesi di modello cambiano meno frequentemente, di solito ogni pochi mesi, ma le fonti recuperate per una data risposta si muovono molto più velocemente." } }, { "@type": "Question", "name": "Posso tracciare le menzioni AI senza chiavi API per ogni motore?", "acceptedAnswer": { "@type": "Answer", "text": "In parte. Perplexity, OpenAI e Anthropic offrono API a pagamento. Google AI Mode non dispone di una API pubblica per la chat, quindi il tracking di AI Mode e AI Overview si effettua di solito tramite scraping dei risultati. La maggior parte dei team parte dalle API di ChatGPT, Claude e Perplexity e aggiunge le superfici Google tramite un vendor." } }, { "@type": "Question", "name": "I motori AI attingono dai ranking Google o da altre fonti?", "acceptedAnswer": { "@type": "Answer", "text": "Da entrambe. Perplexity ha un proprio crawler; ChatGPT usa l'indice Bing; Claude impiega la sua infrastruttura di web search; Google AI Mode e Gemini combinano l'indice Google con il Knowledge Graph. Un buon ranking su Google aiuta in AI Mode e Gemini, meno in ChatGPT e pochissimo in Perplexity." } }, { "@type": "Question", "name": "Quale tasso di citazione è realistico?", "acceptedAnswer": { "@type": "Answer", "text": "Per i prompt che includono il tuo brand, un valore tra l'80 e il 100 percento sui vari motori è raggiungibile. Per i prompt di categoria senza brand, anche i marchi forti si attestano fra il 20 e il 40 percento. Superare il 40 percento in una nicchia competitiva è eccellente." } }, { "@type": "Question", "name": "LLMs.txt o schema markup influiscono sulle citazioni?", "acceptedAnswer": { "@type": "Answer", "text": "Lo schema markup è utile per Google AI Mode e AI Overviews in quanto sfruttano il Knowledge Graph. L'utilità di LLMs.txt è ancora poco chiara. Il fattore più determinante resta avere contenuti autorevoli, ben strutturati e aggiornati di recente." } }, { "@type": "Question", "name": "In cosa il mention tracking AI differisce dal social listening?", "acceptedAnswer": { "@type": "Answer", "text": "Gli strumenti di social listening scandagliano l'open web e i social. Il mention tracking AI esamina le risposte generate dai motori di chat, che non sono indicizzate da quegli strumenti. Entrambi servono in uno stack di misurazione del brand; nessuno sostituisce l'altro." } } ] } </script>