seojuice

Come ottimizzare il tuo sito web per gli strumenti di IA

Lida Stepul
Lida Stepul
· Updated · 13 min read

TL;DR: Gli strumenti di IA citano le pagine che riescono a interpretare, non quelle che “posizionano”. La maggior parte dei siti pubblica già contenuti invisibili a ChatGPT, Perplexity e Bing Copilot perché la struttura è sbagliata, non perché il testo sia scarso. Di seguito: cosa è cambiato sul nostro sito dopo 20 minuti di correzione dello schema in una sola pagina, le tre statistiche che spiegano perché conta (Semrush, Profound, NYT), cosa sistemare questo mese e quali acquisti di “AI SEO” rimpiango.

Aggiornato a maggio 2026. Rinnovato con dati sul volume di citazioni attribuite (Semrush, Profound, NYT), una sezione su llms.txt e una metodologia documentata per il case study della pagina /data.

Ho scritto questo articolo perché monitoriamo le citazioni da IA per i clienti di SEOJuice e l’unico modo per fidarmi di ciò che stavo consigliando era testarlo prima su seojuice.io. Il risultato mi ha sorpreso. La nostra homepage veniva citata per “che cos’è SEOJuice” ma due delle pagine più utili (la pagina di esplorazione /data e la landing /tools) non comparivano affatto su Perplexity per query che avrebbero dovuto dominare. La correzione ha richiesto meno lavoro del previsto. Inquadrare correttamente il tema è stato più lungo.

[IMMAGINE: screenshot Perplexity affiancato — a sinistra “Che cos’è SEOJuice?” con citazione; a destra “migliori tool di dati SEO per SaaS” senza citazione. Scattato il 14/02/2026.]

Perché vale la pena occuparsi delle citazioni da IA nel 2026

Tre numeri, poi la mia opinione.

1. Semrush ha analizzato 10.000 query informative alla fine del 2025 e ha trovato Google AI Overviews presenti nell’88% di esse, con l’85,79% degli URL citati posizionati nella top 10 dei risultati organici. Il resoconto completo è sul blog di Semrush. Il segnale: se non sei già in classifica, è statisticamente improbabile che tu venga citato. Ma posizionarsi non basta, ed è per questo che l’impostazione di questo articolo è importante.

2. Il New York Times ha registrato un calo del 36,5% anno su anno dei click provenienti da risultati di ricerca influenzati dall’IA verso gli editori di news all’inizio del 2026, riassunto nell’analisi di SEO Sherpa sugli AI-search-engine. Il traffico non è sparito. È stato assorbito dal box di risposta.

3. La ricerca sui consensus signal di Profound (pubblicata nel Q4 2025) ha rilevato che le pagine citate da ChatGPT, Perplexity e Bing Copilot per la stessa query si sovrappongono solo nel 12% dei casi, il che significa che ogni motore decide in parte in modo indipendente chi citare. Non puoi ottimizzare per uno e dare per scontato che gli altri seguano.

La mia opinione: non serve “più SEO”, serve ristrutturare tre o quattro pagine affinché il modello linguistico abbia qualcosa da estrarre. L’abbiamo fatto sulla pagina /data e il risultato è stato misurabile, ci arrivo tra un attimo.

La ricerca basata su IA non è la ricerca tradizionale

La maggior parte delle persone scrive ancora contenuti come se dovessero impressionare Google nel 2015: infilano qualche keyword, allungano il testo, mettono un H1 e pubblicano. Così finisci a pagina 3 di una SERP che nessuno legge e ottieni zero citazioni su ChatGPT o Perplexity.

Questi modelli non classificano siti web. Recuperano, riassumono e, a volte, citano in base a quanto chiaramente riescono a comprendere e riproporre il tuo contenuto. L’obiettivo non è più solo “posizionarsi su Google”, ma “essere citabili da qualunque macchina che legga la tua pagina”.

CaratteristicaRicerca GoogleChatGPT / Perplexity / Bing AI
Metodo di indicizzazioneBasato su keyword e linkCorrispondenza semantica basata su embedding (a metà 2026; le architetture evolvono)
Comportamento utenteClick e lettura veloceLegge il riepilogo; clicca meno del 10% delle volte, per il panel SparkToro 2026 sulla ricerca IA
Selezione della paginaRanking algoritmicoRecupero su un set di candidati ridotto, poi citazione euristica
Formato di outputElenco di pagineRisposte, citazioni, contenuto diretto
Stile di contenuto idealeArticoli ottimizzati SEOConciso, strutturato, leggibile dalla macchina

Ho testato la cosa lo scorso trimestre. Ho chiesto a Perplexity: “Che cos’è SEOJuice?” e ho ottenuto una buona risposta che citava la nostra homepage. Poi ho chiesto: “Quali sono i migliori strumenti SEO per i founder SaaS?” Sono usciti due nostri concorrenti. Noi no. Ho riformulato la query in quattro modi. Ancora niente. Allora ho chiesto a Perplexity di descrivere ciascuno dei tre brand restituiti. Due risposte erano dettagliate. Una era vaga, quasi inutile. Quelle pagine erano piene di marketing fluff e contenuti renderizzati in JavaScript; visivamente migliori delle nostre, ma con una struttura peggiore.

Quel test ha cambiato il mio modo di pensare ai contenuti. La nostra pagina (la fonte autorevole) era invisibile non perché il testo fosse sbagliato, ma perché non facilitava al modello l’estrazione di una frase.

«La citazione è il nuovo backlink. La valuta sono risposte strutturate ed estraibili, non solo l’autorità di dominio.» — Aleyda Solis, nella sessione sulla ricerca IA, novembre 2025 a BrightonSEO.

La pagina /data: un prima e dopo reale

Questo è il case study su cui si regge il resto dell’articolo; ecco il metodo nel dettaglio.

Pagina: seojuice.io/data/. Stato al 20/01/2026: griglia Tailwind di widget di dati, nessun blocco FAQ, nessuno schema oltre a Article. Bing Webmaster Tools la segnalava indicizzata. Perplexity mostrava zero citazioni per tutte le 12 query che tracciavo.

Cosa ho cambiato (in 20 minuti, il 22/01/2026):

  • Aggiunto in fondo un blocco FAQPage JSON-LD con 3 domande (circa 118 righe di JSON-LD; le domande erano “Cosa mostra la pagina dati di SEOJuice?”, “Ogni quanto si aggiornano i dati keyword?”, “Posso esportare i dati?”).
  • Riscritto l’H1 da “Data” a “Dati SEO: metriche di keyword, pagina e citazione in un’unica dashboard.”
  • Aggiunta una definizione di due frasi subito sotto l’H1 (“La pagina dati di SEOJuice raggruppa… Si aggiorna ogni…”).
  • Nient’altro. Nessun nuovo testo nel resto della pagina.

Come ho misurato le citazioni: test manuale di prompt in Perplexity, 12 query fisse eseguite ogni settimana. Le 12 query erano un mix di brand (“che cos’è la seojuice data page”), categoria (“dashboard di tracciamento citazioni SEO”) e funzionalità (“esporta dati di citazione Perplexity in CSV”). Le ho lanciate in una finestra privata con cache pulita, ho copiato i risultati in un Google Sheet e ho etichettato ogni risposta che linkava seojuice.io come citazione. Niente tool sofisticati. Solo un foglio.

Risultato: al 05/02/2026 (poco più di due settimane dopo) tre delle 12 query inserivano la pagina /data nell’elenco delle fonti di Perplexity. Non erano query che avevo preso di mira. Due di esse non avevo nemmeno pensato di coprirle con una pagina dedicata. All’IA serviva il suggerimento strutturale; il contenuto c’era già.

Non sono sicuro che sia stato solo lo schema a causare il cambio. Il nuovo H1 e la frase di definizione hanno quasi certamente aiutato, e ho applicato tutti e tre gli interventi la stessa mattina. Se dovessi rifarlo, li separerei di una settimana. Ma la direzione è chiara: la correzione strutturale è stato lo sblocco più economico.

Come gli LLM “vedono” i tuoi contenuti

Un modello non fa crawling del tuo sito. Legge le pagine, spesso fuori contesto, e crea una rappresentazione interna di ciò che ogni pagina significa. Premia chiarezza, struttura semantica e frasi quotabili. Introduzioni lunghe: inutili. Lingua da brand: saltata. Si concentra su definizioni, riepiloghi, FAQ, liste how-to e intestazioni pulite di sezione.

Prova così: apri Perplexity e chiedi, “Che cos’è (nome della tua azienda)?” Verifica se compare il tuo sito. Se no, è il problema che stiamo risolvendo.

Perché (probabilmente) sei invisibile alla ricerca IA

Se la tua pagina sembra un muro di testo, con descrizioni prodotto vaghe, frasi di marketing ripetitive e zero dati strutturati, gli strumenti di IA non ti citeranno. Anche se sei la fonte migliore. Non vedono il tuo valore a meno che tu non lo espliciti come se dovessi spiegarlo a uno stagista senza contesto e con 3 secondi di attenzione.

llms.txt e accesso dei crawler

Se hai letto altre guide AI-SEO quest’anno, avrai visto menzionare llms.txt. Ecco la versione pratica.

llms.txt è un file proposto (pensa a un robots.txt per i modelli linguistici) che vive in /llms.txt e indica ai sistemi di IA quali contenuti del tuo sito sono più importanti, in un formato testuale che possono leggere senza renderizzare JavaScript. La proposta è uscita da Answer.AI a fine 2024 ed è stata ripresa da Anthropic nella loro documentazione su docs.anthropic.com/llms.txt.

Valutazione onesta: non so ancora se serva a qualcosa. Il dibattito su r/SEO e su Twitter SEO per tutto il 2025 è stato diviso. Alcuni professionisti hanno segnalato segnali deboli dopo averlo aggiunto; altri hanno condotto test controllati e non hanno visto nulla. La mia lettura, a maggio 2026, è che costa poco (un file di testo, 10 minuti per un sito piccolo) e comporta pochi rischi, quindi lo inserisco. Non aspettarti un aumento di citazioni da llms.txt da solo.

L’accesso dei crawler è più concreto. PerplexityBot, ChatGPT-User, ClaudeBot e GPTBot sono gli user-agent che vedrai nei log. BingPreview di Bing serve indirettamente Perplexity e Copilot tramite l’indice di Bing, quindi assicurarti che Bing possa effettuare il crawl è l’azione con il miglior rapporto sforzo/beneficio. Invia la tua sitemap a Bing Webmaster Tools. Controlla nei log che i bot sopra non siano bloccati dal WAF o dal tuo CDN. Ho visto l’interruttore “Block AI bots” di Cloudflare attivato per errore in tre siti clienti nel 2025; quel singolo switch ha reso inutile tutto il resto descritto in questo articolo.

Anatomia di una pagina a prova di IA

Ottimizzare per ChatGPT, Perplexity o Bing AI non significa ingannare un nuovo algoritmo. Significa progettare i contenuti come se fossero letti da una macchina senza tempo per le sfumature. La tua pagina deve quindi rendere l’estrazione facile.

Un argomento chiaro per pagina

Ogni URL dovrebbe trattare un solo argomento, senza deviazioni. ChatGPT preferisce risposte pulite e non ambigue. Se una tua pagina copre cinque servizi, tre digressioni e la storia del founder, verrà saltata.

Buono: tp-link.com/us/support/faq/2680/ ("Come ripristinare un router TP-Link") — intento unico, pagina in stile FAQ, posiziona e viene citata perché URL, H1 e contenuto rispondono alla stessa domanda.
Scarso: yourdomain.com/support con un blob FAQ da 20 voci — risposte sepolte, il modello non capisce quale corrisponde alla query.

Dati strutturati (markup schema)

Gli LLM usano lo schema per capire al volo di cosa parla la pagina. Usa FAQPage per blocchi domanda/risposta, Article per contenuti editoriali, Product per SKU, HowTo solo per pagine davvero procedurali con passaggi numerati.

Una rettifica a ciò che dissi a un cliente nel 2025: avevo consigliato di aggiungere lo schema HowTo a tutte le pagine di supporto come default. È stato un boomerang. Google ha segnalato alcune pagine non procedurali con un avviso manuale sui rich result e abbiamo dovuto fare rollback. HowTo è per contenuti “passo 1, passo 2, passo 3”. Usalo dove ha senso, non come soluzione universale.

Strumento: inserisci il tuo URL in validator.schema.org per controllare che lo schema venga letto.

Usa blocchi di contenuto citabili

L’IA estrae da blocchi. Rendi quei blocchi evidenti: punti elenco, passaggi numerati, definizioni, frasi brevi (soprattutto in alto) e FAQ con domande in grassetto e risposte chiare.

D: Che cos’è SEOJuice?
SEOJuice è uno strumento di ottimizzazione dei siti che individua problemi tecnici di SEO e offre correzioni passo-passo classificate per impatto sul traffico.

Quel blocco è citabile, estraibile, pronto per la quota. Lo stesso contenuto riscritto in un paragrafo non lo sarebbe.

Anti-pattern comuni (e soluzioni)

ErroreSoluzione
Titoli vaghi come "Solutions"Riformula come query dell’utente: "Come il nostro X risolve Y per Z?"
Meta title ≠ H1 on-pageFalli combaciare entro 10 caratteri; segnali misti riducono la fiducia
Header in MAIUSCOLO / stile CSSUsa veri tag H2/H3; lo stile CSS non ha peso semantico
Intro generiche ("Nel mondo di oggi…")Inizia con la risposta nella prima frase
Keyword stuffingSostituisci con un’affermazione forte sul tema più tre esempi concreti

Ottimizza per il recupero, non solo per il ranking

Non stai scrivendo per un crawler. Stai scrivendo per una macchina che comprimerà il tuo contenuto in un riassunto di due frasi e, se sei fortunato, citerà il tuo dominio alla fine.

Agli LLM non importano backlink o densità keyword nel senso tradizionale, anche se esiste ancora una correlazione indiretta: le pagine con buoni backlink tendono a posizionarsi, e quelle che posizionano finiscono nel set di recupero. I dati di Profound 2025 suggeriscono che la correlazione è reale ma blanda. La vera domanda è: il modello può sollevare il tuo contenuto in un answer box pulito senza doverlo riscrivere in modo incomprensibile?

Scrivi così:

"Per resettare il router, scollegalo per 10 secondi, poi ricollegalo. Attendi 60 secondi prima di testare la connessione."

Non così:

"Resettare un router è qualcosa che gli utenti possono considerare quando incontrano problemi. Un possibile passo è scollegare il dispositivo per un breve periodo."

La prima versione è citabile. La seconda viene ignorata o parafrasata male.

Tornando al test su Perplexity di cui parlavo all’inizio: confrontando la nostra pagina con quelle dei due concorrenti citati, la loro qualità vincente era proprio questa. Le definizioni erano concise, i verbi attivi e le frasi potevano essere estratte tali e quali. La nostra pagina conteneva le stesse informazioni nascoste sotto tre paragrafi di preambolo. Il modello non aveva nulla di pulito da afferrare.

Consiglio: ogni paragrafo deve guadagnarsi il posto

Gli LLM leggeranno le prime righe di una sezione, prenderanno punti elenco e passaggi numerati, ignoreranno le introduzioni prolisse e salteranno le informazioni sepolte a meno che non siano in lista o chiaramente etichettate.

Come scrivere contenuti citabili e pronti alla risposta

Pensa a ogni sezione del tuo sito come a un potenziale answer box. Il tuo compito: rendere la risposta ovvia, estraibile e priva di rischi di allucinazioni o riscritture da parte dell’IA.

Quando ho riscritto la nostra pagina /pricing da elenco di funzionalità a prosa guidata da definizioni, a marzo 2026, il bounce rate è sceso dal 78% al 61% nei 21 giorni successivi. Stesso traffico, stessa offerta, struttura diversa. I visitatori l’hanno apprezzata per lo stesso motivo per cui lo fa un modello: la risposta era in alto, il resto era contesto di supporto.

Inizia con la risposta

Fai così: "SEOJuice è uno strumento di ottimizzazione dei siti che analizza i problemi tecnici di SEO e consiglia correzioni classificate in base all’impatto potenziale sul traffico."

Non fare così: "La SEO è complicata. Molti strumenti cercano di semplificarla, ma pochi ci riescono. Entra in scena SEOJuice, un nuovo approccio che…"

Gli LLM non aspetteranno il tuo colpo di scena. Passeranno oltre.

Usa strutture pulite e ripetibili

  • FAQ: perfette per il matching semantico.
  • Elenchi puntati: facili da analizzare e citare.
  • Istruzioni passo-passo: apprezzate da Perplexity, soprattutto con schema HowTo quando la pagina è davvero procedurale.
  • Definizioni: spiegazioni chiare e dirette di 1-2 frasi.

Pensa come un prompt

Ogni H2 della tua pagina dovrebbe valere anche come query dell’utente.

Vecchio headerHeader adatto all'IA
"Benefici""Quali sono i benefici di usare SEOJuice?"
"Come funziona""Come SEOJuice esegue l’audit del tuo sito?"
"Funzionalità""Quali funzionalità offre SEOJuice?"

Cosa sistemare adesso e cosa saltare

Non trasformare questo in una tana da 40 ore. Non serve rifare tutto il sito. Devi rendere recuperabili quattro-sei pagine. Parti da quelle con molte impression e alto bounce; sono già nel set candidato ma stanno fallendo il passaggio di citazione.

Sistema subito

  1. Aggiungi blocchi FAQ. Due o tre domande per ogni pagina ad alto traffico. Pensa: “Cosa fa questo prodotto?”, “In cosa è diverso?”, “Come lo uso?”
  2. Pulisci gli header. Ogni H2 deve rispondere chiaramente a una domanda o definire un concetto.
  3. Usa lo schema markup. FAQPage e Article sono le vittorie facili. HowTo solo per contenuto realmente procedurale.
  4. Invia la sitemap a Bing Webmaster Tools. Perplexity e Bing Copilot attingono dall’indice di Bing. Se non sei indicizzato lì, non esisti.
  5. Testa i tuoi contenuti su Perplexity e ChatGPT. Usa il metodo manuale delle 12 query descritto nella sezione /data. Un foglio basta.

Una cosa su cui ho sprecato soldi

Ho speso 200 $ per un popolare SaaS di “tracciamento citazioni IA” a febbraio 2026 (non lo nominerò, ma se hai cercato in questa categoria lo avrai visto). La dashboard diceva che seojuice.io veniva citato in dozzine di risposte IA sui motori monitorati. Quando ho rifatto manualmente un campione di 20 prompt che lo strumento indicava come citati, solo tre in realtà ci restituivano in Perplexity o ChatGPT reali. Nella maggior parte degli altri casi il dato era obsoleto, la citazione apparteneva a una pagina diversa del nostro dominio, o il prompt era talmente oscuro che non emergerebbe mai in uso reale.

Ho provato altri due di questi tool. Stesso schema: conteggi di citazioni alti che non superavano un controllo manuale. Su un piccolo campione di pagine monitorate con tre tool, i numeri principali erano ottimistici da 4 a 10 volte. La mia posizione attuale: finché gli strumenti non maturano, meglio un Google Sheet, una lista di 20 prompt che i clienti reali usano davvero e una revisione manuale settimanale di 15 minuti. Forse nel 2027 saranno fantastici. Ora non lo sono.

Rimanda per ora

  • Inseguire solo i ranking keyword tradizionali. Agli LLM non importa se ti posizioni #6 per “miglior CMS”. Importa se lo definisci chiaramente con parole tue su una pagina che comunque si posiziona tra la prima e la seconda pagina.
  • Riscrivere tutto in lunghi testi prolissi. La lunghezza non è chiarezza. Gli strumenti di IA premiano passaggi densi e ad alto segnale.
  • Fissarsi su micro-ottimizzazioni di page speed. Finché la pagina si carica e non è bloccata da JS, va bene. Prima risolvi la crawlabilità.
  • Comprare ora tool di citazione IA. Vedi sopra. Metti alla prova gli strumenti con un set noto di prompt prima di pagare.

FAQ (ottimizzate per il recupero LLM)

Queste non sono solo per i lettori. Sono blocchi di risposta citabili dalle IA.

Cosa rende un contenuto citabile da strumenti IA come ChatGPT o Perplexity?

Un contenuto citabile è chiaro, strutturato e autonomo: definizioni brevi, elenchi puntati, FAQ e risposte dirette. Gli strumenti IA citano ciò che possono estrarre pulitamente. L’analisi Semrush 2025 sugli AI Overviews ha riscontrato che l’85,79% degli URL citati si trova nella top 10 dei risultati organici, quindi il posizionamento tradizionale resta il prezzo d’ingresso.

Come posso verificare se i miei contenuti vengono citati da strumenti IA?

Esegui ogni settimana prompt di brand e di categoria in Perplexity e Bing Copilot. Mantieni in un foglio un elenco di 10-15 prompt e tagga ogni risultato con gli URL citati. Verifica a campione le affermazioni di qualsiasi tool di terze parti confrontandole con sessioni reali prima di fidarti della dashboard.

Devo riscrivere tutti i miei vecchi contenuti?

No. Parti dalle pagine più preziose: alto numero di impression, alto bounce o contenuti cornerstone. Aggiungi blocchi FAQ, ristruttura gli header, semplifica le intro. Coprirai così la maggior parte del valore.

Il markup schema è obbligatorio per comparire negli strumenti di ricerca IA?

Non è strettamente obbligatorio, ma migliora sensibilmente la visibilità. Lo schema dice all’IA di cosa parla la tua pagina senza farle indovinare. FAQPage e Article sono le scelte sicure; HowTo solo per contenuti realmente procedurali.

Ottimizzare per l’IA danneggerà la mia SEO tradizionale?

No. Se fatto bene, aiuta entrambi. Contenuti strutturati e citabili si posizionano meglio, guadagnano più backlink e ora vengono anche esposti dai motori IA.

Che cos’è llms.txt e dovrei aggiungerlo?

È un file di testo in /llms.txt che segnala ai crawler IA quali pagine sono più importanti. La proposta è nuova (fine 2024) e l’impatto pratico è poco chiaro a maggio 2026. Costa poco aggiungerlo, comporta pochi rischi ed è consigliabile se hai 10 minuti; non aspettarti risultati eclatanti solo da esso.