Capire se un sito web è stato indicizzato da Google, insieme alle pagine più importanti, è fondamentale perché questo è il primo passo per migliorare il posizionamento nella serp.
Che cos’è l’indicizzazione su google?
Ti sei mai chiesto come fa Google a conoscere tutto quello che c’è sul web?
Lo fa scansionando le pagine internet con uno spider (il Googlebot), e aggiungendo al proprio indice quelle che ha scoperto per la prima volta.
Sei ancora più confuso vero?
Ti spiego meglio il significato di alcuni dei termini che ho appena utilizzato:
- l’indice di Google è un grande database che raccoglie le informazioni su tutte le pagine scansionate dal motore di ricerca;
- gli spider sono dei programmini progettati per eseguire le scansioni su larga scala;
- Googlebot, infine, è il nome dello spider di Big G.
Fai una ricerca per nome brand su Google
Per verificare l’indicizzazione dei siti web puoi fare una ricerca più semplice, ovvero digitando il nome brand. Magari tra virgolette se è composto da più parole.
Questo non è il metodo più preciso ma ti dà un primo riferimento rispetto allo stato dell’indexing. Sia per quanto riguarda le pagine internet che per le immagini collegate.
Verifica l’indicizzazione con l’operatore site:
Un metodo per controllare l’indicizzazione di un sito web su Google: copia il nome dominio completo della root, la home e vai su Google. Nel campo di ricerca scrivi site:
e incolla l’URL del tuo sito web. Devi fare così:
site:http://www.witag.it/
La verifica dell’indicizzazione dei siti internet, in questo modo, è semplice. Se tutto è andato nel modo giusto troverai la home page come primo risultato e a seguire tutte le pagine che Google ha scoperto, scansionato e indicizzato nella sua attività.
Come scoprire le pagine indicizzate su Google?
Usa la Google Search Consolle
Nella Search Console potrai accedere allo strumento Copertura indice per conoscere tutti i dettagli relativi alle pagine indicizzate e ai problemi di scansione.
In questo report, vedrai le tue pagine raggruppate in base al tipo di errore o warning rilevato.
Vedrai, cioè, un elenco di errori e problemi con il relativo numero di pagine che presentano quel problema.
Cliccando su una riga, visualizzerai l’elenco di URL interessati da quell’avviso.
Troverai una spiegazione del tipo di errore, appunto, nella colonna Tipo.
Questa colonna sarà molto importante per capire cosa può esserci che non va nelle tue pagine.
Dal rapporto Copertura potrai quindi vedere quali pagine sono indicizzate su Google e quali invece non lo sono. Potrai anche scoprire quali motivi hanno portato a non indicizzarle.
Elenco pagine indicizzate
Per visualizzare l’elenco delle pagine indicizzate del tuo sito, accedi alla Search Console e apri il rapporto Copertura che trovi sotto Indice nel menu sulla sinistra.
Nel grafico, puoi selezionare le varie sezioni Errore, Valide con avvisi, Valide e Pagina esclusa.
Seleziona Valide e deseleziona tutte le altre.
Questo report ti mostrerà tutte le pagine del tuo sito che sono state indicizzate correttamente.
Il grafico visualizzerà il numero esatto delle pagine indicizzate.
Problemi di indicizzazione? Forse la causa è il file robots.txt
A volte, Google non indicizza le pagine web perché sta seguendo le istruzioni riportate su robots.txt, un file presente in ogni sito che contiene delle indicazioni per gli spider. Verifica che la causa dei tuoi problemi non sia proprio questo elemento.
Per farlo, digita sulla barra degli indirizzi del browser il seguente URL: nomedeltuosito/robots.txt . All’interno del file controlla l’eventuale presenza di queste stringhe:
- User-agent: Googlebot Disallow: /;
- User-agent: * Disallow: /.
Se le rilevi, eliminale e salva il file robots.txt: adesso il problema dovrebbe essere risolto.