La lunga coda di global translator plugin per wordpress


Quest’estate ho installato il plugin global translator di Davide Pozza e devo dire che  effettivamente il plugin è varemente un qualcosa di geniale, sia come fattura che come utilità. Dopo essere stato indicizzato a dovere da ZioG sembrava proprio che anche all’estero arrivassero sul mio blog. Passato un po’ di tempo però ho cominciato a notare dei piccoli problemi, in primis il fatto che se qualcuno mi commentava in polacco non avrei potuto rispondere.

Una volta che mi son fatto 2 conti in tasca ho deciso di togliere il plugin, per me non era proprio il caso. Da questo punto in poi comincia una dura battaglia con le regole di ZioG, le circa 4.000 pagine in più trovate dallo spider di ZioG andava comunque redirezionate, non possono sparire così dal nulla.

La lunga coda di global translator è questa: a distanza di 6 mesi mi trovo ancora degli errori 404 controllando con i google webmaster tools. 

Questo potrebbe far in modo che ZioG mi penalizzi e,  visto che ultimamente si parla tanto di penalizzazione o di distrazione, ho deciso di mettermi sopra per studiare un modo ove evitare gli errori 404.

Avrei potuto essenzialmente redirezionare con un 301 (moved permanently) alla pagina principale, ma la soluzione non mi sarebbe piaciuta molto, sicchè ho studiato la struttura del permalink creato dal global translator. Prendiamo questi esempi:

Ci sono 5 link errati appartenenti a Tag, Categorie e post:

  • http://www.etechs.it/cs/cs/category/programming/html/
  • http://www.etechs.it/cs/cs/optimizing-wordpressphp/
  • http://www.etechs.it/cs/cs/tag/128-mb-ram/

Tutti riportano due volte la lingua CS, a questo punto basterebbe soltanto togliere tutte le ricorrenze di “/cs/” e lasciare intatto il resto quindi basta un RedirectMatch di questo tipo:

RedirectMatch 301 ^/cs/(.*)$ http://www.etechs.it/$1

Al primo giro toglie il primo “/cs/” rendendo l’url così:

  • http://www.etechs.it/cs/category/programming/html/
  • http://www.etechs.it/cs/optimizing-wordpressphp/
  • http://www.etechs.it/cs/tag/128-mb-ram/

L’url tradotto però deve passare ancora una volta per il redirect e, questa volta, toglie anche il secondo “/cs/” rendendo l’url perfettamente uguale a quella inziale.

  • http://www.etechs.it/category/programming/html/
  • http://www.etechs.it/optimizing-wordpressphp/
  • http://www.etechs.it/tag/128-mb-ram/

Continuando a ragionare in questo modo, si possono ampliare le regole aggiungendo le altre lingue tradotte dal plugin:

RedirectMatch 301 ^/pt/(.*)$ http://www.etechs.it/$1
RedirectMatch 301 ^/cs/(.*)$ http://www.etechs.it/$1
RedirectMatch 301 ^/hr/(.*)$ http://www.etechs.it/$1
RedirectMatch 301 ^/ru/(.*)$ http://www.etechs.it/$1
RedirectMatch 301 ^/de/(.*)$ http://www.etechs.it/$1
RedirectMatch 301 ^/en/(.*)$ http://www.etechs.it/$1
RedirectMatch 301 ^/es/(.*)$ http://www.etechs.it/$1
RedirectMatch 301 ^/fr/(.*)$ http://www.etechs.it/$1
RedirectMatch 301 ^/nl/(.*)$ http://www.etechs.it/$1
RedirectMatch 301 ^/hr/(.*)$ http://www.etechs.it/$1

Oppure, meglio in una riga sola

RedirectMatch 301 ^/(pt|cs|hr|ru|de|en|es|fr|nl|hr)/(.*)$ http://www.etechs.it/$2

Ecco fatto una volta inserita questo redirectMatch all’interno del nostro file .htaccess ZioG non avrà più la possbilità di sbagliare, cioè… sarà in grado di trovare la pagina giusta. Non resta altro che aspettare che ripassi e non darà più errori 404

On Air: FilterIt’s gonna kill me

La lunga coda di global translator plugin per wordpress ultima modifica: 2008-11-18T12:55:59+00:00 da Enrico

16 Comments.

  1. Volendo puoi sempre dai google webmaster tools rimuovere forzatamente le pagine dagli indici, oppure (se proprio non vuoi spaccarti di 301) piazzare un noindex in meta tag.

  2. Se la motivazione di aver tolto il plugin è solo per eventuali commenti stranieri, perchè non lo lasci attivato con solo le lingue che conosci? Massimo poi ti fai aiutare da qualche software di traduzione.

  3. @merlino non mi va proprio di cancellare delle pagine. troppa manutenzione.
    i noindex dove li metto se non ci sono le pagine :)

    @coda infatti non è solo per la questione della lingua. ci sono altre cose in quel plugin che non vanno.

  4. Eh si! GT genera una marea di nuove pagine, nel bene e nel “male”… Quindi come spieghi benissimo nel post non è che lo spegni e finisce tutto lì :-).
    Prossimamente (spero) aggiungero’ una feature che consente di aggiungere del testo custom sulle pagine tradotte, in modo che si possa informare gli utenti che stanno leggendo una traduzione automatica (anch’io ho un sacco di commenti da parte di utenti stranieri, ma non li vedrei come una cosa “negativa” anche se non posso rispondere).

  5. @davide nulla da eccepire, solo che etechs non è per un pubblico internazionale, ad ogni modo m’ha fatto molto piacere il tuo intervento.

    Attendiamo le nuove features allora.

  6. Ciao, ho letto il tuo post e forse ho trovato la soluzione ai miei problemi, in pratica anche io ho utilizzato il suddetto plugin, e ora ho dovuto disintallarlo. Non ricevo più visite da google ho ricevuto sicuramente una penalizzazione per contenuti duplicati infatti il plugin mi ha generato quasi 60 duplicati e tantissimi errori come i tuoi. Ho modificato il file robotz inserendo i /ru/ e tutte le lingue prodotte ed indicizzate. Ma non ho risolto un gran che. Tu applicando questa modifica dopo quanto tempo hai visto i risultati? Potresti darmi una mano? ti ringrazio

  7. Ciao, anch’io uso GTranslator per WP, lo uso solo per tradurre da it a eng, ed effettivamente genera una quantità enorme di pagine \en en\tag ecc. Onde evitare qualsiasi tipo di penalizzazione per contenuti duplicati, visto la sensibilità di mr G., ho aggiunto:
    Disallow: /en/
    in Robots.txt ;)
    ciao ciao

  8. Ho un duplice problema negli errori della sitemap: il primo dovuto al famoso translator,e l’altro non so da dove proviene ma mi genera degli errori di pagine tipo http://www.miosito.it/tag/www.wordpress.org
    Pensavo di escluderle nel seguente modo:

    RedirectMatch 301 ^/(pt|cs|hr|ru|de|en|es|fr|nl|hr)/(.*)$ http://www.comefaccioper.it/$2
    RedirectMatch 301 ^/wordpress.org$ http://www.comefaccioper.it/$2

    Va bene come modifica?e’ indifferente in che posto dell’.htaccess inserisco le regole?
    grazie Valentina

  9. Ho seguito le tue istruzioni nella modifica al .htaccess e ho provveduto a rimandare la sitemap a google per la scansione.
    Una domanda: ma gli errori trovati dalla scansione restano li nelle statistiche? essendo cosi tanti (circa 1500 e tutti relativi al translator) se ci sarà qualche altro errore dovrò sempre cercarlo tra quelle 50 pagine?!
    fatemi sapere! Tara

  10. Ottimo articolo, io sono alle prese con i problemi causati da questo plugin… anche avendolo tolto mi sono ritrovato un sacco di errori 404, ho fatto anche io un paio di redirect per cercare di sistemare la situazione, speriamo bene.

  11. grazie, anch’io ho trovato un sacco di errori dovuti a global translator

    in più ho un sacco di altri errori che proprio non so come risolvere, per esempio nella sitemap ho errori di reindirizzamento,

    e ancora ho un sacco di errori (circa 1000) nella categoria “non trovato” in pratica dopo il link della pagina m’inserisce “%2F%” e ovviamente restituisce l’errore 404 (non trovato)

    puoi aiutarmi a risolvere questi problemi?

  12. Ciao! Complimenti per l’articolo veramente esaustivo.
    Avrei una domanda da farti. Dunque la faccio breve ho usato fino all’altro giorno un plugin simile a GT che pero’ genera un url del tipo http://www.miourl.com/data/titolo.html/CS cioè il codice lingua alla fine della struttura.
    Visto che mi ritrovo con gli stessi errori 404 e che mi hanno consigliato di fare redirect con htacess, mi chiedevo se mi potevi dare qualche consiglio in merito. Diciamo che la mia difficoltà è nel capire come dire di fare redirect a tutte le pagine che terminano con /en/ e /es/
    Grazie in anticipo
    Giacomo

  13. aggirnamento ho trovato la soluzione, che posto qua per chi fosse interessato:
    Ho aggiunto queste due stringhe al htaccess

    RedirectMatch 301 ^(.*)/en/$ http://www.miosito.com$1

    RedirectMatch 301 ^(.*)/es/$ http://www.miosito.com$1

    Sembra funzionare…

    Ho tolto lo slash (/) prima di $1 perchè mi restituiva un doppio //

    ciao

  14. Ciao Andrea, il Global translator ha colpito anche me.
    Traffico aumentato anche dall’estero, ma un sacco di errori 404.
    Volevo utilizzare la tua stessa tecnica però il modo in cui il traduttore crea le mie pagine è diverso da come lo hai descritto tu e non so come agire.
    Nel mio caso i 404 sono relativi a pagine così:

    http://www.nomesito.it/2009/10/29/nome-articolo/2/&rurl=translate.google.com&lang=it&usg=ALkJrhgxr8SDra1HOh9xPgJRPSJyx30jFA

    Cosa ci scrivo nell’htacces?

  15. Ma qui non risponde nessuno ai commenti?

  16. Cambiare la struttura dei permalinks Wordpress - pingback on 19/05/2011 at 5:45 pm

Trackbacks and Pingbacks: