Dreamhost me obliga a vivir sin Google

Sé que criticar al hosting de nuestros blogs es un tema recurrente y que a menudo lo hacemos. Hoy me toca a mí (no les dedicaba un post desde agosto, aunque esto es mucho más grave). Espero les sirva de algo si tienen pensado pasarse a un hosting no gratuito.

La situación es la siguiente: durante la semana pasada estuve de descanso, como casi todo el mundo; tuve el privilegio de apagar el ordenador. Sucede que Dreamhost pensó que mi blog estaba sobrecargando el servidor y así me lo notificó. Yo revisé el tráfico del blog y parecía normal, las visitas habituales y no había ni «efecto meneame» ni «efecto barrapunto» de por medio. La solución al «enigma» resultó ser GoogleBot rastreando a fondo esta web para indizarla en sus buscadores.

El problema es que este enigma resultó solucionarse demasiado tarde para mí y yo ya estaba fuera de casa. Dreamhost escribió para decirme que habían baneado el la ip de GoogleBot y todo un rango de ip’s (presumiblemente también de Google u otros buscadores) vía «.htaccess». Yo no he tenido acceso a mi hosting hasta hoy y ahora resulta que tras 6 días desde que Dreamhost decidiera banear a GoogleBot no tengo ni una visita de Google.

Así de claro. Las visitas durante la semana pasada cayeron un 90%, caída presumiblemente aguda debido también a las fiestas, pero hoy lunes el tráfico es un 75% menor que lo habitual. Y esta web ha sido penalizada y no aparece en ninguna de las búsquedas en que solía aparecer muy bien colocada (de milagro seguimos saliendo primeros para buscar versvs. Aún cabe mencionar que este blog no tiene vocación comercial (y que para lo que ingresamos por publicidad, no vale la pena preocuparse muchísimo por ello) pero que es mediante la publicidad que pago los gastos de mantenimiento y alojamiento.

Estoy cabreado porque esta caída de visitas no se corresponde con «mi realidad», quiero decir: el blog sigue actualizándose, creo que cada vez me gustan más mis anotaciones (ya ya, egobloguero) y todo ello se comprueba si tenemos en cuenta que los enlaces entrantes aparecen con cierta frecuencia. Pero sucede que una mala actuación de mi proveedor de alojamiento me ha dejado completamente ciego frente a Google.

Por supuesto que lo más importante son personas que te siguen habitualmente, pero es que tener la posibilidad de llegar a través de Google a alguien que busca información sobre los temas que tratamos (como el pasaporte electrónico o la RFID por poner sólo un ejemplo) es una de las cosas a las que aspiramos. No es que ayuden a extender el mensaje, es que en una red cada vez más extensa, los buscadores ejemplifican la paradoja de control: la necesidad de una estructura enorme capaz de poner en contacto dos puntos cualesquiera de internet en un tiempo récord. Claro, quedan los enlaces entrantes, pero ciertamente (y eso lo sabe cualquiera que tenga una web) el 80% del tráfico llega a través de buscadores; y puede que sean el 80% inútil de pareto, pero aún en ese caso perderlo por culpa de alguien que no eres tú es una jodienda.

¿Alguien sabe si existe alguna manera de solucionar esto y avisar a los buscadores -mainly Google- de que seguimos vivos y somos «amigables»? Ya dejé el archivo .htaccess como estaba, pero no sé si hay algo más que hacer en mi mano.

Jose Alcántara
Resolviendo problemas mediante ciencia, software y tecnología. Hice un doctorado especializado en desarrollo de hardware para análisis químico. Especialista en desarrollo agile de software. Más sobre Jose Alcántara.

8 comentarios

  1. Dreamhost es de lo peor que hay en hosting. Sobrevenden de un modo descaradísimo. Buscate un hosting decente de acuerdo con lo que necesitas. Media Temple es un hosting bueno (pero caro).

    1. ¡Hola!

      Muchas gracias por la sugerencia. Sé que DH sobrevende, pero de verdad es barato y yo no quiero gastar una pasta en hosting, lo que sucede es que de verdad no les doy problemas (si tuviera 50k visitas diarias seguramente tendría otro hosting porque podría pagarlo). Ha sido una mano «hábil», pero espero solucionarlo pronto… :)

  2. En principio si sólo lo han baneado via .htaccess con dejarlo como estaba antes sobra. Revisa el robots.txt por si acaso hay alguna política de disallow que no estuviese ahí antes y poco más.

    Seguramente tengas que ir a las Google Webmaster Tools a ver si sigues en el índice o te has caído del todo, si es así contacta con ellos explícaselo y a ver si te devuelven a tu sitio. Eso si, ya que estás por las Webmaster Tools aprovecha para bajarle la velocidad de rastreo al googlebot, no vaya a volver a tener un afán loco por rastrear todo tu sitio de nuevo y volváis a las andadas.

    1. Muchas gracias, intentaré revisar todas esas cosillas ahora luego. De momento he visto que el Crawl-delay, que yo creía útil es una «norma ignorada por google bot». Luego les contactaré, de todas formas, para explicarles… porque es una putadilla.

      Muchas gracias, ya te contaré qué tal mis batallitas.

    1. Sí que veo que hay algunas, pero ni de lejos todas… supongo que al haber desbaneado a la araña de Google iré apareciendo poco a poco donde estaba antes… El momento fue un poco cabreante, no me gano nada con esto (más que pagar algunos libros, un vicio que tengo) pero lo peor es que un administrador de sistemas no tenga nada mejor que hacer que tomar una decisión que, de tratarse mi web de un sitio comercial podría tener consecuencias desastrosas… hay que gastar más mesura. Pero el todo a 100 del hosting es lo que tiene :)

  3. Pues yo estoy muy contento con Minerva, quizá deberías echarle un vistazo a lo que ofrecen. Para ser una empresa española no tienen unos precios muy elevados y el servicio es francamente bueno. No ha habido una sola vez que me haya puesto en contacto con ellos en el servicio técnico y que haya salido cabreado, al contrario, han solucionado incluso problemas que no les concernían a ellos directamente. Pásate por su web y les echas un vistazo a los planes y ya me contarás. Teniendo un dominio no te penalizaría un cambio de servidor.

  4. Salud

    Al margen de estas cosas, lo increíble (e intolerable) es la forma en que interpretan el «abuso» del hospedaje contratado, y a primeras de cambio baneen un rango entero de IP tan importante como el de Googlebot… ¿Qué entienden por «sobrecargar el servidor»? ¿Figura expresamente en el contrato como razón para cortar ciertos servicios? Ya he visto en varias bitácoras quejas con DH por interpretar con cierta ligereza el «abuso del servidor» como excusa para no dar todo lo contratado…

    Cambiando un poco de tercio, ¿qué tal otros como BlueHost?

    Hasta Luego ;)

    Una Bitácora de Jomra forma parte de D=a=.

Los comentarios están cerrados.

Este blog usa cookies para su funcionamiento.    Más información
Privacidad