image
Inicio » Weblog » Joaquin's Weblog

M�todo para que Google no indexe p�ginas de error

08.02.2008
Categor�a: — Joaquin @

A veces puede pasar que que hay un error en tu p�gina, pero es un error moment�neo, ya sea porque has reiniciado el servidor o porque hay una sobre carga.

En estos casos es muy desagradable que el robot de Google pase por tu p�gina en ese momneto y te indexe el error, de manera que tu informaci�n real no se almacena en el �ndice de Google perdiendo una cantidad importante de visitas.

Para evitar esto, puede personalizar la p�gina de error para enviar una cabera “503� Servicio momentanemente no disponible”. Hacer esto esmuy sencillo, por ejemplo, para PHP se hace de la siguiente forma:

<?php
ob_start();
header('HTTP/1.1 503 Service Temporarily Unavailable');
header('Status: 503 Service Temporarily Unavailable');
header('Retry-After: 3600');
header('X-Powered-By:');
?><!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<html><head>
<title>503 Service Temporarily Unavailable</title>
</head><body>
<h1>Service Temporarily Unavailable</h1>
<p>The server is temporarily unable to service your
request due to maintenance downtime or capacity
problems. Please try again later.</p>
</body></html>

Os dejo el enlace original en donde se explica en profundidad el env�o de la cabecera 503.


Google hace cloaking???

12.03.2005
Categor�a: — Joaquin @

De ser cierto lo que acabo de leer en webmasterworld.com, el propio Google estar�a haciendo cloaking en sus p�ginas webs.

�Qu� es cloaking? Resumi�ndolo mucho, hacer una p�gina web que proporciona diferente contenido al buscador que a los usuarios.

Esta t�cnica de optimizaci�n de posicionamiento, est� fuertemente penalizada por Google ya que perjudica al usuario.

Actualizado: La noticia se ha confirmado. Google estaba haciendo cloaking.

Si buscabas “traffic estimator” en Google pod�as ver una p�gina cuyo t�tulo estaba lleno de keywords que hac�an referencia a traffic estimator pero que si acced�as a esa p�gina web con un navegador normal ve�as un t�tulo completamente distinto.

Ahora Google ya ha retirado dicha p�gina, supongo que alguien dentro de Google habr� recibido una buena bronca.


Por qu� MSN no rastrea todo mi web

25.02.2005
Categor�a: — Joaquin @

Una de las ventajas de internet es que la gente comparte su trabajo y la informaci�n que averigua con los dem�s.
Entre esa gente hay afortunadamente muchos webmasters, entre ellos gente que se dedica con minuciosidad a analizar los logs de sus webs.

Una serie de webmasters han analizado el comportamiento de “MSNBot” que es el robot de Microsoft emplea para inderax las p�ginas que utiliza su recientemente publicado buscador.

Estos se han dado cuenta de que no indexaban todas las p�ginas de su sitio, preocupados por este comportamiento han estado investigando y preguntando a MS sobre esto.

Una de las principales razones por las que MSBot no indexa todas las p�ginas es por URL demasiado compleja, parece ser seg�n informaci�n de MS que MSNBot se asusta si ve URL con m�s de 5 o 6 par�metro ya que piensa que puede estar siendo enga�ado y meti�ndose en una espiral atrapa bots.

Otras de las razones es que no indexa muy profundamente, si la p�gina s�lo se puede acceder a trav�s de navegar por 7 u 8 niveles, es muy posible que el robot de MS no la indexe, por eso ellos recomiendan que tengas un mapa del web, para facilitar el rastreo al robot.

M�s informaci�n en el blog de MSN Search.








Comparte



Enlaces
Cocina Facil IngenieroSoftware.com  
Última modificación:11 de Mayo de 2009. Spain - Espa�a.
© 1998-2004 por . Todos los derechos reservados.