Aunque pueda parecer en un primer momento innecesario, un buscador es una opción que debería hallarse obligatoriamente en todo blog. Fundamentalmente, para los propios autores, que siempre andan rebuscando entre sus textos ya publicados para hacer referencias a temas pasados o, incluso, a la hora de retomar una materia aparcada que vuelve a estar candente. Pero también para los lectores que si son un tanto proactivos, andarán pensando “esto ya lo leí en…” o “creo que lo leí en…” e incluso si son buenos lectores, seguramente acudirán a tu sitio web para buscarlo y si, por desgracia, no lo son, siempre podrán disparar un tanto a ciegas para ver si Google, su providencia, les devuelve la información perdida en el fondo del pajar.
Huelga decir que hoy en día todos los gestores de contenidos o CMS suelen incorporar una caja de búsqueda de forma preconfigurada que posibilita la búsqueda en su base de datos. Por ejemplo, con mejores o peores resultados, WordPress nos ofrece la opción de búsqueda dentro de su gestor de contenidos, e incluso facilitándonos un tutorial para generar una página de resultados de búsqueda personalizada para nuestra web. Desgraciadamente, estos sistemas no suelen acertar ante nuestras exigencias y, finalmente, según vayamos incorporando y publicando contenidos estas herramientas predeterminadas nos resultarán insuficientes, acabando nuestras búsquedas a partir de la página principal de cualquier buscador. Así pues, ¿por qué no incorporar la fuerza bruta de Google en nuestras webs como un servicio añadido para nuestros usuarios?
Tareas de preparación e indexación
La inclusión de una caja de búsqueda para nuestro sitio web no es una tarea excesivamente complicada como veremos, ya que sólo tenemos que incluir una pieza de código HTML dentro del código fuente de nuestra página web. Sin embargo, debemos tener presente ciertas aspectos previos para que Google indexe bien nuestros contenidos y, de esta manera, facilitar que nuestros resultados se ajusten precisamente a lo que nosotros deseamos que se recupere junto a la máxima pertinencia de los mismos.
Así, como buenos webmasters, en el caso de que nuestro blog se encuentre alojado en un dominio propio, deberemos editar y colocar el fichero robots.txt en el directorio raíz de nuestra página web. Este fichero, muy sencillo en su configuración, nos es útil a la hora de determinar qué directorios pueden o no pueden indexar los bots y arañas de los buscadores. De esta manera, nos aseguramos de que si subimos textos en formato pdf, por ejemplo, aparezcan en los resultados de búsqueda, mientras que si lo que queremos es que cierto contenido permanezca oculto podamos señalar que esos contenidos no sean recuperables mediante un buscador.
Otro de los aspectos a tener muy en cuenta cuando queremos utilizar a Google en nuestro sitio web es tener disponible en nuestro servidor un fichero Sitemap. Este fichero realiza un listado de todas las páginas disponibles en nuestro sitio en formato XML, organizadas de forma jerárquica y que deberemos dar de alta en el sitio Webmaster Tools de Google para que los bots tengan disponibles todos los contenidos de las páginas y no tengan que ir rastreándolos con los fallos en lo que esto puede derivar, lo que les facilita su trabajo y por supuesto que el nuestro.
Generando el código de la caja de búsquedas
Realizado todo este trabajo preparatorio, acomodando nuestros contenidos a lo que queremos que sea recuperable, simplemente debemos de realizar la inserción del código HTML de nuestra caja de búsqueda en nuestra web. Anteriormente, la inserción de código se realizaba mediante un texto más o menos estándar que podíamos encontrar fácilmente en cualquier sitio web destinada a la programación en HTML. Básicamente, el texto decía así:
<!-- SiteSearch Google -->
<FORM method=GET action="http://www.google.com/search">
<input type=hidden name=ie value=UTF-8>
<input type=hidden name=oe value=UTF-8>
<TABLE bgcolor="#FFFFFF"><tr><td>
<A HREF="http://www.google.com/">
<IMG SRC="http://www.google.com/logos/Logo_40wht.gif"border="0" ALT="Google">
</A>
</td>
<td>
<INPUT TYPE=text name=q size=31 maxlength=255 value="">
<INPUT type=submit name=btnG VALUE="Buscar en sitio">
<font size=-1>
<input type=hidden name=domains value="
http://www.tunombrededominio.com
"><br><input type=radio name=sitesearch value=""> WWW <input type=radio name=sitesearch value="
TU NOMBRE DE DOMINIO
" checked>
TU NOMBRE DE DOMINIO
<br>
</font>
</td></tr></TABLE>
</FORM>
<!-- SiteSearch Google -->
Hoy en día, el proceso de gestión de esos pequeños buscadores se encuentra muy simplificado, gracias sobre todo al propio interés de Google puesto que la inserción de estos pequeños códigos le reporta ingresos muy interesantes fundamentalmente por la publicidad insertada en los resultados de búsqueda. De esta forma, es posible crear y gestionar innumerables motores de búsqueda personalizados en el sitio web Google Coop creando motores de búsquedas específicos para sitios web o, por ejemplo, creando motores de búsqueda temáticos agrupando las búsquedas para distintas webs. Finalmente, si disponemos de una cuenta Adsense, Google nos ofrece la posibilidad de compartir los ingresos que puedan generar las consultas a nuestra web mediante la opción Adsense para la búsqueda que genera el código necesario para nuestra caja de búsqueda, pero con incluyendo nuestro identificador de afiliado.