¿Qué hay de los microformatos?
Hace un tiempo estaba en boca de todos, incluso Bill Gates aparecía como abanderado de este tipo de parametrización de la Web Semantica, pero realmente parece que el proyecto está algo parado a falta de que alguien (posiblemente Google) le de un impulso definitivo, si es que le da.
Los microformatos parecen la panacea de la categorización web. Se trata de estructurar de tal forma el contenido de las páginas HTML que los buscadores y robots pudieran identificar ese contenido y darle un significado. Como ejemplo, uno de los más populares es hCard, para información de contacto, sería:
<div id="contact" class="vcard"> <h2>Contacto</h2> <h3 class="fn">Marcos Labad</h3> <p>Contactame por email en <a class="email" href="mailto:[email protected]">[email protected] </a>, o en esta dirección:</p> <div class="adr"> <div class="street-address">Calle Las Nubes</div> <div class="locality">Madrid</div> <div class="region">Spain</div> </div> </div>
De esta forma cualquier buscador del mundo, podría identificar inequívocamente que esta zona de información es información de contacto y parametrizar calle, provincia, email, etc…
Otro realmente interesante , aún en pañales, es el hProduct, donde se especifican atributos de productos on-line. Sería estupendo para comparadores de precios tipo Kelkoo. En su día, cuando hacíamos crawling de las tiendas para capturar esta información, estábamos indefensos ante cambios de formato HTML en los productos en las tiendas.
Parece la gran solución! Una vez más, estamos ante la filosofía 2.0, donde los usuarios o los creadores de contenido “trabajamos” para los buscadores u otros servicios.
Si ya nos quejamos de la dependencia en Google para muchas cosas, no me puedo imaginar las ampollas que levantaría tener que, además, estructurar la información como nos digan, pero creo que ahora mismo sólo Google podría dar el impulsar este proyecto si lo incluye de alguna manera en sus resultados.
Google adoptó el hCard hace algún tiempo para Maps, y se utiliza el microformato elemental rel-nofollow de forma generalizada, pero no ha vuelto a dar un paso significativo en la adopción de microformatos. Algunas razones podrían ser:
- El éxito de Google se basa en que si alguien busca “peras”, le sale el mejor resultado en cuanto a “peras”, da igual que sea un producto de una tienda, un mensaje en un foro, o un artículo de un periódico ¿Que podría hacer mejores resultados categorizando aún más la información? Quizas sí, pero está claro que no es su prioridad ahora mismo y posiblemente sería bastante costoso hacerlo bien.
- Por otra parte, Google ya es parcialmente “semántico”, si entendemos como tal que identifica partes de la web y entiende a qué se refieren. Como ejemplo, este resultado de foros:
En el primer resultado identifica que es un foro y las entradas que tiene, aunque es cierto que no siempre es capaz de capturar esta información, parece que no está del todo depurado.
- Hay muchísimos tipos de información en al Web. Es posible que Google tarde menos en categorizar algorítmicamente este tipo de información, como en el ejemplo anterior de los foros, que la comunidad web en describir y adoptar todo ese tipo de formatos como estándard
Algo más de información en:
– Microformatos: La web semántica para torpes.