Google, Microsoft y Yahoo se unen para promover la Web semántica

Google, Microsoft y Yahoo se han asociado para alentar a los operadores de páginas web a hacer que el significado de sus páginas sea comprensible para los motores de búsqueda.

Red de palabras: Este gráfico de frases vinculadas permite que el software comprenda el significado del contenido en línea. El sistema está respaldado por Google, Microsoft y Yahoo.

La medida finalmente puede alentar el uso generalizado de tecnología que hace que la información en línea sea tan comprensible para las computadoras como para los humanos. Si el esfuerzo funciona, el resultado no solo será mejores resultados de búsqueda, sino también una ola de otras aplicaciones y servicios inteligentes capaces de comprender la información en línea casi tan bien como nosotros.



Las tres grandes empresas web lanzaron la iniciativa, conocida como Schema.org , la semana pasada. Define un vocabulario interconectado de términos que se pueden agregar al marcado HTML de una página web para comunicar el significado de los conceptos de la página. Una ubicación a la que se hace referencia en el texto podría definirse como un palacio de justicia, que Schema.org entiende como un tipo específico de edificio gubernamental. También se pueden definir personas y eventos, al igual que atributos como la distancia, la masa o la duración. Estos datos permitirán a los motores de búsqueda comprender mejor qué tan útil puede ser una página para una consulta de búsqueda determinada, por ejemplo, al dejar en claro que una página trata sobre la sede del Departamento de Defensa de EE. UU., No sobre formas regulares de cinco lados.

La medida representa un avance importante en una campaña iniciada en 2001 por Tim Berners-Lee, el inventor de la Web, para permitir que el software acceda al significado del contenido en línea, una visión conocida como Web semántica. Aunque existe la tecnología para hacerlo, el progreso ha sido lento porque ha habido pocas razones para que los operadores de páginas web agreguen el marcado adicional.

Schema.org puede cambiar eso, dice Dennis McCleod , que trabaja en tecnología web semántica en la Universidad del Sur de California. Al etiquetar la información, los propietarios de páginas web podrían mejorar la posición de su sitio en los resultados de búsqueda, una fuente importante de tráfico. Esto motivará a las personas a agregar datos semánticos a sus páginas, dice McCleod. Siempre es difícil predecir qué se adoptará, pero en general, a menos que haya algo para las personas, no lo harán. Google, Microsoft y Yahoo le han dado a la gente una razón de peso.

El enfoque de Schema.org se basa en uno de los métodos más sencillos de describir el significado del contenido de una página web. El problema con muchas de estas técnicas es que son realmente difíciles de usar, dice McCleod. Una de las cosas alentadoras de Schema.org es que están persiguiendo esto a un nivel que es bastante utilizable, por lo que es mucho más fácil marcar su sitio web.

Si muchos propietarios de páginas web actúan sobre la base de las sugerencias de Schema.org, se beneficiarán más que las búsquedas. Estos datos pueden ser utilizados por cualquier software para correlacionar cosas que están relacionadas o para comprender la relación entre información de diferentes fuentes, dice McCleod. Por ejemplo, la disponibilidad generalizada de información semántica podría mejorar a los asistentes con inteligencia artificial, como Siri (comprado el año pasado por Apple). O herramientas capaces de hacer buenas recomendaciones de, digamos, artículos de noticias porque pueden saber con certeza a qué se refieren las historias.

Sin embargo, las empresas detrás de Schema.org hicieron su movimiento unilateralmente, sin consultar al consorcio World Wide Web (W3C), el organismo de estándares para la tecnología web. No teníamos idea de que esto iba a suceder, dice Manu Sporny, miembro del Grupo de Coordinación de Web Semántica del W3C.

Schema.org solicita que el marcado semántico se escriba utilizando un formato conocido como microdatos, que aún no es un estándar W3C, en lugar de RDFa, una alternativa aprobada por W3C más ampliamente utilizada.

Google advirtió que sus rastreadores que recorren la Web para construir su índice podrían confundirse con una página que use tanto microdatos como RDFa. Sin embargo, Microsoft ha dicho anteriormente que sus propios rastreadores no tienen tales problemas, dice Sporny.

Si esa confusión no se corrige, dice, los microdatos pueden convertirse en el único estándar utilizado a cualquier escala, lo que limitaría el poder de la Web semántica, porque la alternativa puede hacer mucho más. RDFa admite casos de uso que los microdatos no pueden; por ejemplo, la OMS publica tasas de mortalidad para diferentes países o agrega información semántica a libros electrónicos o archivos de imágenes, dice.

Sporny espera que Google y otros detrás de Schema.org modifiquen su postura sobre los formatos. Pero reconoce que hacer que empresas tan grandes adopten el enfoque semántico es algo bueno. Dicen que obtendrá mejores resultados con los conceptos de la Web semántica, dice Sporny, y si alientan a más sitios a adoptar la Web semántica, eso también ayudará a todo tipo de otras aplicaciones.

esconder