Pasado, presente y futuro de los datos estructurados con la búsqueda de Google – Actu Seo et Web

Lizzi Sassman y Martin Splitt recibieron una invitación especial de Google en su podcast de búsqueda de Google administrado de forma privada para hablar sobre datos estructurados. El invitado es Ryan Levering, quien ha estado trabajando con Google durante más de 11 años en datos estructurados.

Datos estructurados pasados ​​a través de Google

En resumen, Ryan Levering explicó que cuando comenzó a trabajar en el proyecto de datos estructurados, trabajó en esta herramienta de supervisión basada en datos en Search Console. Pero, para empezar, Google parece estar tratando de no obligarnos a presentar o equilibrar nuestro contenido y le gustaría usar el aprendizaje automático para comprender todo lo que Gary Illyes de Google declaró en 2017 pero se retractó de algún modo en 2018. Entonces, Google ha visto muchos esfuerzos en el aprendizaje automático para comprenderlo.

Datos estructurados presentados por Google

Pero en ese momento, dijo Ryan, «es mucho más fácil simplemente pedirle a nuestra gente que les dé sus datos en lugar de recuperar páginas web». «Es aún más preciso», agregó. Por lo tanto, han cambiado la ventaja de los recursos hacia la creación de datos estructurados y documentos de apoyo para que los propietarios de los sitios puedan usar y transmitir los datos.

Pero el aprendizaje automático ahora es a través de la ventana. Ryan dijo que todavía lo usan mucho para (1) los sitios que no usan datos estructurados para aquellos que Google siempre quiso mostrar resultados enriquecidos para ellos, (2) para errores o abusos, para que Google pueda verificar lo que realmente dice sobre la página en términos de datos estructurados. Por lo tanto, Ryan declaró que estaba comprometido con un «enfoque de múltiples voltios» para utilizar datos estructurados y aprendizaje automático para comprender todo.

Es como el uso de Google hoy, pero es el futuro.

Obtener datos estructurados en Google

Para «el mediano plazo», Ryan afirmó que prefiere usar datos estructurados «no solo tratamientos visuales, sino una mejor comprensión de la página». Google ya mencionó que los datos estructurados pueden ayudar a Google a comprender la página, pero esto no es un factor de clasificación. Estoy asumiendo la ventaja de Google sobre él. Además, en el futuro a mediano plazo”, afirmó Ryan, Google quiere entender “cómo usar los datos estructurados de una manera más universal en una gran cantidad de nuestras funciones en lugar de estar aquí y allá, dispersos”.

A la larga, Google ha explicado que Google puede usar datos estructurados en la forma en que Google «interpreta en general en nuestros gráficos internos». Ryan declaró que «le gustaría transmitir dónde ajustamos cada vez más datos a través de canales estructurados específicos a los datos en lugar de transmitir necesariamente toda nuestra información en la propia página web». En general, existe una «mejor manera de transferir datos entre los proveedores de datos y Google». La forma en que Google lo hace, si lo dice, podría estar trabajando con los principales formularios de CMS para que puedan integrarse directamente en sus formularios.

Aquí está el podcast integrado:

Aquí están las transcripciones:

Ryan Levering: Por lo tanto, mi introducción, cuando comencé en Google, trabajamos en la extracción de páginas web. Donc, como lo hace a través de ML. Por lo tanto, estamos llegando y la primera opción en la que trabajé fue el producto de la evidencia de datos, que es externa. Examinamos páginas web y extractos de datos estructurados de texto no estructurado, y todo mi equipo estaba muy interesado en los aspectos reales de ML. Entonces, ¿cómo extraemos datos de nosotros, lo que, en los círculos universitarios, a menudo se llama «inducción de envoltura»? Por lo tanto, cuando toma el… construye un contenedor que puede extraer los datos de un modelo. Así que desmontar la base de datos. Pero después de varios años de trabajar en él, hubo otro proyecto en paralelo que extrajo datos estructurados, que se convirtió en el núcleo de lo que estamos usando actualmente.

Y me convencí, después de hablar con la gens durante un largo período de tiempo, de que era mucho más fácil simplemente pedirles a las gens que les dieran sus datos en lugar de recuperar páginas web. Es aún más preciso. Hay otros problemas que se pueden superar debido a esto, pero generalmente es algo más fácil de hacer. Y hay mucho menos trabajo para nosotros, y mucho menos para el proveedor. Por lo tanto, soy amigo de ML y tengo a bordo los datos estructurados como el nombre. Y luego me convencieron como un buen mecanismo.

Por lo tanto, el aprendizaje automático es: veo varios cambios en nuestro enfoque de la forma en que obtenemos las cosas. Queremos utilizar el aprendizaje automático para aquellos casos en los que no disponemos de más información en los que no disponemos de suministros. Pero siempre será más fácil para nosotros mostrar los datos, creo. Por lo tanto, debemos intentarlo, creo que es como un enfoque a varios niveles, donde tiene el aprendizaje automático para los casos en los que no tenemos estos datos específicamente. Pero los proveedores aún tienen la capacidad de proporcionarnos datos, lo que generalmente mejora la precisión, lo que generalmente es más ventajoso para el proveedor real. Si es así, siempre trabajo codo con codo en un mundo ideal.

A medida que pasa el tiempo, la mayoría de nuestras funciones están migrando hacia este enfoque hacia el que nos dirigimos. Puede ser que comencemos con un enfoque en el que simplemente usamos ML. Y luego podríamos incluso agregar aumentos para que la gente tenga el control. O es todo lo contrario. Y comenzamos: comenzamos con el equilibrio en un enfoque de ecosistema donde las personas nos brindan datos. Y luego mejoraremos la funcionalidad a largo plazo de agregar ML a largo plazo. Por lo tanto, los veo muy compatibles. Pero siempre es bueno dar a las personas que te proporcionan los medios para tener control sobre estos. Por lo tanto, creo que es muy importante que los datos estructurados en general sean parte de la estrategia global para que las personas puedan tener cierto control sobre el contenido que mostramos.

El principal desafío es que luego tenemos que encontrar una manera de verificar que los datos estructurados sean precisos. Y a veces, esto proviene de un abuso real. Y a veces es solo porque hay un problema de sincronicidad. A veces, los gens generan datos estructurados para sus sitios Web y ya no están sincronizados con los elementos reales que se muestran visualmente. Vemos muchos de los dos. Por lo tanto, debe haber otros mecanismos para encontrar un equilibrio en el que se apliquen estas cosas. Por lo tanto, este es el costo de los datos estructurados, supongo que esto es una verificación adicional.

Lizzi Sassman: Sí, en vista del trabajo que se ha hecho, ¿cuál es el trabajo por venir, los próximos dos años para datos estructurados? Si tuviera que darnos una visión general del futuro, ¿cuál sería el siguiente paso para los datos estructurados?

Ryan Levering: A mediano plazo, creo que estamos… Me gustaría decir que continuaremos desarrollando el uso de datos estructurados agregando más funciones y examinando otras formas de usarlos en cosas más geniales que no solo son visuales. tratamientos, pero en realidad entiendo mejor la página, creo. Y descubra cómo usar los datos estructurados de una manera más universal en una gran cantidad de nuestras funcionalidades en lugar de estar aquí y allá, dispersos. Creo que eso es lo que estamos considerando a mediano plazo.

A la larga, creo que esto jugará un papel muy interesante en la interacción con la forma en que los interpretamos en general en nuestros gráficos internos. Por lo tanto, me gustaría ver más aprendizaje automático, entiendo… Me gustaría ir a otro lugar donde ajustamos cada vez más datos a través de canales estructurados específicamente para datos en lugar de transmitir necesariamente toda nuestra información en la página web elle -me. Por lo tanto, creo que este es un enfoque mucho más puro, especialmente para algunas de nuestras rutas de entrada de datos estructurados. Por lo tanto, encuentre una manera de eludir la representación visual real y encuentre los medios para leer los datos estructurados en la página web, pero no necesariamente para integrarlos en la página web. Por lo tanto, creo que hay una mejor manera de transferir datos entre los proveedores de datos y Google.

Creo que será más fácil para los complementos y el CMS crear esta información en privado. Porque tengo la impresión de que gran parte del ecosistema ha evolucionado en esta dirección donde la gente no les implementa ni siquiera los datos estructurados sino que utilizan herramientas de creación de contenidos. Creo que se vuelve cada vez más importante que tengamos mecanismos para trabajar directamente con estas herramientas de creación de contenido para incorporar los métodos de programación para hacerlos más frescos y fáciles.

Foro de debate sobre Gorjeo.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.