¿Cómo reconocerá Google los contenidos generados por IA?

Los recientes avances en el campo de la inteligencia artificial (IA) sitúan a los buscadores (y a Internet) ante nuevos retos para determinar qué factores de calidad se han de tener en cuenta para posicionar un sitio frente a otro en las Serps.

Tengo cierta edad, bueno en realidad para algunas cosas soy viejísimo 😅 y recuerdo bien la época pre internet, cuando manejar un ordenador era básicamente mecanografiar documentos y luengo imprimirlos en una impresora de puntos. Los videojuegos eran gráficos en 8 bits en pantallitas de fósforo verde. Cuando llegó Internet, para mí significaba sobre todo escribir las url’s que se publicaban en las revistas de videojuegos, y esperar. Esperar y esperar porque la conexión era lentiiisima y veces después de esperar no conseguías ver nada.

El día que leí que existían los buscadores, unas “Páginas Amarillas” donde buscar la información que necesitabas, casi casi me emociono y todo. Creo que fue en ese momento cuando llegó la auténtica revolución tecnológica en la que aún vivimos. Internet y sus efectos lo hacen posible: todo el mundo tiene acceso a la misma información y servicios en tiempo real que hace unos años nos parecían ciencia ficción. ¿Quien recuerda el reloj de Michael Knight con el que hablaba con su coche, y quién no usa ahora un asistente de voz para pedirle a su coche una canción, o una dirección a su GPS (otro invento de ciencia ficción)?

Michael Knight reloj tecnología futurista

La siguiente etapa en Internet fue que “cualquiera” pudiera crear contenidos, páginas web, blogs, etc. Plataformas como Blogger y WordPress democratizaron la creación de contenidos, que realmente explotaron con las redes sociales y los smartphones.

El siguiente paso, en el que estamos ahora en ciernes, es que las máquinas nos ayuden a crear esos contenidos. Google y el resto de buscadores siguen “premiando” los mejores contenidos, ya sean textos o imágenes, y crearlos es cada vez más y más importante (y más caro).

Ahora mismo, el grial de muchos seos, es que en lugar de tener que buscar información en la red para escribir un post o un artículo, podremos darle a algún tipo de IA o a una tecnología de aprendizaje automático unos cuantos datos y escribirá ese post por mí.

Ahora podemos hacer lo mismo con las imágenes. En enero de 2021, OpenAI lanzó DALL-E, una tecnología de aprendizaje automático basada en GPT que puede crear cualquier imagen a partir de un texto. ¿Quieres saber cómo funciona? Ve a Instagram, busca el hashtag Dall-E y sencillamente alucina:

Dall-E IA de creación de contenidos

Lo que DALL-E significa para el futuro de la creación de contenidos

OpenAI utiliza para DALL-E la misma tecnología Transformer que Google utiliza para MUM y GPT-3. Como resultado, DALL-E entiende muy bien el contexto implícito de las solicitudes. Por ejemplo, entiende la diferencia entre “copas de vino con dibujos de una moto” y “vino en moto a comprar vino” y devuelve imágenes muy diferentes como resultado. También entiende el contexto de los idiomas y el tiempo. Es muy adecuado para proporcionar imágenes para cualquier aplicación.

GPT-3 puede crear texto a partir de unas pocas palabras o instrucciones. Si le dices que escriba sobre “la estrategia de Michael Jordan para ganar su primer anillo en la NBA”, escribirá un ensayo completo sobre el baloncesto de la NBA cuando los Bulls ganaron su primer anillo.

DALL-E, una combinación de WALL-E de Pixar y el artista Salvador Dalí

Los SEOs ahora podemos imaginarnos un futuro en el que DALL-E y otro sistema similar, cree imágenes para los artículos del blog de forma automática. Sólo tienes que escribir el texto, decirle a DALL-E cuántas imágenes quieres y en qué estilo, y las creará basándose en el contexto que encuentre en tu escrito. O puede crear imágenes para las páginas de aterrizaje. Incluso podría colocar su logotipo o producto en un contexto totalmente diferente y hacer que parezca totalmente real.

Ya no tendrías que buscar imágenes sin licencia para una presentación. Google o Microsoft podrían proporcionar el servicio de forma gratuita directamente en el software: “Inserta aquí una imagen de gente de negocios sonriente con traje en un despacho de ambiente moderno”.

Google y Microsoft son actualmente los dos mayores inversores en la investigación de IAs. De hecho, Microsoft pagó miles de millones para obtener un acceso exclusivo al código fuente de GPT-3, mientras que todos los demás utilizan una API. La ventaja competitiva de poseer una tecnología como GPT-3 o DALL-E podría ser difícil de superar.

Pero no es gratis. Un solo entrenamiento de GPT-3 le costó a OpenAI 12 millones de dólares y multiplicó por 300 el coste computacional. El entrenamiento continuo de la IA es caro, por no hablar del coste de la potencia de cálculo para ejecutarla. El listón de entrada es alto.

Como resultado, el coste para los usuarios finales puede ser bajo al principio, ya que las empresas quieren ganar cuota de mercado rápidamente. Pero, al igual que UBER o Lyft, con el tiempo el coste tendrá que aumentar. La IA puede ser capaz de crear mucho texto e imágenes a escala, pero el coste es un factor limitante.

Creación de contenidos con IA Midjourney
Midjourney es otra IA especializada en diseño gráfico

¿Puede Google reconocer el contenido generado por la IA?

Recientemente John Mueller, de Google, mencionó que Google probablemente considerará el contenido generado por la IA como spam. Si el equipo de webspam de Google encuentra contenido generado por IA, podría sancionar a un sitio con una penalización manual. Mueller argumentó que el contenido generado por la IA es similar al spinning de contenido de texto.

Esto nos lleva a dos cuestiones fundamentales. En primer lugar, ¿Cómo debemos utilizar la IA para generar contenidos? En segundo lugar, ¿Cómo puede Google detectar el contenido generado por IA?

En cuanto a la primera pregunta, lo que realmente importa es la cantidad de IA que se utiliza para generar el contenido. Por ejemplo, hay contenidos generados al 100% por la IA y contenidos creados con la ayuda de la IA. Las herramientas de SEO modernas como Semrush o aHrefs, y las herramientas de creación de contenido pueden esbozar el contenido por ti y dar sugerencias de temas a cubrir. Todavía no están en condiciones de escribir completamente (con coherencia) un texto, especialmente en  castellano, pero podrían llegar a hacerlo en muy muy poco tiempo si la tecnología sigue avanzando a este ritmo.

También depende del caso de uso. Ya hace años que algunos medios como el New York Times o el Wall Street Journal, utilizan la IA para todo tipo de cosas, como el llamado. periodismo automatizado o el periodismo robot, en el que los editores utilizan la IA para resumir las noticias de forma automática y lanzar high lights a las RRSS. ¿Qué humano quiere escribir ese tipo de cosas? Mejor se lo dejamos a las máquinas. Lo mismo ocurre con las meta descripciones (que a Google le gusta ignorar) o con las descripciones genéricas de productos para tiendas online.

La segunda cuestión es mucho más complicada. Se puede identificar el contenido de versiones anteriores de modelos NLG (Natural Language Generation) como GPT o GPT-2. Pero los modelos más sofisticados, como GPT-3, son mucho más difíciles de identificar porque imitan muy bien el estilo humano. +INFO AQUÍ

La cuestión de cómo Google puede detectar el contenido de la IA es la misma que la de cómo separar las noticias falsas de las reales. La IA podría agravar aún más el problema de las noticias falsas, ya que ahora se pueden crear automáticamente y, por tanto, a escala. Esa fue la razón original por la que OpenAI no publicó GPT-3 y hace lo mismo con DALL-E.

Una versión de cómo se desarrolla esto es que Google podría tratar el contenido de la IA de forma similar a los backlinks. Técnicamente, comprar enlaces o comerciar con ellos va en contra de las directrices de Google. En la práctica, Google no siempre puede entender si el enlace se estableció de forma natural o si forma parte de un negocio. Sólo cuando los patrones son muy evidentes (por ejemplo, cuando los backlinks son irrelevantes), Google puede tomar medidas.

Lo mismo podría aplicarse al contenido de la IA, donde Google no verá la diferencia siempre que el estilo sea coherente, el artículo tenga un titular y sea de alta calidad.

Otra posible solución es la cadena de bloques (blockchain). Google podría validar y rastrear el contenido escrito por humanos a través de un libro de contabilidad, de forma similar a como utilizó el marcado de autoría, y mostrar una etiqueta en los resultados de búsqueda. Incluso podría clasificar mejor el contenido escrito por humanos, dependiendo del caso de uso. La cadena de bloques es el antídoto contra las noticias falsas. Podría ser el camino hacia resultados fiables para discriminar contenidos generador por una IA o por un ser humano.

De la agregación de contenidos a la creación

¿Te gustan los Gedankenexperimente -experimentos de pensamiento-? Uno de mis favoritos es el de “consecuencias de segundo orden”. En lugar de pensar en las consecuencias, se piensa en las consecuencias de las consecuencias.

Cuando pienso en la IA, el contenido y el SEO, me vienen a la cabeza dos preguntas “¿Qué diferenciará a los sitios web cuando todos tengan contenidos generados por una IA?”

Google mira muchos factores diferentes además del contenido, pero también ha dicho que el contenido es uno de los factores de posicionamiento más fuertes. Si todo el mundo puede crear texto a escala y a bajo coste, Google tendrá que recurrir a otras señales.

¿Se os ocurren qué factores podrá utilizar Google para diferenciar la calidad de unos u otros?


¿Necesitas mejorar el seo de tu web? ¿Necesitas que te ayudemos con tu seo, con los resultados de tu negocio? Contacta con nosotros sin compromiso.

[]
1 Step 1
Solicite +Información
keyboard_arrow_leftPrevious
Nextkeyboard_arrow_right
Fran Navoz | Soy Seo desde hace muchos años.
👉🏻LinkedIn
👉🏻Hubspot
👉🏻Google


🤖 Mi trabajo es hacer que tengas más visibilidad en Internet y mejores posiciones orgánicas en Google

👌🏻 Compromiso y trabajo | ✉️ Contacto
Fran
Scroll al inicio