Google a longtemps prêché l'évangile du «contenu rédigé par des personnes, pour des personnes.» Mais dans une récente mise à jour, le géant de la recherche réécrit discrètement ses propres règles pour reconnaître la montée de l'intelligence artificielle.
Dans la dernière itération de la «Mise à jour du contenu utile» de Google Search, la phrase «rédigé par des personnes» a été remplacée par une déclaration selon laquelle Google surveille constamment le «contenu créé pour les personnes» pour classer les sites sur son moteur de recherche.
Le nouveau langage montre que Google reconnaît l'IA comme un outil largement utilisé dans la création de contenu. Mais au lieu de simplement se concentrer sur la distinction entre l'IA et le contenu humain, le principal moteur de recherche souhaite mettre en valeur un contenu précieux qui bénéficie aux utilisateurs, qu'il soit produit par des humains ou des machines.
Google investit quant à lui dans l'IA à travers ses produits, y compris un service de génération de nouvelles alimenté par l'IA ainsi que son propre chatbot IA Bard et de nouvelles fonctionnalités de recherche expérimentales. La mise à jour de ses directives s'aligne également avec la direction stratégique de l'entreprise.
Le leader de la recherche vise toujours à récompenser le contenu original, utile et humain qui apporte de la valeur aux utilisateurs.
«Par définition, si vous utilisez l'IA pour rédiger votre contenu, il sera repris d'autres sites», a souligné John Mueller, responsable de l'équipe des relations de recherche de Google, sur Reddit.
Faire du SEO ou ne pas faire du SEO?
Les implications sont claires : un contenu IA répétitif ou de mauvaise qualité peut encore nuire au référencement naturel, même avec l'avancée de la technologie. Les rédacteurs et les éditeurs doivent toujours jouer un rôle actif dans le processus de création de contenu. Le manque d'implication humaine est risqué car les modèles d'IA ont tendance à halluciner. Certaines erreurs peuvent être amusantes ou offensantes, mais certaines peuvent coûter des millions de dollars et même mettre des vies en danger.
Le référencement naturel, ou SEO (Search Engine Optimization), désigne les stratégies visant à améliorer le classement d'un site web dans les moteurs de recherche tels que Google. Un meilleur classement entraîne une visibilité et un trafic accrus. Les experts en SEO ont longtemps cherché à «battre» les algorithmes de recherche en optimisant le contenu pour correspondre à l'algorithme de Google.
Google semble pénaliser l'utilisation de l'IA pour la simple résumé ou reformulation de contenu, et dispose de ses propres moyens pour détecter le contenu généré par l'IA.
«Ce processus de classification est entièrement automatisé, utilisant un modèle d'apprentissage automatique.» Google affirme que cela signifie qu'il utilise l'IA pour distinguer le bon contenu du mauvais.
Cependant, une partie du défi réside dans le fait que la détection du contenu IA repose souvent sur des outils imprécis. OpenAI lui-même a récemment supprimé son propre classificateur IA, reconnaissant son inexactitude. La détection de l'IA est difficile car les modèles sont en réalité entraînés à «sembler» humains, donc la confrontation entre les générateurs de contenu et les discriminateurs de contenu ne prendra jamais fin car les modèles d'IA deviennent de plus en plus puissants et précis au fil du temps.
De plus, former une IA avec des générations de contenu générées par l'IA peut conduire à un effondrement du modèle.
Google déclare qu'il ne cherche pas à reproduire des données générées par l'IA, mais plutôt à les identifier et à récompenser en conséquence le contenu rédigé par des humains. Cette approche est plus proche de la formation d'un discriminateur IA spécialisé, où un modèle IA tente de créer quelque chose qui semble naturel et un autre modèle tente de distinguer si la création est naturelle ou artificielle. Ce processus est déjà utilisé dans les réseaux antagonistes génératifs (GAN).
Les normes continueront d'évoluer à mesure que l'IA se répand. Pour l'instant, Google semble se concentrer sur la qualité du contenu plutôt que sur la séparation des contributions humaines de celles créées avec des machines.