Comment détecter les textes générés par l'IA - @yannhoury

[Thread Twitter](https://twitter.com/yannhoury/status/1605092495624282112?s=20&t=-bpBbIerPJvcarOL-mZ-Jw) (modifié et complété par la suite ici même) > [!info]+ > - [[#Quelques outils|Quelques outils]] > - [[#Quelques outils#GPT-2 Output Detector|GPT-2 Output Detector]] > - [[#Giant Language model Test Room]] > - [[#Quelques outils#GPTzero|GPTzero]] > - [[#Quelques outils#Detector|Detector]] > - [[#Quelques outils#D'autres exemples|D'autres exemples]] > - [[#Un jeu pour s'entraîner|Un jeu pour s'entraîner]] > - [[#AI Text Classifier]] > - [[#Conclusion|Conclusion]] ## Quelques outils ### GPT-2 Output Detector Pour les enseignants qui voudraient identifier une triche potentielle, il y a plusieurs façons de détecter un texte qui aurait été écrit par une IA. Il y a [GPT-2 Output Detector]( https://huggingface.co/openai-detector/) de HuggingFace qui fonctionne, dans l'ensemble, plutôt pas mal (davantage d'explications [ici](https://www.twaino.com/outils/seo/detecteur-ia-gpt2-hugging-face/) et [cette vidéo](https://youtu.be/QEaBAZQCtwE)). ### Giant Language model Test Room Il y a aussi [Giant Language model Test Room](http://gltr.io/dist/index.html) qui semble fonctionner correctement. > [...] les mots qui sont statistiquement plus susceptibles de se trouver après le précédent sont surlignés en vert. Ceux en rouge ou jaune sont moins probables, quant à ceux en violet encore moins. Plus le résultat affiche un rendu jaune et vert, plus le texte risque d’avoir été rédigé par une IA (https://siecledigital.fr/2019/07/30/une-ia-capable-de-detecter-un-texte-redige-par-une-ia/)) Bien que tous basés sur GPT-2, ils s'en sortent manifestement honorablement. La bonne nouvelle, c'est que l'IA suit un modèle mathématique pour produire des textes et que ce modèle peut être utilisé pour détecter son emploi. Enfin, c'est ce que je comprends. ### GPTzero Le 05-01-2023, l'article [ChatGPT : plus possible de tricher avec l’IA, cet étudiant a développé la contre-attaque parfaite](https://www-phonandroid-com.cdn.ampproject.org/c/s/www.phonandroid.com/chatgpt-plus-possible-de-tricher-avec-lia-cet-etudiant-a-developpe-la-contre-attaque-parfaite.html/amp) mentionnait [gptzero](http://gptzero.me/), une application capable de détecter les textes générés par une intelligence artificielle. > Pour cela, GTZero analyse également le caractère aléatoire du texte en le comparant à un modèle similaire. L’application se charge ensuite d’évaluer la cohérence globale, dernier maillon de la chaîne qui lui permet, en théorie, de détecter l’IA qui se cache éventuellement derrière le texte. J'ai fait deux essais. L'un en français, l'autre en anglais. Tous deux provenant de textes générés par chatGPT. [gptzero](http://gptzero.me/) a échoué à identifier le premier comme généré par l'IA, mais a repéré le second. Pour en savoir davantage, [lire le fil Twitter du développeur](https://twitter.com/edward_the6/status/1610067688449007618?s=20). Comme on peut le lire [ici](https://siecledigital.fr/2019/07/30/une-ia-capable-de-detecter-un-texte-redige-par-une-ia/) : > L'algorithme se base sur les distributions statistiques des mots du texte afin d'identifier les différences entre la rédaction humaine ou celle d’une IA. En principe un texte généré à l'aide d’une intelligence artificielle comportera une chaîne de mots plus prévisible que lorsqu'elle a été écrite par un humain. Plus de détails dans [A college student created an app that can tell whether AI wrote an essay](https://www.npr.org/2023/01/09/1147549845/gptzero-ai-chatgpt-edward-tian-plagiarism) : > To determine whether an excerpt is written by a bot, GPTZero uses two indicators: "perplexity" and "burstiness." ==Perplexity== measures the complexity of text; if GPTZero is perplexed by the text, then it has a high complexity and it's more likely to be human-written. However, if the text is more familiar to the bot — because it's been trained on such data — then it will have low complexity and therefore is more likely to be AI-generated. > Separately, ==burstiness== compares the variations of sentences. Humans tend to write with greater burstiness, for example, with some longer or complex sentences alongside shorter ones. AI sentences tend to be more uniform. ### Detector Il existe dorénavant [ChatGPT GPT3 Detector | Draft & Goal](https://detector.dng.ai/fr) (start up française [Detector](https://detector.dng.ai/fr)) qui serait capable de détecter les textes générés par une IA, mais qui pour l’instant ne fonctionne qu’en anglais. Selon le fondateur (cf. [podcast de Jerome Colombain](https://overcast.fm/+v-k0A0_zw)) ,les enseignants pourront proposer gratuitement 30 textes (l’équivalent d’une classe). ## AI Text Classifier [Le tout nouveau détecteur de textes générés par IA](https://platform.openai.com/ai-text-classifier) et produit par... openAI ! Malheureusement, l'outil est tout aussi limité que les autres. Comme précisé sur le site : > - Requires ==a minimum of 1,000 characters==, which is approximately 150 - 250 words. > - The classifier ==isn't always accurate==; it can mislabel both AI-generated and human-written text. > - AI-generated text ==can be edited easily to evade the classifier==. > - The classifier is ==likely to get things wrong== on text written by children and on text not in English, because it was primarily trained on English content written by adults. > [!warning]+ MàJ > OpenAI abandonne ➝ https://www.theverge.com/2023/7/25/23807487/openai-ai-generated-low-accuracy ### D'autres exemples Voir aussi [DetectGPT](https://ericmitchell.ai/detectgpt/) cité sur [ce site](https://www.precisement.org/blog/La-pollution-qui-remplit-Internet-Ou-comment-detecter-les-textes-generes-par.html). Clive Thompson donne d'autres exemples d'outils : > There are a couple of other tools out there, too — including the [“AI Content Detector” by Writer.ai](https://writer.com/ai-content-detector/) and the [“Giant Language Model Test Room”.](http://gltr.io/dist/index.html) ([Detectors for “AI-Written Prose” Are Here](https://betterprogramming.pub/detectors-for-ai-written-prose-are-here-8d2d994b175d)) However, the author explains that "to fool the Writer.ai AI content detector". He concludes: > Alas, the more I played with these tools, the less I felt they were particularly reliable. Better than random chance, but not much more. Clive Thompson also quotes David Gewirtz who says: > “At this point, I don’t think we’re ready to let AI fight AI,” he concluded. Donc, pour l’instant, le plus évident encore est de reconnaître que 1. L'IA affirme d'énormes conneries sans sourciller. 2. Les mots sont courants. Aucun emploi rare. 3. Beaucoup de tournures impersonnelles 4. L'IA invente parfois certains mots. 5. Il n'y aucune erreur du type coquille. 6. Aucune erreur de typographie. 7. ~~L'IA ne cite pas ses sources~~ Le dernier point n'est hélas plus vrai. [Perplixity](https://www.perplexity.ai/?uuid=4942d09f-5a7d-4c0f-8ea1-2bb102716550) est en mesure de fournir l'équivalent de notes de bas de page avec les sources, titre de l'article, lien, etc. > [!info]+ Ajout du 09-07-2023 > Dans [AI-text detection tools are really easy to fool | MIT Technology Review](https://www.technologyreview.com/2023/07/07/1075982/ai-text-detection-tools-are-really-easy-to-fool/), on peut lire : > > They found that while the tools were good at identifying text written by a human (with 96% accuracy, on average), they fared more poorly when it came to spotting AI-generated text, especially when it had been edited. Although the tools identified ChatGPT text with 74% accuracy, this fell to 42% when the ChatGPT-generated text had been tweaked slightly. > Ainsi, 8 mois après l'introduction de chatGPT 3, les détecteurs de texte écrit par IA échouent toujours à les identifier. On lira également [ce témoignage sur Facebook](https://www.facebook.com/title17/posts/pfbid0DSWaYQVwJxcgSGosS88h7kZn6dA7bmw5ziuRQ5br2JMJcAHCi5Up7EJbJKdgwEZwl) : > Although every time you prompt ChatGPT, it will give at least a slightly different answer, ==I’ve noticed some consistencies== in how it structures essays. In future, that will be enough to raise further flags for me. Sur les mots inventés par l'IA, faire des recherches pour retrouver par exemple cet article mentionnant un auteur inventé par l'IA). Voir aussi [cet exemple](https://twitter.com/serialmapper/status/1605229004717522945?s=20&t=-bpBbIerPJvcarOL-mZ-Jw). [Dans cet article](https://blogs.lse.ac.uk/impactofsocialsciences/2022/05/17/new-ai-tools-that-can-write-student-essays-require-educators-to-rethink-teaching-and-assessment/) sont mentionnés deux auteurs (Dunn and Dunn) qui ont bien publié tel article mais pas dans tel journal : > Note its reference for “Dunn and Dunn (1997)”. There is a journal of Research in Education, but no issue 7(2) in 1997. Dunn and Dunn did publish on learning styles, but not in that journal. GPT-3 has fashioned a plausible-looking but fake reference. It has also invented a fictitious research study from Dunn and Dunn to critique learning styles. ## Un jeu pour s'entraîner Fort de tous ces critères, on peut s'entraîner avec le jeu [Real or fake text?](https://roft.io) à essayer de détecter si le texte provient d'un être humain ou d'une IA. ## Conclusion En attendant que tous ces outils se perfectionnent, il faut compter sur l'identification des facteurs suivants et le fait que les êtres humains écrivent parfois terriblement mal : oubli, rupture syntaxique (la fameuse anacoluthe), erreur d'orthographe, coquille, méchantes erreurs typographiques... Donc si c'est *mal* écrit, c'est humain. Sinon, c'est une IA. Une IA sans style mais une IA. En d'autres termes, le texte généré par l'IA, ce ne sera pas du Huysmans. Aucun style. Un vocabulaire plat. Pas d'erreurs orthographiques certes, mais des semi-vérités voire contre-vérités affirmées péremptoirement ou carrément des choses inventées de toutes pièces. Aucun doute. L'IA comme GPT a été conçue pour le SEO et le marketing. 😄 > [!warning]+ MàJ du 16.08.2023 > - [TechCrunch](https://techcrunch.com/2023/02/16/most-sites-claiming-to-catch-ai-written-text-fail-spectacularly/), depuis février, explique que ces détecteurs échouent. > - [OpenAI a même abandonné la partie](https://www.theverge.com/2023/7/25/23807487/openai-ai-generated-low-accuracy). > - Les détecteurs [pénalisent les rédacteurs dont l'anglais n'est pas la langue maternelle](https://arxiv.org/abs/2304.02819). Lire [GPT detectors are biased against non-native English writers: Patterns](https://www.cell.com/patterns/fulltext/S2666-3899(23)00130-7#%20). > - Même Turnitin, qui pourtant continue à vendre son détecteur, admet que [la détection n'est pas fiable](https://www.washingtonpost.com/technology/2023/06/02/turnitin-ai-cheating-detector-accuracy/). > - Excellent résumé du problème (et donc la conclusion est qu’il ne faut pas les utiliser) : [Why AI detectors think the US Constitution was written by AI | Ars Technica](https://arstechnica.com/information-technology/2023/07/why-ai-detectors-think-the-us-constitution-was-written-by-ai/) expliquant les concepts de perplexity et burstiness permettant de comprendre comment fonctionnent les détecteurs. Pression inconsidérée sur des élèves accusés avec une technologie qui ne marche pas : > > A case [reported](https://www.usatoday.com/story/news/education/2023/04/12/how-ai-detection-tool-spawned-false-cheating-case-uc-davis/11600777002/) by USA Today highlights the issue in a striking way. A student was accused of cheating based on AI text detection tools and had to present his case before an honor board. His defense included showing his Google Docs history to demonstrate his research process. Despite the board finding no evidence of cheating, the stress of preparing to defend himself led the student to experience panic attacks. Similar scenarios have played out dozens (if not hundreds) of times across the US and are [commonly documented](https://www.google.com/search?client=firefox-b-1-d&q=accused+of+using+AI+site%3Areddit.com) on desperate Reddit threads. > [!warning]+ MàJ du 09.09.2023 > Dans [OpenAI confirms that AI writing detectors don’t work](https://arstechnica.com/information-technology/2023/09/openai-admits-that-ai-writing-detectors-dont-work/), Ars Technica écrit : > > Last week, OpenAI published [tips for educators](https://openai.com/blog/teaching-with-ai) in a promotional blog post that shows how some teachers are using [ChatGPT](https://arstechnica.com/information-technology/2022/12/openai-invites-everyone-to-test-new-ai-powered-chatbot-with-amusing-results/) as an educational aid, along with suggested prompts to get started. In a related [FAQ](https://help.openai.com/en/collections/5929286-educator-faq), they also officially admit what we already know: AI writing detectors don't work, despite frequently being used to [punish students](https://www.google.com/search?client=firefox-b-1-d&q=accused+of+using+AI+site%3Areddit.com) with false positives. > > In a section of the FAQ titled "Do AI detectors work?", ==OpenAI [writes](https://help.openai.com/en/articles/8313351-how-can-educators-respond-to-students-presenting-ai-generated-content-as-their-own)==, "In short, no. While some (including OpenAI) have released tools that purport to detect AI-generated content, none of these have proven to reliably distinguish between AI-generated and human-generated content." > [!info]+ À voir également > - [The UNDETECTABLE AI Writing Tool That Bypasses AI Detectors](https://undetectable.ai/) (comme son nom l'indique, le site prétend vous aider à créer du contenu générée par IA indétectable) > - [AI Detector Mislabels Essays by Non-Native English Speakers](https://www.businessinsider.com/ai-detector-mislabels-essays-non-native-english-speakers-openai-chatgpt-2023-7?utm_medium=social&utm_campaign=tech-sf&utm_source=twitter&r=US&IR=T) ## En résumé Voici les principaux sites prétendant détecter les textes écrits par une IA. Ils ne sont pas fiables à 100%. | Noms | Liens | | ------------------------------ | --------------------------------------- | | GPT-2 Output Detector | https://huggingface.co/openai-detector/ | | Giant Language model Test Room | http://gltr.io/dist/index.html | | GPTzero | https://gptzero.me/ | | Draft & Goal | https://detector.dng.ai/fr | | Detect GPT | https://detectgpt.ericmitchell.ai/ | | Writer | https://writer.com/ai-content-detector/ | | Crossplag | https://app.crossplag.com/sign-up | | Compilatio | https://ai-detector.compilatio.net/ | | ZeroGPT | https://www.zerogpt.com/ | | Binoculars | https://github.com/ahans30/Binoculars | Ces détecteurs ont été abandonnés : - AI Text Classifier https://platform.openai.com/ai-text-classifier - AI Writing Check https://aiwritingcheck.org/