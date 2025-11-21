ACTU
[Prise Chaude] Jetons l'agent par les fenêtres
par CBL, email @CBL_Factor
Windows a fêté ses 40 ans hier et l'OS de Microsoft a connu des hauts et des bas. Après un Windows 8 désastreux, Windows 10 constituait un retour à la normale raffraîchissant mais c'était surtout un système d'exploitation qui ajoutait plein de belles choses pour le jeu PC via Windows Display Driver Model 2 : de meilleures performances, une meilleure stabilité, le support de DX12, le HDR, le GPU scheduling, le ray-tracing, les mesh shaders... La gestion du son avait aussi été revue de fond en comble par rapport à Windows 7.
Certes, l'éditeur avait aussi blindé son OS de télémétrie tout en tentant d'imposer en douceur l'utilisation d'un compte Microsoft mais les choses allaient dans le bon sens. L'entreprise avait même progressivement abandonné UWP, un système tout fermé qui aurait pu tuer les mods. Windows 10 supportait aussi les PC sans TPM ou UEFI et continuait de fonctionner sur des processeurs 32 bits ! Comble du bonheur, on pouvait même lancer Linux dans Windows via WSL. Selon Microsoft, Windows 10 était même la "dernière version de Windows". Puis en 2021, la firme de Redmond a annoncé que ce qui devait être une mise à jour majeure de Windows 10 allait devenir un nouvel OS, Windows 11.
La raison est simple : l'argent. Grâce à des pré-requis matériels artificiels, Windows 11 est incompatible avec les PC plus anciens, ce qui force une partie des utilisateurs à renouveller leur parc, ce qui fait les affaires des constructeurs de PC. Ça fait aussi celles de Microsoft qui peut vendre des licences. Mais après tout, ils ne sont pas les seuls à forcer à l'achat de matos pour pouvoir utiliser la nouvelle version de leur OS. C'est une tactique employée par Apple depuis des années.
Microsoft a justifié le tout en expliquant que c'est pour votre bien car Windows 11 est mieux protégé que Windows 10. En réalité, la majorité des fonctionnalités au niveau sécurité de Windows 11 existaient déjà dans la version précédente du système ou auraient pu être facilement ajoutées. Non seulement on n'a pas gagné au change mais en plus on a perdu des fonctionnalités. La barre des tâches, le menu Démarrer et le menu contextuel, des emblèmes de Windows, sont devenus de vastes blagues. Il devient de plus en plus dur de ne pas utiliser de compte Microsoft. Niveau jeux vidéo, Windows 11 n'a pas apporté grand-chose mis à part l'auto-HDR et Direct Storage, même si ce dernier est disponible dans Windows 10, certes en moins efficace. Depuis sa sortie, Microsoft a corrigé beaucoup de problèmes de Windows 11 mais vu que ce sont des dysfonctionnements qu'ils avaient eux-mêmes créés, on ne va pas exactement leur donner une médaille. Et le problème n'est pas le présent mais le futur.
Déjà, la gen Z en question, elle a grandi avec un écran tactile et quand il s'agit de communiquer, c'est principalement en mode texte... Mais surtout, on vient juste de se débarrasser de Cortana. Pourquoi on se refarcirait un nouvel assistant vocal ? De nos jours, on peut déjà parler à ChatGPT. Mais qui le fait ? Quant à contrôler un OS entier par la voix, c'est loin d'être pratique tout le temps (quand on est muet, quand on doit être silencieux, quand on a un accent prononcé...) et surtout c'est loin d'être efficace. Prenez Blade Runner par exemple. Dans une des scènes du film, Deckard inspecte une photo en zoomant à base de commandes vocales. La lenteur du processus crée une sorte de suspense mais Deckard aurait pu plier l'affaire en vingt secondes s'il avait eu une souris ou un écran tactile.
Les utilisateurs veulent un OS qui se fait transparent pour accéder à l'essentiel, à savoir les applications. Ils ne veulent pas un système intrusif qui vient nous ennuyer toutes les cinq secondes. Vous vous rappelez de Clippy, l'assitant de Windows XP ? Personne ne pouvait le blairer. Pourtant, Microsoft veut le ressusciter à base d'IA et le résultat s'appelle Mico. Mais au moins pour Deckard, l'IA fonctionnait. The Verge a pu tester Copilot Vision, une version de Copilot qui est capable en théorie de voir ce qui se passe à l'écran et de répondre à nos requêtes. Lisons directement la conclusion :
Par le passé, on se disait : "Ah, sacré Microsoft. Ils ratent un Windows sur deux" mais c'était à la limite du syndrome de Stockholm. On attendait que MS fasse mieux car on n'avait pas vraiment le choix, surtout si on jouait sur PC. Mais de nos jours, le choix existe. Jouer sur Linux est largement plus facile qu'avant grâce aux efforts de Valve et il y a même des distribs comme Bazzite pensées pour le jeu en attendant que Valve sorte une version officielle de SteamOS. Le jeu sur macOS a aussi fait des progrès énormes et Apple semble bien plus prudent que Microsoft question IA. Et toute la couche Apple Intelligence est désactivable en un click. Accessoirement, un compte Apple n'est toujours pas obligatoire pour utiliser un Mac...
Y a-t-il un Copilot dans l'avion ?Le futur de Windows tient en deux lettres : I.A. Vous avez déjà pu remarquer que Copilot s'invite un peu partout : dans la barre des tâches, dans Edge, dans Office, dans la Game Bar, dans Visual Studio et même dans le BLOC-NOTES. Histoire de pousser le ridicule jusqu'au bout, les nouveaux PC portables ont une touche de clavier dédiée. Et ce n'est que le début. Si vous voulez avoir une vision d'horreur, on vous conseille de regarder celle que Micrrosoft a pour Windows en 2030. Selon David Weston, Corporate Vice President of Enterprise & OS Security, utiliser un clavier et une souris sera un concept dépassé pour la gen Z. Parler à son ordinateur, ça c'est le futur.
"[Copilot] a échoué à tout ce que je lui ai demandé. Comme beaucoup de technologies d’IA génératives existantes, c’est une solution incomplète à la recherche de problèmes. Il pourrait y avoir quelque chose d’utile ici, en matière d’accessibilité, s’il peut un jour contrôler entièrement Windows. Mais parler à Copilot aujourd’hui donne l’impression que des ordinateurs puissants sont incompétents. Il est difficile de voir comment nous pourrions atteindre la vision audacieuse de Microsoft concernant l’avenir de l’IA agentique à partir de ce qu’ils offrent aujourd’hui aux consommateurs."Comme le dit The Verge, ça pourrait aider en théorie les personnes ayant un handicap mais vu l'état actuel, ça semble plus frustrant qu'autre chose. "Agentique" est le nouveau mot à la mode. Et vous allez en bouffer. Le patron de Windows, Pavan Davuluri, pense que le futur de Windows, c'est de devenir un OS "agentique", à savoir un système dans lequel vous donnez des tâches à une série de bots gérés par l'IA et vous les regardez faire votre boulot. Sans grande surprise, la majorité des réactions sont négatives et à base de "personne n'en veut". Mais ça ne semble pas freiner les plans de Microsoft et vous pouvez déjà tester les agents en question dans Copilot Labs via les Copilot Actions. Il y a un léger problème par contre : la sécurité. Oui, la mytho-raison d'être de Windows 11.
L'agent tous risquesUne fois activés, les agents peuvent créer leurs propres comptes utilisateurs, leurs propre espaces de travail et avoir accès à tous vos documents si vous les autorisez. En lecture et en écriture, ce qui semble déjà risqué. Mais ce n'est pas tout. Voilà comment fonctionne grosso modo un agent. Comme dans ChatGPT, tout commence par une requête de votre part. À partir de cette requête, l'agent démarre une sorte de boucle while() dans laquelle il génère ses propres sous-requêtes en fonction de l'exécution des précédentes jusqu'à arriver au résultat voulu. Mais cela a des conséquences imprévues. Selon Microsoft :
"As these capabilities are introduced, AI models still face functional limitations in terms of how they behave and occasionally may hallucinate and produce unexpected outputs. Additionally, agentic AI applications introduce novel security risks, such as cross-prompt injection (XPIA), where malicious content embedded in UI elements or documents can override agent instructions, leading to unintended actions like data exfiltration or malware installation."Je vais expliquer au lieu de traduire. l'IA actuelle étant imparfaite, il est possible qu'elle hallucine et donc qu'elle fasse n'importe quoi. Ou pire. Il est possible d'influencer les sous-requêtes en planquant des instructions dans des images ou du texte. On appelle cela du "Cross-Modal Prompt Injection". Dans un OS "agentique", cela permet de voler des données et/ou d'installer des malwares. Comme le tout est fait en utilisant un compte utilisateur différent, le processus est totalement opaque jusqu'à ce qu'il soit trop tard. Passons sur le fait que ça doit générer une tonne de tâches de fond pour un OS déjà boursoufflé et faire monter votre facture d'électricité si les calculs sont faits par le GPU.
