« Ma Journée en Mode IA : 3 Agents, 0 Effort, Résultat HALLUCINANT 🤯 »

janvier 24, 2025 | by Jean-Yves M.

Capture-decran-2025-01-24-a-21.13.44.png

« Et si votre journée de travail se faisait toute seule ? Ludo Salenne a laissé 3 agents IA prendre les commandes et le résultat est… Fini les tâches répétitives ! Découvrez comment 3 agents IA ont révolutionné ma journée de travail (et pourraient révolutionner la vôtre). L’IA est en train de changer nos jobs à vitesse grand V. Voici comment Ludo Salenne utilise 3 agents IA pour ne pas être dépassé (et vous devriez faire pareil). »

« J’ai donné les clés de mon ordi à l’IA… Ils ont fait ma veille, réservé mon vol, bossé sur mes slides, et même traité mes emails ! C’est la fin du monde tel qu’on le connaît ? « Les agents IA vont-ils nous remplacer ? J’ai testé 3 outils pour vous et voici ce qui s’est passé… »

- visual selection(34).

Analyse Globale

La vidéo est une démonstration percutante et interactive du potentiel transformateur des agents IA dans un contexte professionnel quotidien. Elle réussit à dépasser la simple présentation conceptuelle en offrant une visualisation concrète de l’automatisation de diverses tâches, soulignant ainsi les implications de cette technologie pour le futur du travail. L’approche adoptée, mêlant enthousiasme et une pointe d’humour, rend la vidéo accessible à un large public tout en incitant à la réflexion.

Structure de la Vidéo

La structure reste claire et chronologique, simulant une journée de travail où l’IA prend en charge diverses tâches, mais avec une attention particulière à la progression et à l’escalade des capacités des agents :

Introduction (0:00 – 1:12) :

- visual selection(35).

Présentation de la « révolution » des agents IA, avec une emphase sur leur potentiel à transformer les méthodes de travail et à automatiser les tâches cognitives, au-delà des simples tâches répétitives.

La question centrale est posée non seulement comme une inquiétude (le remplacement), mais aussi comme une opportunité de repenser le travail.

L’objectif est clairement défini : observer le déroulement d’une journée où trois agents IA prennent en charge un agenda professionnel complet, afin de permettre une évaluation pragmatique de leurs capacités.

Premier Agent IA : Do Browser (1:12 – 7:51) :

- visual selection(36).

Introduction de Do Browser comme un outil « de base » mais puissant, utilisant GPT-4o pour interagir avec le web et automatiser des tâches d’exploration, de collecte et de réservation.

Démonstrations plus nuancées, mettant en évidence :

La capacité de Do Browser à réaliser une veille intelligente sur Perplexity, en extrayant des informations pertinentes et en les hiérarchisant selon leur importance, montrant une capacité de compréhension contextuelle.

L’utilisation de la lecture d’une vidéo d’ambiance comme un exemple de la capacité de l’IA à adapter l’environnement de travail.

L’automatisation de la rédaction et de la publication d’articles de blog, soulignant le potentiel d’intégration de l’IA dans des workflows existants.

La réservation d’un vol sur Kayak non seulement comme une tâche automatisée, mais aussi comme un exemple de l’IA travaillant avec des interfaces web complexes.

Deuxième Agent IA : AnythingLLM (7:51 – 15:43) :

- visual selection(37).

Présentation d’AnythingLLM comme une solution « locale » et plus sécurisée, mettant en avant le contrôle des données par l’utilisateur et son utilisation d’un LLM open source.

Démonstrations plus axées sur le workflow complexe :

L’optimisation d’une landing page, montrant la capacité d’analyse de l’IA pour fournir des recommandations actionnables, et sa capacité à collaborer par email.

La création de présentations slides, soulignant non seulement l’automatisation, mais aussi la capacité de l’IA à structurer des idées et les traduire en contenu visuel.

La présentation de ChatGPT Task comme un exemple d’intégration de l’IA dans la gestion quotidienne du temps et des repas, illustrant comment l’IA peut intervenir dans la prise de décisions du quotidien.

Pause Déjeuner et Transition (15:43 – 17:59)

Cette partie met l’accent sur la capacité de ChatGPT Task à s’intégrer dans les aspects personnels de la journée, montrant que l’IA n’est pas limitée au travail strict.

La transition vers le prochain outil sert à marquer l’escalade des capacités des agents IA.

Gestion des Emails et Transition (17:59 – 18:00)

Démonstration de l’efficacité de Do Browser dans la gestion de la boite mail.

Cette transition fait comprendre l’étape de la gestion d’email avec des IA comme un pas vers la personnalisation et l’action dans le flux de travail.

Troisième Agent IA : Relevance AI (17:59 – 25:37) :

- visual selection(38).

Relevance AI est présenté comme un outil sophistiqué de « gestion d’agents », soulignant la possibilité de structurer des équipes virtuelles d’IA.

Démonstrations plus détaillées sur :

La création d’un script vidéo YouTube par un agent « spécialisé » (Cloclo), mettant en avant non seulement la génération de contenu, mais aussi la capacité de l’IA à comprendre les exigences et à interagir de manière itérative avec l’utilisateur.

L’automatisation de la prospection LinkedIn, en montrant la capacité de l’IA à non seulement identifier des prospects, mais aussi à synthétiser des informations pertinentes sur ces prospects pour une approche personnalisée.

Points Importants et Transition (25:37 – 27:04)

Cette partie est enrichie par une reconnaissance de la fatigue que pourrait engendrer l’utilisation des IA, soulignant ainsi la nécessité de trouver le bon équilibre entre l’automatisation et le travail humain.

Les appels à l’action sont plus personnalisés, incitant la communauté à partager leurs avis spécifiques sur les outils et les questions soulevées.

Le bonus est introduit comme une « cerise sur le gâteau », pour maintenir l’intérêt et mettre en valeur une nouvelle dimension de l’interaction avec l’IA.

Agent IA et l’Écran en Live (27:04 – 31:31) :

La démonstration de Google AI Studio est présentée comme une avancée dans l’interaction homme-IA, mettant en avant sa capacité à interpréter le contexte visuel et textuel en temps réel, ouvrant de nouvelles perspectives d’assistance en temps réel.

Le choix de la miniature est expliqué comme une démonstration de la capacité de l’IA à aider à la prise de décision créative basée sur l’analyse et les meilleures pratiques du domaine, tout en montrant la capacité de Google Gemini (Géini) à adapter son raisonnement en fonction du contexte.

L’amélioration de la diapositive est présentée comme un exemple de la capacité de l’IA à fournir des conseils constructifs et à optimiser les présentations en temps réel.

Conclusion (31:31 – 32:57) :

- visual selection(39).

Le récapitulatif est plus percutant, soulignant l’ensemble des compétences démontrées par les agents IA.

La question existentielle est reposée avec une plus grande emphase sur l’impact sur l’identité et la valeur du travail humain.

L’appel à l’action invite non seulement à laisser des avis, mais aussi à entamer une réflexion collective sur l’avenir des métiers à l’ère de l’IA.

Points Forts

Démo Concrète et Contextuelle : La vidéo ne se contente pas de montrer l’automatisation, mais démontre comment les agents IA peuvent s’intégrer dans des flux de travail complexes, en tenant compte de la sémantique et du contexte spécifique de chaque tâche.

Variété des Tâches et Échelle des Capacités : La démonstration couvre un large éventail de tâches, en les classant des plus basiques (Do Browser) aux plus avancées (Relevance AI), soulignant l’escalade de capacités des différents agents.

Transparence et Approfondissement : La vidéo explique clairement le fonctionnement général des outils, tout en mettant en lumière les mécanismes sous-jacents, tels que l’utilisation de sous-agents et la gestion de workflows.

Accessibilité et Incitation à la Réflexion : Le langage reste simple, mais la vidéo incite davantage à une réflexion sur les enjeux éthiques, économiques et sociaux liés à l’automatisation du travail par l’IA.

Engagement et Personnalisation : La vidéo n’invite pas seulement à l’interaction, mais encourage une participation active de l’audience, en partageant leurs propres expériences et en soulevant des questions spécifiques.

Enthousiasme et Équilibre : Le vidéaste conserve son enthousiasme, tout en faisant preuve d’un certain recul critique sur l’impact de la technologie.

Outils Diversifiés et Spécificités : La vidéo présente un éventail d’outils, chacun avec ses propres spécificités et son champ d’application, soulignant la nécessité d’une approche sélective et pragmatique dans l’utilisation des agents IA.

Vision Critique et Nuancée : La vidéo ouvre un dialogue sur l’avenir du travail, en encourageant l’audience à questionner la place de l’humain dans ce nouveau paradigme, tout en soulignant les avantages et les défis de l’automatisation.

Bonus et Interaction Temps Réel : L’outil de partage d’écran en live avec Google Gemini illustre le potentiel de l’interaction en temps réel avec l’IA, et comment celle-ci peut agir comme un assistant personnalisé, en offrant une valeur ajoutée concrète.

Conclusion

- visual selection(40).

La vidéo est une ressource incontournable pour toute personne souhaitant comprendre les enjeux et les opportunités liés à l’automatisation du travail par les agents IA. Elle excelle non seulement dans sa présentation, mais aussi dans sa capacité à encourager une réflexion critique et collective sur l’avenir du travail. Cette analyse prend en compte la nécessité d’une vision plus nuancée, en soulignant non seulement les aspects positifs, mais aussi les défis et les risques potentiels, tout en encourageant une adoption responsable et éclairée de cette technologie.

Suivre …Un aperçu d’Operator, le premier agent IA d’Openai en test actuellement :

- visual selection(41).

Operator est un nouvel agent d’intelligence artificielle développé par OpenAI, dévoilé le 23 janvier 2025[1][5]. Voici un bref résumé de ses principales caractéristiques :

1. Capacités : Operator peut effectuer automatiquement diverses tâches en ligne, telles que remplir des formulaires, réserver des hôtels, commander des courses, ou même créer des mèmes[1][3].
2. Fonctionnement : Il utilise son propre navigateur web intégré pour interagir avec les sites comme le ferait un humain, en cliquant, tapant et faisant défiler les pages[2][6].
3. Technologie : Operator est basé sur un nouveau modèle appelé Computer-Using Agent (CUA), qui combine les capacités visuelles de GPT-4o avec un raisonnement avancé[3][4].
4. Disponibilité : Actuellement en version bêta, il est accessible uniquement aux utilisateurs américains abonnés au plan Pro de ChatGPT, avec un déploiement progressif prévu pour d’autres abonnements[1][5].
5. Sécurité : OpenAI a mis en place des mesures pour garantir un usage sûr, notamment en bloquant l’accès à certains sites sensibles[4].

Operator représente une avancée significative dans l’automatisation des tâches en ligne et pourrait transformer notre façon d’interagir avec le web[2]. Cependant la fonctionnalité est encore en test et réservée aux USA…