Si la voix devient vraiment le mode d'interaction dominant, l'environnement acoustique des bureaux deviendra quelque chose qui nécessitera une conception sérieuse.
Auteur de l'article, source : Lao Ban Zhu, Cyber Last Train
Le WSJ a récemment publié un article dont le titre traduit est environ : « La saisie au clavier est remplacée par le chuchotement, et c'est plus gênant que vous ne le pensez. »

TechCrunch a suivi ce sujet. Le journaliste Anthony Ha a rédigé un court commentaire commençant par citer l'avis d'un capital-risqueur qui déclare que, lorsqu'il se rend aujourd'hui dans les bureaux de startups de la Silicon Valley, il a l'impression d'entrer dans un centre d'appels haut de gamme.
La raison est que de plus en plus de personnes dans le bureau murmurent devant leur ordinateur.
Ce n’est pas un appel téléphonique, pas une réunion, pas une conversation avec un collègue. C’est une personne assise à son bureau, la voix basse, parlant à l’écran. Parfois, elle récite un e-mail, parfois du code, parfois un message Slack. Le clavier émet parfois un léger cliquetis, mais plus souvent, au-dessus du bureau flotte un murmure doux.
Cette scène, il y a cinq ans, aurait probablement été considérée comme un signe d'alerte d'un état psychologique. Mais dans certaines startups de la Silicon Valley en 2026, elle commence à devenir courante.
Ce qui pousse cette initiative, c'est une nouvelle catégorie d'outils. Le plus représentatif s'appelle Wispr Flow.
Ce n'est pas une reconnaissance vocale au sens traditionnel. Les anciennes solutions de dictée vocale transcrivaient mot pour mot ce que vous disiez ; vous deviez prononcer vous-même les signes de ponctuation, et les fautes d'orthographe pullulaient — passer à corriger un seul paragraphe prenait plus de temps que de le taper manuellement. Wispr Flow, lui, est différent. Il utilise l'IA pour comprendre le contexte de ce que vous dites, supprime automatiquement les mots de remplissage comme « euh » ou « bah », ajoute la ponctuation de manière intelligente, et adapte le format en fonction de l'application dans laquelle vous parlez.
Vous parlez dans Gmail, et il vous génère un e-mail bien formaté. Vous parlez dans Slack, et il vous produit un message court. La documentation produit liste même des scénarios de code, comme dicter du code dans VS Code ou Cursor, avec la capacité de distinguer la notation camelCase de la notation snake_case.
Des documents produits affirment que la latence peut être aussi faible qu'environ 500 millisecondes. La vitesse maximale annoncée par l'officiel est d'environ 220 WPM (mots par minute en anglais), tandis que les typistes expérimentés atteignent généralement entre 80 et 100 WPM.
La clé, c’est que cela s’exécute au niveau système. Fonctionne sur Mac, Windows et les téléphones. N’importe quelle application peut commencer à parler avec un simple raccourci clavier. Seulement quelques dollars par mois.
Alors de plus en plus de gens commencent à écrire avec leur bouche.

Selon des utilisateurs interviewés par le WSJ, certains ont acheté des écouteurs de jeu spécialement pour parler à l'IA, car les micros de ces écouteurs ont une portée de capture courte, ce qui permet de parler à voix basse sans être entendu par les personnes à proximité. D'autres ont acheté des pédales programmables qu'ils peuvent activer d'un simple coup de pied, évitant ainsi d'avoir à appuyer sur des touches raccourcies. Certains ont installé des micros en forme de cou de cygne sur leur bureau, positionnés à quelques centimètres de leur bouche, ce qui leur permet de parler en chuchotant.
Imaginez ce scénario. Un bureau ouvert, une dizaine de personnes, chacune devant un écran, la tête équipée d’un casque gaming et une micro à col de cygne à la bouche, toutes murmurant en chuchotant.
C'est vraiment comme un centre d'appels. Simplement un peu plus calme.
L'article de TechCrunch mentionne deux personnes spécifiques.
L’un des cofondateurs de Gusto est Edward Kim. Gusto est une entreprise américaine spécialisée dans les solutions SaaS pour la paie et les ressources humaines des entreprises, et elle est assez importante. Kim affirme qu’il ne tape désormais que lorsqu’il n’a pas le choix, le reste du temps, il parle uniquement. Il a informé son équipe que le bureau de l’avenir ressemblera « davantage à un département des ventes ».
Mais Kim admet aussi que parler devant un ordinateur en bureau est « un peu gênant ».
L’autre est l’entrepreneure en IA, Mollie Amkraut Mueller, qui avait pris l’habitude de travailler le soir chez elle en murmurant devant son ordinateur, ce qui a rendu son mari insupportable. Désormais, leur routine de travail nocturne consiste à s’asseoir séparément ou à ce qu’une personne aille dans le bureau.
Il n'arrive pas souvent qu'un produit technologique soit si pratique qu'il change la manière dont un couple passe ses soirées ensemble.
Le fondateur de Wispr, Tanay Kothari, ne se soucie guère de ces malaises. Dans un entretien, il a déclaré que tout cela deviendra un jour normal, tout comme quand nous regardions nos téléphones. Il y a une dizaine d'années, une personne qui regardait son téléphone en public était considérée comme impolie. Aujourd'hui, beaucoup ne trouvent plus cela étrange.
Parler à l'ordinateur est pareil, il pense que cela ne demande que du temps.
Frankement, il a peut-être raison. Mais la période de transition intermédiaire sera probablement très confuse.
Parce qu’une personne qui tape sur un clavier dans un bureau ouvert est inaudible pour les autres. Mais une personne qui chuchote dans un bureau ouvert, même à voix très basse, est encore entendue par les personnes à côté sous forme de murmures bourdonnants. Un ou deux individus, c’est acceptable ; mais une dizaine de personnes qui murmurent en même temps créent un environnement acoustique très étrange.

Selon le WSJ, certaines personnes commencent à porter des écouteurs à réduction de bruit pour bloquer les sons des collègues qui parlent à leur ordinateur.
Imaginez cette scène. A porte un casque de jeu et parle à son ordinateur, tandis que B porte un casque à réduction de bruit pour bloquer les sons provenant d’A. Les deux personnes sont assises à des postes de travail adjacents, ne voyant pas les oreilles l’une de l’autre, mais portant toutes deux un casque sur la tête, avec des usages totalement différents.
Cela mérite d'être discuté, car cela touche à des choses bien plus profondes qu'un simple outil d'efficacité.
Les modes d'interaction dominants dans le calcul grand public ont connu environ plusieurs grandes vagues. L'interface graphique et la souris ont caché la ligne de commande derrière les utilisateurs ordinaires, permettant à ceux qui ne comprennent pas le code d'utiliser un ordinateur. L'écran tactile a remplacé les touches, et l'iPhone a transformé le téléphone en un morceau de verre. Chaque changement dans les modes d'interaction ne se limite pas à une simple amélioration de la facilité d'utilisation ; il modifie la relation physique entre vous et l'appareil, et par conséquent, votre relation spatiale avec les personnes qui vous entourent.
Le clavier, l'écran et le poste de travail individuel renforcent l'attitude silencieuse et concentrée du bureau, où chacun est face à un écran, les mains sur le clavier, sans se déranger. Les écrans tactiles permettent de travailler depuis le canapé, le lit ou le métro, brouillant les frontières du bureau.
Si la voix devient vraiment le mode d'interaction dominant, l'environnement acoustique des bureaux deviendra quelque chose qui nécessitera une conception sérieuse. Des cabines insonorisées, des postes de travail vocaux privés, des zones acoustiques séparées — ces concepts qui semblent aujourd'hui un peu redondants pourraient devenir des éléments standard de la conception d'espaces de travail, tout comme chaque bureau dispose aujourd'hui d'une salle de réunion.
Bien sûr, cela ne signifie pas que tout le monde parlera à son ordinateur, mais que les espaces de travail devront prévoir des options pour la saisie vocale. Les normes sociales évolueront également. Quand peut-on parler à son ordinateur ? Quand faut-il revenir à la saisie au clavier ? Est-ce malpoli de murmurer à son ordinateur portable dans un café ? Ces questions n'ont pas encore de réponse, mais d'ici deux ou trois ans, des conventions pourraient s'établir.
Comme la courtoisie au téléphone en public. Personne ne l'a apprise, mais tout le monde le sait.
Le journaliste de TechCrunch Anthony Ha a laissé une phrase chargée d'émotion personnelle à la fin de son article. Il a déclaré qu'il avait autrefois souffert parce que son bureau avait été temporairement déplacé à côté du service des ventes, donc lorsqu'il a lu Edward Kim dire que les bureaux de l'avenir ressembleraient à des services des ventes, sa réaction a été : Oh no.
The fact that a tech journalist would write "Oh no" in a formal report is probably worth paying attention to.
