Jika suara benar-benar menjadi cara interaksi utama, lingkungan akustik kantor akan menjadi sesuatu yang perlu dirancang dengan serius.
Penulis artikel, sumber: Lao Ban Zhu, Cyber Last Train
Baru-baru ini, WSJ menerbitkan sebuah laporan, judulnya diterjemahkan kira-kira: "Mengetik Sedang Digantikan oleh Bisikan, dan Ini Lebih Mengganggu dari yang Anda Bayangkan."

TechCrunch melanjutkan topik ini. Jurnalis Anthony Ha menulis sebuah komentar singkat yang membuka dengan mengutip persepsi seorang VC bahwa sekarang ketika ia mengunjungi kantor startup di Silicon Valley, rasanya seperti memasuki pusat panggilan premium.
Alasannya, semakin banyak orang di kantor yang berbisik-bisik ke arah komputer.
Bukan menelepon, bukan rapat, bukan berbicara dengan rekan kerja. Seseorang duduk di meja kerjanya, berbisik pelan ke arah layar. Kadang-kadang ia berbicara tentang email, kadang-kadang tentang kode, kadang-kadang tentang pesan Slack. Papan ketik sesekali berbunyi, tetapi lebih sering, yang mengambang di atas meja kerja adalah bisikan lembut.
Gambar ini jika diletakkan lima tahun lalu, kemungkinan besar akan dianggap sebagai peringatan kondisi psikologis. Namun di beberapa perusahaan rintisan Silicon Valley pada tahun 2026, hal ini mulai menjadi hal yang umum.
Yang mendorong hal ini adalah sejenis alat baru. Yang paling representatif disebut Wispr Flow.
Ini bukan transkripsi suara ke teks tradisional. Dulu, transkripsi suara begitu—apa yang kamu ucapkan akan langsung ditulis, tanda baca harus kamu sebutkan sendiri, typo menyebar di mana-mana, dan waktu yang kamu habiskan untuk memperbaiki kesalahan justru lebih lama daripada mengetiknya. Wispr Flow berbeda. Ia menggunakan AI untuk memahami konteks ucapanmu, secara otomatis menghilangkan kata penghubung seperti “eh” atau “itu”, menambahkan tanda baca secara otomatis, serta menyesuaikan format berdasarkan aplikasi tempat kamu berbicara.
Ketika Anda berbicara di Gmail, ia menghasilkan email yang diformat dengan rapi. Ketika Anda berbicara di Slack, ia menghasilkan pesan singkat. Bahkan dalam dokumentasi produk, skenario kode juga dicantumkan, misalnya mengucapkan kode di VS Code atau Cursor, ia dapat membedakan antara penamaan camelCase dan snake_case.
Produk tersebut mengklaim latensi dapat mencapai sekitar 500 milidetik. Klaim resmi menyatakan kecepatan ucapan maksimum sekitar 220 WPM (kata bahasa Inggris per menit), sedangkan pengetik yang terampil biasanya hanya mencapai 80 hingga 100 WPM.
Kuncinya, ini berjalan di tingkat sistem. Bisa digunakan di Mac, Windows, dan ponsel. Setiap aplikasi, cukup tekan tombol pintas untuk mulai berbicara. Hanya beberapa belas dolar per bulan.
Jadi semakin banyak orang yang mulai menulis dengan mulut mereka.

Menurut wawancara WSJ dengan pengguna, ada yang membeli headset game khusus untuk berbicara dengan AI, karena mikrofon headset game memiliki jangkauan penerimaan suara yang pendek, cocok untuk berbicara dengan suara pelan tanpa didengar orang di sebelah. Ada yang membeli pedal yang dapat diprogram, sehingga cukup menekan pedal dengan kaki untuk mengaktifkan Wispr tanpa perlu menyentuh tombol pintas. Ada juga yang memasang mikrofon leher angsa di meja kerja, ditekuk hingga beberapa sentimeter dari mulut, sehingga cukup berbicara dengan suara bisikan.
Bayangkan adegan ini. Sebuah kantor terbuka, puluhan orang, masing-masing memiliki satu layar di depan mereka, memakai headset game di kepala, dan mikrofon leher angsa di mulut, semua berbisik pelan-pelan.
Memang sangat mirip dengan pusat panggilan. Hanya saja lebih tenang.
Artikel TechCrunch menyebutkan dua orang tertentu.
Salah satunya adalah Edward Kim, co-founder Gusto, sebuah perusahaan AS yang menyediakan solusi SaaS untuk gaji perusahaan dan sumber daya manusia, yang cukup besar. Kim mengatakan bahwa sekarang ia hanya mengetik jika benar-benar diperlukan, dan di waktu lain sepenuhnya mengandalkan suara. Ia memberi tahu timnya bahwa kantor masa depan akan terdengar 「lebih seperti departemen penjualan」.
Namun Kim sendiri mengakui bahwa terus berbicara ke komputer di kantor, 「agak memalukan».
Yang lain adalah pengusaha AI, Mollie Amkraut Mueller. Ia membiasakan diri bekerja di rumah pada malam hari sambil berbicara pelan-pelan ke arah komputer, hingga suaminya tidak tahan. Kini, rutinitas kerja larut malam mereka berubah menjadi duduk terpisah, atau salah satu dari mereka pergi ke ruang kerja.
Sesuatu yang produk teknologi membuat cara pasangan suami istri berinteraksi di malam hari berubah, bukan hal yang sering terjadi.
Pendiri Wispr, Tanay Kothari, tidak terlalu peduli dengan kecanggungan ini. Dalam wawancara, ia mengatakan bahwa semua ini pada akhirnya akan menjadi normal, seperti ketika kita dulu memandang ponsel. Beberapa belas tahun lalu, seseorang yang menunduk memainkan ponsel di tempat umum dianggap tidak sopan. Sekarang, banyak orang tidak lagi merasa aneh.
Berbicara ke komputer juga sama, ia merasa ini hanya butuh waktu.
Secara jujur, dia mungkin benar. Tetapi periode transisi di tengahnya kemungkinan besar akan sangat kacau.
Karena seseorang yang mengetik di kantor terbuka tidak akan terdengar oleh orang lain. Namun, jika seseorang berbisik di kantor terbuka, bahkan sekalipun suaranya ditekan seminimal mungkin, orang di sebelahnya tetap bisa mendengar desisan samar-samar. Satu atau dua orang mungkin masih bisa ditoleransi, tetapi jika belasan orang berbisik secara bersamaan, lingkungan akustiknya akan menjadi sangat aneh.

Menurut WSJ, beberapa orang telah mulai memakai headphone noise-cancelling untuk menghalangi suara rekan kerja yang berbicara ke komputer.
Bayangkan adegan ini. A memakai headset game dan berbicara ke komputer, sementara B memakai headset noise-cancelling untuk memblokir suara A. Keduanya duduk di meja kerja bersebelahan, tidak bisa melihat telinga satu sama lain, tetapi masing-masing memakai headset di kepala mereka dengan tujuan yang berbeda.
Hal ini layak dibahas karena menyentuh hal yang jauh lebih dalam daripada sekadar alat efisiensi.
Cara interaksi utama dalam komputasi massal telah mengalami beberapa gelombang besar. Antarmuka grafis dan mouse menyembunyikan baris perintah di belakang pengguna biasa, memungkinkan orang yang tidak mengerti kode untuk menggunakan komputer. Layar sentuh menggantikan tombol fisik, dan iPhone mengubah ponsel menjadi sekeping kaca. Setiap perubahan cara interaksi tidak hanya berarti "lebih mudah digunakan", tetapi juga mengubah hubungan fisik Anda dengan perangkat, yang pada gilirannya mengubah hubungan spasial Anda dengan orang-orang di sekitar Anda.
Keyboard, layar, dan meja kerja pribadi memperkuat postur kantor yang tenang dengan setiap orang menghadap satu layar, tangan di atas keyboard, tanpa mengganggu satu sama lain. Layar sentuh memungkinkan orang bekerja di sofa, tempat tidur, atau di kereta bawah tanah, sehingga batas kantor menjadi kabur.
Jika suara benar-benar menjadi cara interaksi utama, lingkungan akustik kantor akan menjadi sesuatu yang perlu dirancang dengan serius. Kabin kedap suara, tempat kerja suara pribadi, dan pembagian akustik—konsep-konsep yang saat ini terdengar agak berlebihan—mungkin akan menjadi standar dalam desain ruang kantor, seperti halnya setiap kantor saat ini memiliki ruang rapat.
Tentu, ini tidak berarti setiap orang akan berbicara saat bekerja, tetapi ruang kerja perlu menyediakan opsi untuk input suara. Etika sosial juga akan berubah. Kapan boleh berbicara ke komputer? Kapan sebaiknya kembali mengetik? Apakah bergumam ke laptop di kafe dianggap tidak sopan? Pertanyaan-pertanyaan ini saat ini belum memiliki jawaban, tetapi dalam dua atau tiga tahun mendatang mungkin akan muncul aturan yang menjadi kebiasaan umum.
Seperti etika berbicara di tempat umum. Tidak ada yang mengajarkan, tetapi semua orang tahu.
Jurnalis TechCrunch, Anthony Ha, meninggalkan satu kalimat penuh emosi pribadi di akhir artikelnya. Ia mengatakan bahwa dirinya pernah menderita karena meja kerjanya dipindahkan ke samping departemen penjualan, jadi ketika ia melihat Edward Kim mengatakan bahwa kantor masa depan akan seperti departemen penjualan, reaksinya adalah, Oh no.
Tren yang membuat seorang jurnalis teknologi menulis "Oh no" dalam laporan resminya, kemungkinan besar patut diperhatikan.
