Jika suara benar-benar menjadi cara interaksi utama, persekitaran akustik pejabat akan menjadi sesuatu yang perlu direka dengan serius.
Penulis artikel, sumber: Lao Ban Zhu, Cyber Last Train
Baru-baru ini, WSJ menerbitkan satu laporan, dengan judul yang diterjemahkan kira-kira sebagai "Mengetik Sedang Digantikan oleh Bisikan, dan Ini Lebih Mengganggu Daripada yang Anda Bayangkan".

TechCrunch mengikuti topik ini. Jururwati Anthony Ha menulis ulasan ringkas, yang membuka dengan petikan perasaan seorang VC yang mengatakan bahawa kini apabila dia pergi ke pejabat perusahaan rintisan di Silicon Valley, dia merasa seperti memasuki pusat panggilan mewah.
Sebab semakin ramai orang di pejabat berbisik-bisik di hadapan komputer.
Bukan telefon, bukan mesyuarat, bukan bercakap dengan rakan sekerja. Seseorang duduk di meja kerjanya, menurunkan suara, berbicara ke arah skrin. Kadang-kadang dia berbicara tentang e-mel, kadang-kadang tentang kod, kadang-kadang tentang mesej Slack. Papan kekunci kadang-kadang berbunyi sekejap, tetapi lebih sering, udara di atas meja kerja itu dipenuhi bisikan lembut.
Gambar ini jika diletakkan lima tahun yang lalu, mungkin akan dianggap sebagai tanda peringatan keadaan psikis. Tetapi di beberapa syarikat mulaan Silicon Valley pada tahun 2026, ia mulai menjadi biasa.
Yang mendorong perkara ini ialah satu jenis alat baru. Yang paling terkenal ialah Wispr Flow.
Ia bukan penghijrahan suara ke teks secara tradisional. Dalam masa lalu, penghijrahan suara itu—apa yang anda katakan akan ditulis secara langsung, tanda baca perlu dinyatakan secara lisan, dan penuh dengan kesalahan ejaan; masa yang dihabiskan untuk memperbaiki kesalahan selepas satu perenggan lebih lama daripada menaipnya. Wispr Flow berbeza. Ia menggunakan AI untuk memahami konteks ucapan anda, secara automatik menghapuskan perkataan seperti “eh”, “itu”, dan sebagainya, menambah tanda baca secara automatik, serta menyesuaikan format mengikut aplikasi tempat anda berbicara.
Anda berbicara di Gmail, ia menghasilkan e-mel yang diformat dengan rapi. Anda berbicara di Slack, ia menghasilkan mesej ringkas. Dokumentasi produk bahkan menyenaraikan skrip kod, seperti mengucapkan kod di VS Code atau Cursor, ia dapat membezakan penamaan camelCase dan snake_case.
Bahan produk menyatakan latensi boleh mencapai sekitar 500 milisaat. Iklan rasmi menyatakan kelajuan ucapan tertinggi sekitar 220 WPM (kata Inggeris per minit), manakala pengetik yang mahir biasanya mencapai 80 hingga 100 WPM.
Kuncinya, ini berjalan pada aras sistem. Boleh digunakan di Mac, Windows, dan telefon. Setiap aplikasi, tekan pintasan untuk memulakan ucapan. Hanya beberapa belas dolar sebulan.
Jadi, semakin ramai orang mulai menulis dengan mulut mereka.

Menurut pengguna yang diwawancarai oleh WSJ, ada yang membeli headset permainan khusus untuk berbicara dengan AI, kerana mikrofon headset permainan mempunyai jarak penangkapan suara yang pendek, sesuai untuk berbisik tanpa didengar oleh orang di sebelah. Ada yang membeli pedal boleh atur, di mana cukup dengan menekan kaki untuk mengaktifkan Wispr tanpa perlu menyentuh pintasan. Ada juga yang memasang mikrofon leher angsa di meja kerja, membengkokkannya beberapa sentimeter dari mulut, sehingga cukup berbicara dengan suara bisikan.
Bayangkan adegan ini. Sebuah pejabat terbuka, puluhan orang, setiap orang memiliki satu skrin di hadapan mereka, memakai headset permainan di kepala, dan sebatang mikrofon leher angsa di mulut, semua berbisik-bisik dengan suara pelan.
Memang sangat menyerupai pusat panggilan. Hanya lebih tenang sedikit.
Artikel TechCrunch menyebut dua individu tertentu.
Salah satunya ialah Edward Kim, rakan penubuh Gusto. Gusto ialah sebuah syarikat AS yang menyediakan perangkat lunak SaaS untuk gaji dan sumber manusia perusahaan, yang bukanlah kecil. Kim mengatakan bahawa sekarang dia hanya menaip apabila terpaksa, dan selebihnya bergantung sepenuhnya kepada suara. Dia memberitahu pasukannya bahawa pejabat masa depan akan kedengaran 「lebih seperti bahagian jualan」.
Namun, Kim sendiri mengakui bahawa berterus-terang kepada komputer di pejabat, 「agak malu».
Yang lain ialah pengusaha AI, Mollie Amkraut Mueller. Dia membiasakan diri bekerja sambil berbisik ke arah komputer di rumah pada malam hari, sehingga suaminya tidak tahan. Kini, rutin kerja malam mereka berubah menjadi duduk terpisah, atau salah seorang pergi ke ruang kerja.
Tidak sering berlaku bahawa satu produk teknologi sebegitu cekap sehingga mengubah cara pasangan suami isteri berinteraksi pada waktu malam.
Pendiri Wispr, Tanay Kothari, tidak terlalu peduli dengan kekacauan ini. Dalam temu bualnya, beliau berkata, semua ini akhirnya akan menjadi biasa, seperti ketika kita dahulu memandang telefon bimbit. Puluh tahun yang lalu, seseorang yang menunduk memeriksa telefon di tempat awam dianggap tidak sopan. Kini, ramai orang tidak lagi menganggapnya aneh.
Bercakap kepada komputer juga sama, dia rasa ini hanya memerlukan masa.
Secara jujur, dia mungkin betul. Tetapi tempoh peralihan di tengah-tengahnya kemungkinan besar akan sangat kacau.
Kerana seseorang menaip di pejabat terbuka, orang lain tidak akan mendengar. Tetapi jika seseorang berbisik di pejabat terbuka, walaupun direndahkan ke tahap paling rendah, orang di sebelahnya masih boleh mendengar desisan berbisik itu. Satu atau dua orang masih boleh ditoleransi, tetapi jika sepuluh orang berbisik serentak, persekitaran akustiknya akan menjadi sangat aneh.

Menurut WSJ, ada orang yang telah memulai penggunaan earphone penyerap bunyi untuk menghalang suara rakan sekerja yang berbicara kepada komputer.
Bayangkan adegan ini. A memakai headset permainan dan berbicara ke komputer, sementara B memakai headset penolak bunyi untuk menghalang suara A. Keduanya duduk di meja bersebelahan, tidak dapat melihat telinga satu sama lain, tetapi masing-masing memakai headset di kepala mereka dengan tujuan yang berbeza.
Perkara ini layak dibincangkan kerana ia menyentuh sesuatu yang jauh lebih mendalam daripada sekadar alat kecekapan.
Cara interaksi utama dalam pengkomputeran awam telah melalui beberapa gelombang besar. Antaramuka grafik dan tetikus menyembunyikan baris arahan di belakang pengguna biasa, membolehkan orang yang tidak memahami kod untuk menggunakan komputer. Skrin sentuh menggantikan butang, dan iPhone menjadikan telefon sebagai sekeping kaca. Setiap perubahan dalam cara interaksi bukan sekadar "lebih mudah digunakan", ia mengubah hubungan fizikal anda dengan peranti, dan seterusnya mengubah hubungan ruang anda dengan orang lain di sekeliling anda.
Papan kekunci, skrin, dan meja kerja peribadi memperkuat postur pejabat yang tenang, di mana setiap orang menghadap satu skrin, tangan diletakkan di atas papan kekunci, tanpa mengganggu satu sama lain. Skrin sentuh membolehkan orang bekerja di sofa, katil, atau kereta bawah tanah, mengaburkan sempadan pejabat.
Jika suara benar-benar menjadi cara interaksi utama, persekitaran akustik pejabat akan menjadi sesuatu yang perlu direka dengan serius. Kabin bunyi, tempat kerja suara peribadi, dan zon akustik, konsep-konsep yang kelihatan agak berlebihan pada masa ini, mungkin akan menjadi piawaian dalam reka bentuk ruang pejabat, seperti setiap pejabat hari ini mempunyai ruang mesyuarat.
Tentu, ini tidak bermaksud setiap orang akan berbicara semasa bekerja, tetapi ruang pekerjaan perlu menyediakan pilihan untuk input suara. Etika sosial juga akan berubah. Kapan boleh berbicara kepada komputer? Kapan sepatutnya kembali mengetik? Adakah berbisik kepada laptop di kafe dianggap tidak sopan? Masalah-masalah ini belum mempunyai jawapan sekarang, tetapi dalam dua atau tiga tahun ke depan mungkin akan ada peraturan yang menjadi lazim.
Seperti etika ber telefon di tempat awam. Tiada yang mengajar, tetapi semua orang tahu.
Jurnalis TechCrunch, Anthony Ha, meninggalkan satu pernyataan penuh emosi peribadi di akhir artikelnya. Dia mengatakan bahawa dahulu dia pernah menderita kerana meja kerjanya dipindahkan bersebelahan dengan jabatan jualan, jadi apabila dia melihat Edward Kim mengatakan bahawa pejabat masa depan akan menjadi seperti jabatan jualan, reaksinya ialah, Oh no.
Trend yang membolehkan seorang jururakam teknologi menulis "Oh no" dalam laporan rasmi, mungkin patut diperhatikan.
