Văn phòng tại Thung lũng Silicon đón nhận việc thì thầm với máy tính khi công nghệ giọng nói ngày càng phổ biến

iconMetaEra
Chia sẻ
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconTóm tắt

expand icon
Các văn phòng ở Thung lũng Silicon đang chứng kiến sự gia tăng nhân viên thì thầm với máy tính, nhờ các công cụ như Wispr Flow. Sự thay đổi này tăng hiệu quả nhưng cũng đặt ra những lo ngại về tiếng ồn và chuẩn mực xã hội. Một số công ty đang bổ sung vật liệu cách âm để quản lý xu hướng này. Trong khi các altcoin đáng chú ý đang thu hút sự quan tâm, chỉ số sợ hãi và tham lam vẫn là thước đo quan trọng cho cảm xúc thị trường.
Nếu giọng nói thực sự trở thành phương thức tương tác chính thống, môi trường âm học của văn phòng sẽ trở thành một thứ cần được thiết kế một cách nghiêm túc.

Tác giả bài viết, nguồn: Lão Bàn Chủ, Cyber Last Train

Gần đây, WSJ đã đăng một bài báo có tiêu đề dịch ra khoảng như sau: “Việc gõ phím đang bị thì thầm thay thế, và điều này phiền phức hơn bạn nghĩ.”

TechCrunch đã theo dõi chủ đề này. Nhà báo Anthony Ha đã viết một bài bình luận ngắn, mở đầu bằng cảm nhận của một nhà đầu tư mạo hiểm cho rằng hiện nay khi đến văn phòng các công ty khởi nghiệp ở Thung lũng Silicon, ông cảm thấy như bước vào một trung tâm gọi điện cao cấp.

Lý do là ngày càng nhiều người trong văn phòng thì thầm trước màn hình máy tính.

Không phải gọi điện, không phải họp, cũng không phải trò chuyện với đồng nghiệp. Một người ngồi lặng lẽ tại bàn làm việc, thì thầm vào màn hình. Đôi khi người đó nói về email, đôi khi là mã nguồn, đôi khi là tin nhắn Slack. Bàn phím thỉnh thoảng vang lên một tiếng, nhưng phần lớn thời gian, trên bàn làm việc chỉ còn lại những lời thì thầm nhẹ nhàng.

Hình ảnh này nếu được đặt vào năm năm trước, có lẽ sẽ bị coi là dấu hiệu cảnh báo về trạng thái tinh thần. Nhưng tại một số công ty khởi nghiệp ở Thung lũng Silicon năm 2026, điều này bắt đầu trở nên phổ biến.

Động lực thúc đẩy điều này là một loại công cụ mới. Đại diện tiêu biểu nhất là Wispr Flow.

Nó không phải là chuyển đổi giọng nói thành văn bản theo nghĩa truyền thống. Trước đây, các công cụ ghi âm giọng nói sẽ ghi lại chính xác những gì bạn nói, bạn phải tự nói ra dấu câu, lỗi chính tả đầy màn hình, thời gian sửa lỗi sau một đoạn nói còn lâu hơn cả việc gõ phím. Wispr Flow thì khác. Nó sử dụng AI để hiểu ngữ cảnh lời nói của bạn, tự động loại bỏ các từ cảm thán như “ừm”, “thì”, tự động thêm dấu câu, đồng thời điều chỉnh định dạng dựa trên ứng dụng bạn đang sử dụng.

Bạn nói chuyện trong Gmail, nó sẽ tạo ra một email được định dạng chuẩn chỉnh. Bạn nói chuyện trong Slack, nó sẽ tạo ra một tin nhắn ngắn gọn. Ngay cả trong tài liệu sản phẩm, các ngữ cảnh mã cũng được liệt kê, ví dụ như nói mã trong VS Code hoặc Cursor, nó có thể phân biệt giữa đặt tên camelCase và snake_case.

Có tài liệu sản phẩm cho biết độ trễ có thể thấp tới khoảng 500 miligiây. Tốc độ nói tối đa được quảng bá chính thức là khoảng 220 WPM (từ tiếng Anh mỗi phút), trong khi người gõ chữ thành thạo thường chỉ đạt từ 80 đến 100 WPM.

Quan trọng là thứ này chạy ở cấp độ hệ thống. Có thể dùng được trên Mac, Windows và điện thoại. Bất kỳ ứng dụng nào, chỉ cần nhấn phím tắt là có thể bắt đầu nói. Mỗi tháng chỉ khoảng vài chục đô la.

Vì vậy, ngày càng nhiều người bắt đầu viết bằng miệng.

Theo các người dùng được WSJ phỏng vấn, có người đã mua tai nghe chơi game để nói chuyện với AI, vì mic của tai nghe chơi game có khoảng cách thu âm ngắn, phù hợp để nói nhỏ mà không bị người bên cạnh nghe thấy. Có người mua bàn đạp lập trình được, chỉ cần dùng chân đạp một cái là kích hoạt Wispr mà không cần dùng tay nhấn phím tắt. Còn có người lắp đặt mic cổ thiên nga trên bàn làm việc, uốn cong đến cách miệng vài centimet, như vậy chỉ cần thì thầm là đủ.

Hãy tưởng tượng cảnh này. Một văn phòng mở, hàng chục người, mỗi người trước mặt một màn hình, đeo tai nghe game, trên miệng một chiếc mic cổ thiên nga, tất cả đều thì thầm bằng thì thầm.

Thật sự giống trung tâm gọi đến. Chỉ yên tĩnh hơn một chút.

Bài báo của TechCrunch đề cập đến hai cá nhân cụ thể.

Một trong những người đồng sáng lập Gusto là Edward Kim. Gusto là một công ty Mỹ chuyên về phần mềm SaaS cho lương doanh nghiệp và nhân sự, quy mô không nhỏ. Kim cho biết hiện tại anh chỉ gõ phím khi bắt buộc, còn lại toàn bộ thời gian đều dùng giọng nói. Anh thông báo với đội ngũ rằng văn phòng tương lai sẽ nghe giống như một bộ phận bán hàng.

Nhưng Kim cũng thừa nhận rằng việc nói chuyện trước máy tính trong văn phòng suốt thời gian dài “khá ngượng ngùng”.

Một người khác là doanh nhân AI Mollie Amkraut Mueller. Cô đã hình thành thói quen làm việc vào ban đêm tại nhà, thì thầm với máy tính, khiến chồng cô không chịu nổi. Bây giờ, chế độ làm việc khuya của họ đã thay đổi thành việc hai người ngồi cách xa nhau, hoặc một người chuyển sang phòng làm việc.

Việc một sản phẩm công nghệ hữu ích đến mức thay đổi cách vợ chồng tương tác vào ban đêm không phải chuyện thường xảy ra.

Người sáng lập Wispr, Tanay Kothari, không quá quan tâm đến những tình huống lúng túng này. Trong một cuộc phỏng vấn, anh nói rằng tất cả những điều này cuối cùng sẽ trở nên bình thường, giống như khi chúng ta từng nhìn chằm chằm vào điện thoại. Cách đây hơn một thập kỷ, việc một người cúi đầu lướt điện thoại nơi công cộng được coi là bất lịch sự. Bây giờ, nhiều người đã không còn thấy điều đó kỳ lạ nữa.

Nói chuyện với máy tính cũng vậy, anh ấy cho rằng điều đó chỉ cần thời gian.

Nói thẳng ra, anh ấy có thể đúng. Nhưng giai đoạn chuyển tiếp ở giữa sẽ rất hỗn loạn.

Vì khi một người gõ phím trong văn phòng mở, người khác không nghe thấy. Nhưng khi một người thì thầm trong văn phòng mở, dù đã hạ thấp nhất có thể, người bên cạnh vẫn nghe được tiếng rì rầm rền rền. Một hai người thì còn đỡ, nhưng nếu có mười mấy người cùng lúc thì thầm, môi trường âm học sẽ rất kỳ lạ.

The WSJ báo cáo rằng đã có người bắt đầu đeo tai nghe chống ồn để chặn tiếng nói của đồng nghiệp hướng về máy tính.

Hãy tưởng tượng cảnh này. A đeo tai nghe chơi game và nói chuyện với máy tính, trong khi B đeo tai nghe chống ồn để chặn âm thanh từ A nói. Hai người ngồi ở hai bàn làm việc cạnh nhau, không nhìn thấy tai của nhau, nhưng mỗi người đều đeo một cặp tai nghe trên đầu với mục đích hoàn toàn khác nhau.

Điều này đáng để bàn luận vì nó chạm đến những thứ sâu sắc hơn nhiều so với một công cụ hiệu quả.

Các hình thức tương tác chính trong tính toán đại chúng đã trải qua vài làn sóng lớn. Giao diện đồ họa và chuột đã giấu các lệnh dòng lệnh sau lưng người dùng thông thường, giúp những người không biết mã có thể sử dụng máy tính. Màn hình cảm ứng đã thay thế các nút bấm, và iPhone đã biến điện thoại thành một mảnh kính. Mỗi sự thay đổi trong hình thức tương tác đều không chỉ đơn thuần là “dễ sử dụng hơn”, mà còn thay đổi mối quan hệ vật lý giữa bạn và thiết bị, từ đó thay đổi mối quan hệ không gian giữa bạn và những người xung quanh.

Bàn phím, màn hình và vị trí làm việc cá nhân củng cố tư thế yên lặng trước màn hình trong văn phòng, mỗi người đối diện một màn hình, tay đặt trên bàn phím, không làm phiền nhau. Màn hình cảm ứng cho phép mọi người làm việc trên ghế sofa, trên giường, hoặc trên tàu điện ngầm, làm mờ ranh giới của văn phòng.

Nếu giọng nói thực sự trở thành phương thức tương tác chính, môi trường âm học trong văn phòng sẽ trở thành một yếu tố cần được thiết kế cẩn thận. Những khái niệm hiện nay nghe có vẻ thừa thãi như buồng cách âm, bàn làm việc cá nhân có khả năng cách âm, và phân vùng âm học có thể trở thành tiêu chuẩn trong thiết kế không gian văn phòng, giống như ngày nay mọi văn phòng đều có phòng họp.

Tất nhiên, điều này không có nghĩa là mọi người sẽ đều nói chuyện khi làm việc, mà không gian làm việc cần có tùy chọn hỗ trợ nhập liệu bằng giọng nói. Văn hóa giao tiếp xã hội cũng sẽ thay đổi theo. Khi nào thì có thể nói chuyện với máy tính? Khi nào nên quay lại gõ phím? Liệu có phải bất lịch sự khi thì thầm với laptop ở quán cà phê? Những câu hỏi này hiện chưa có câu trả lời, nhưng trong hai đến ba năm tới có thể sẽ hình thành những quy ước phổ biến.

Giống như phép lịch sự khi gọi điện nơi công cộng. Không ai dạy, nhưng mọi người đều biết.

Nhà báo của TechCrunch, Anthony Ha, đã để lại một câu mang cảm xúc cá nhân ở cuối bài viết. Anh nói rằng mình từng chịu ảnh hưởng nghiêm trọng vì bàn làm việc bị chuyển sang cạnh bộ phận bán hàng, nên khi thấy Edward Kim nói rằng văn phòng tương lai sẽ giống như bộ phận bán hàng, phản ứng của anh là: Oh no.

Xu hướng để một nhà báo công nghệ viết “Oh no” trong bài báo chính thức có lẽ đáng để quan tâm.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể được lấy từ bên thứ ba và không nhất thiết phản ánh quan điểm hoặc ý kiến của KuCoin. Nội dung này chỉ được cung cấp cho mục đích thông tin chung, không có bất kỳ đại diện hay bảo đảm nào dưới bất kỳ hình thức nào và cũng không được hiểu là lời khuyên tài chính hay đầu tư. KuCoin sẽ không chịu trách nhiệm về bất kỳ sai sót hoặc thiếu sót nào hoặc về bất kỳ kết quả nào phát sinh từ việc sử dụng thông tin này. Việc đầu tư vào tài sản kỹ thuật số có thể tiềm ẩn nhiều rủi ro. Vui lòng đánh giá cẩn thận rủi ro của sản phẩm và khả năng chấp nhận rủi ro của bạn dựa trên hoàn cảnh tài chính của chính bạn. Để biết thêm thông tin, vui lòng tham khảo Điều khoản sử dụngTiết lộ rủi ro của chúng tôi.