إذا أصبح الصوت حقًا وسيلة تفاعلية سائدة، فستصبح البيئة الصوتية للمكاتب شيئًا يتطلب تصميمًا جادًا.
كاتب المقال، المصدر: لابانزهو، سيبرو آخير قطار
نشرت وول ستريت جورنال مؤخرًا تقريرًا بعنوان مترجم تقريبًا: "يتم استبدال الكتابة بالهمس، وهذا أكثر إزعاجًا مما تعتقد".

تتبّع TechCrunch هذا الموضوع. كتب المراسل أنثوني ها مقالًا قصيرًا، افتتحه باقتباس عن شعور أحد مستثمري رأس المال المخاطر أنه عندما يزور مكاتب الشركات الناشئة في سيليكون فالي، يشعر وكأنه يدخل مركز اتصالات فاخر.
السبب هو أن عددًا متزايدًا من الأشخاص في المكتب يهمسون أمام أجهزة الكمبيوتر.
ليس مكالمة هاتفية، ولا اجتماع، ولا محادثة مع زميل. بل شخص جالس على مكتبه، يخفض صوته وهو يتحدث إلى الشاشة. أحيانًا يتحدث عن بريد إلكتروني، وأحيانًا عن كود، وأحيانًا عن رسالة على Slack. أحيانًا يُسمع صوت لوحة المفاتيح، لكن في الغالب، يعلو فوق المكتب همس خفيف.
إذا كان هذا المشهد موجودًا قبل خمس سنوات، لكان يُعتبر تحذيرًا من حالة نفسية ما. لكن في بعض شركات ستارتاوب في سيليكون فالي عام 2026، بدأ يصبح شائعًا.
الشيء الذي يدفع هذا الأمر هو نوع جديد من الأدوات. الأكثر تمثيلاً هو Wispr Flow.
إنه ليس تحويل صوتي إلى نص بالمعنى التقليدي. في الماضي، كان التحويل الصوتي يكتب ما تقوله حرفيًا، وكان عليك أن تنطق علامات الترقيم بنفسك، وتكاد تكون الأخطاء الإملائية تملأ الشاشة، لدرجة أن وقت تصحيح الجملة كان أطول من وقت الكتابة نفسها. لكن Wispr Flow مختلف. فهو يستخدم الذكاء الاصطناعي لفهم سياق كلامك، ويحذف تلقائيًا كلمات مثل "إي" و"ذلك" وغيرها من الكلمات التعبيرية، ويضيف علامات الترقيم تلقائيًا، كما أنه يضبط التنسيق بناءً على التطبيق الذي تتحدث فيه.
أنت تتحدث في Gmail، ويوفر لك رسالة بريد إلكتروني منسقة بشكل جيد. أنت تتحدث في Slack، ويوفر لك رسالة قصيرة. حتى وثائق المنتج تسرد سيناريوهات الكود، مثل التحدث بالصوت أثناء كتابة الكود في VS Code أو Cursor، ويمكنه التمييز بين تسمية CamelCase وunderscore_case.
تُشير المواد المنتجة إلى أن التأخير يصل إلى حوالي 500 مللي ثانية. يُعلن الرسمياً أن أقصى سرعة كلام تبلغ حوالي 220 كلمة في الدقيقة، بينما تبلغ السرعة الشائعة لدى الكتّاب المهرة عادةً بين 80 و100 كلمة في الدقيقة.
المفتاح هو أن هذا البرنامج يعمل على مستوى النظام، ويمكن استخدامه على Mac وWindows والهواتف. أي تطبيق، بمجرد الضغط على مفتاح اختصار، يمكنه البدء في التحدث. بسعر بضعة عشر دولارات شهريًا.
لذلك يبدأ عدد متزايد من الناس في الكتابة باستخدام أفواههم.

وفقًا لمقابلات مع مستخدمين من WSJ، اشترى بعض الأشخاص سماعات ألعاب مخصصة للتحدث مع الذكاء الاصطناعي، لأن ميكروفونات سماعات الألعاب تلتقط الصوت من مسافة قصيرة، مما يجعلها مناسبة للتحدث بهمس دون أن يسمعهم الآخرون المجاورون. واشترى آخرون لوحة أقدام قابلة للبرمجة، بحيث يمكن تفعيل Wispr بخطوة واحدة على القدم دون الحاجة إلى الضغط على مفاتيح اختصار يدويًا. كما وضع بعض المستخدمين ميكروفونًا بعنق غ goose على مكاتبهم، وثبّتوه على بعد بضعة سنتيمترات من أفواههم، بحيث يكفي التحدث بهمس خفيف.
تخيل هذا المشهد. مكتب مفتوح، عشرات الأشخاص، كل واحد أمامه شاشة، ويرتدي سماعات ألعاب على رأسه، وmicrophone معلق بعنق على فمه، وكلهم يهمسون بخفّة.
إنها تشبه حقًا مركز المكالمات. فقط أكثر هدوءًا قليلاً.
ذكر تقرير TechCrunch شخصين محددين.
أحد المؤسسين المشاركين لـ Gusto هو إدوارد كيم. Gusto هي شركة أمريكية متخصصة في حلول SaaS لرواتب الشركات وإدارة الموارد البشرية، وهي شركة كبيرة. يقول كيم إنه الآن لا يكتب إلا عندما يضطر، ويعتمد في بقية الوقت على الكلام فقط. أخبر فريقه أن المكتب المستقبلي سيبدو «أكثر مثل قسم المبيعات».
لكن كيم اعترفت أيضًا بأن التحدث أمام الكمبيوتر في المكتب "مُحرج قليلاً".
الآخر هو رائدة الأعمال في مجال الذكاء الاصطناعي مولي أمكراوت مولر. لقد تعودت على العمل ليلاً في المنزل وهي تتحدث بصوت منخفض أمام الكمبيوتر، مما جعل زوجها لا يحتمل ذلك. الآن، أصبحت طريقة عملهما في الليل تتضمن الجلوس منفصلين، أو أن أحدهما يذهب إلى المكتبة.
ليس من الشائع أن يصبح منتج تقني بحيث يغيّر طريقة تفاعل الزوجين ليلاً.
لا يهتم تاناي كوثاري، مؤسس Wispr، كثيرًا بهذه المواقف المحرجة. قال في مقابلة إن كل هذا سيصبح طبيعيًا في النهاية، تمامًا كما كان الحال عندما كنا نحدق في هواتفنا. قبل أكثر من عقد من الزمان، كان يُنظر إلى شخص ينظر إلى هاتفه في مكان عام على أنه غير مهذب. الآن، لا يجد الكثيرون ذلك غريبًا على الإطلاق.
التحدث إلى الكمبيوتر ينطبق عليه نفس الشيء، فهو يعتقد أن الأمر يتطلب فقط وقتًا.
بصراحة، ربما يكون محقًا. لكن فترة الانتقال بينهما ستكون مربكة للغاية.
لأن شخصًا يطابق في مكتب مفتوح، لا يمكن للآخرين سماعه. لكن عندما يهمس شخص في مكتب مفتوح، حتى بأدنى مستوى ممكن، لا يزال الأشخاص المجاورون يستطيعون سماع ذلك الهمس الزئيري. إذا كان شخصًا أو اثنين، فهذا جيد، لكن عندما يكون هناك عشرات الأشخاص يهمسون في نفس الوقت، فإن البيئة الصوتية ستكون غريبة جدًا.

وفقًا لـ WSJ، بدأ بعض الأشخاص في ارتداء سماعات إلغاء الضوضاء لعزل أصوات الزملاء وهم يتحدثون إلى أجهزة الكمبيوتر.
فكّر في هذا المشهد. A يرتدي سماعة ألعاب ويتحدث إلى الكمبيوتر، بينما B يرتدي سماعات إلغاء الضوضاء لحجب صوت A. يجلس الشخصان على مكاتب متجاورة، ولا يرى كل منهما أذني الآخر، لكن كلاهما يرتدي سماعات على رأسه، ولكل منهما غرض مختلف.
هذا الأمر يستحق المناقشة لأنه يلامس أشياء أعمق بكثير من مجرد أداة كفاءة.
شهدت طرق التفاعل السائدة في الحوسبة العامة عدة موجات كبيرة. حيث أخفت الواجهة الرسومية والفأرة سطر الأوامر خلف المستخدم العادي، مما مكن الأشخاص غير الملمين بالبرمجة من استخدام الحواسيب. واستبدلت الشاشات اللمسية الأزرار، وحوّلت iPhone الهواتف إلى قطعة زجاجية. وكل تغيير في طريقة التفاعل لا يقتصر فقط على "سهولة الاستخدام"، بل يغير العلاقة المادية بينك وبين الجهاز، وبالتالي يغير العلاقة المكانية بينك وبين من حولك.
اللوحة المفاتيح والشاشة ومحطة العمل الشخصية عززت وضعية المكتب الهادئة ذات الشاشات المواجهة، حيث يواجه كل شخص شاشة واحدة ويضع يديه على لوحة المفاتيح دون إزعاج الآخرين. جعلت الشاشات اللمسية من الممكن العمل على الأريكة أو السرير أو في المترو، مما أدى إلى تلاشي حدود المكتب.
إذا أصبح الصوت حقًا وسيلة تفاعل سائدة، فسيصبح بيئة الصوت في المكاتب شيئًا يتطلب تصميمًا جادًا. قد تصبح مفاهيم مثل الأقسام العازلة للصوت، ومحطات العمل الصوتية الخاصة، والتقسيمات الصوتية، التي تبدو حاليًا غير ضرورية، معيارًا أساسيًا في تصميم المساحات المكتبية، تمامًا كما توجد غرف اجتماعات في كل مكتب اليوم.
بالطبع، هذا لا يعني أن الجميع سيتحدثون أثناء العمل، بل أن مساحات العمل تحتاج إلى توفير خيارات لإدخال الصوت. كما أن آداب السلوك الاجتماعي ستتغير أيضًا. متى يمكن التحدث إلى الكمبيوتر؟ ومتى يجب العودة إلى الكتابة؟ هل يعد الت mumbling أمام جهاز كمبيوتر محمول في مقهى غير لائق؟ لا توجد إجابات لهذه الأسئلة حاليًا، لكن ربما ستتشكل قواعد متفق عليها خلال سنتين أو ثلاث سنوات.
مثل آداب استخدام الهاتف في الأماكن العامة. لم يُعلّم أحد، لكن الجميع عرفوا.
ترك الصحفي من TechCrunch، أنتوني ها، جملة تحمل مشاعر شخصية في نهاية المقال. قال إنه تعرض سابقًا لأذى كبير بسبب نقل مكتبه مؤقتًا بجانب قسم المبيعات، لذا عندما رأى إدوارد كيم يقول إن مكاتب المستقبل ستكون مثل قسم المبيعات، كان رد فعله: أوه لا.
أن تتمكن محررة تكنولوجيا من كتابة "Oh no" في تقرير رسمي، فهذا على الأرجح يستحق الانتباه.
