যদি কথা প্রকৃতপক্ষে প্রধান ইন্টারেকশন পদ্ধতি হয়ে উঠে, তবে অফিসের শ্রবণমূলক পরিবেশ একটি গুরুত্বপূর্ণভাবে ডিজাইন করার প্রয়োজনীয়তা হয়ে উঠবে।
লেখক, উৎস: লাও বানজু, সাইবার লাস্ট কল
সাম্প্রতিক সময়ে WSJ একটি প্রতিবেদন প্রকাশ করেছে, যার শিরোনামটি অনুবাদ করলে হয় প্রায় “টাইপিংয়ের পরিবর্তে ফিসফিসানো চলে আসছে, এবং এটি আপনার চেয়েও বেশি বিরক্তিকর”।

টেকক্রাঞ্চ এই বিষয়টি অনুসরণ করেছে। পত্রিকাকর অ্যানথনি হা একটি সংক্ষিপ্ত মন্তব্য লিখেছেন, যার শুরুতে একজন ভিসি-এর অনুভূতির উদ্ধৃতি দেওয়া হয়েছে, যিনি বলেছেন যে এখন তিনি সিলিকন ভ্যালির স্টার্টআপের অফিসে যান, যেন একটি উচ্চমানের কলসেন্টারের ভিতরে প্রবেশ করছেন।
কারণ হলো, অফিসে ক্রমাগত বেশি মানুষ কম্পিউটারের দিকে মুখ করে ফিসফিস করছে।
ফোন করা নয়, মিটিং করা নয়, সহকর্মীদের সাথে কথা বলা নয়। একজন ব্যক্তি তার ডেস্কে বসে, কম্পিউটার স্ক্রিনের দিকে মুখ করে, কম গলায় কথা বলছে। কখনও কখনও ইমেইল, কখনও কোড, কখনও Slack মেসেজ। কিছুক্ষণের জন্য কীবোর্ডের শব্দ হয়, কিন্তু বেশিরভাগ সময় ডেস্কের উপরে হালকা ফিসফিসানির মতো শব্দ ভাসছে।
এই দৃশ্যটি যদি পাঁচ বছর আগে দেখা যেত, তাহলে এটিকে কোনও মানসিক অবস্থার সতর্কবার্তা হিসেবে বিবেচনা করা হত। কিন্তু ২০২৬ সালের কিছু সিলিকন ভ্যালি স্টার্টআপে এটি ধীরে ধীরে সাধারণ হয়ে উঠছে।
এটি চালানো হচ্ছে এক ধরনের নতুন টুল দিয়ে। সবচেয়ে প্রতিনিধিত্বকারীটি হল উইস্পার ফ্লো।
এটি প্রাচীন ধরনের ভয়েস-টু-টেক্সট নয়। অতীতের এই ভয়েস ডিক্টেশনে, আপনি যা বলেন, তাই লেখা হত, প্রতিক্রিয়া চিহ্নগুলি আপনাকে নিজে বলতে হত, ভুল বানানের প্রচুর পরিমাণ ছড়িয়ে পড়ত, একটি বাক্য শেষ করতেই ভুল সংশোধনের সময়টি টাইপিংয়ের চেয়েও বেশি হয়ে যেত। Wispr Flow এর কথা একটু ভিন্ন। এটি AI-এর সাহায্যে আপনার কথার প্রসঙ্গকে বুঝতে পারে, “এম”, “ওই”-এর মতো অপ্রয়োজনীয় শব্দগুলি স্বয়ংক্রিয়ভাবে সরিয়ে ফেলে, স্বয়ংক্রিয়ভাবে বিরামচিহ্ন যোগ করে, এবং আপনি যে অ্যাপটিতে কথা বলছেন, তার ভিত্তিতে ফরম্যাটিংও সামঞ্জস্য করে।
আপনি গুগল মেইলে কথা বলেন, এটি আপনাকে একটি সুসংগঠিত ইমেইল তৈরি করে দেয়। আপনি স্ল্যাকে কথা বলেন, এটি আপনাকে একটি সংক্ষিপ্ত বার্তা দেয়। পণ্য ডকুমেন্টেশনে কোডিং সিনারিওও উল্লেখ করা হয়েছে, যেমন VS Code বা Cursor-এ কথা বলে কোড লিখলে এটি ক্যামেলকেস এবং স্নেককেস নামকরণ চিনতে পারে।
একটি পণ্যের তথ্য অনুযায়ী, দেরি প্রায় 500 মিলিসেকেন্ড পর্যন্ত কম। অফিসিয়ালি ঘোষিত সর্বোচ্চ বক্তৃতা গতি প্রায় 220 WPM (প্রতি মিনিটে ইংরেজি শব্দ), যেখানে দক্ষ টাইপিস্টদের সাধারণত 80 থেকে 100 WPM দেখা যায়।
মূল বিষয় হলো, এটি সিস্টেম লেভেলে চলে। Mac, Windows, মোবাইল—সবগুলোতেই ব্যবহার করা যায়। যেকোনো অ্যাপে, একটি শর্টকাট কী চাপলেই এটি কথা বলা শুরু করবে। প্রতি মাসে কয়েকদশ ডলার।
তাই আরও বেশি মানুষ মুখ দিয়ে কিছু লিখতে শুরু করেছে।

WSJ-এর সাক্ষাতকারে বলা হয়েছে, কিছু ব্যক্তি গেমিং হেডফোন কিনেছেন যাতে AI-এর সাথে কথা বলতে পারেন, কারণ গেমিং হেডফোনের মাইক্রোফোন সংবেদনশীলতা কম, যাতে কম গলায় কথা বললে পাশের লোকেরা শুনতে না পায়। কিছু ব্যক্তি প্রোগ্রামযোগ্য ফুট প্যাড কিনেছেন, যাতে একবার পা চাপলেই Wispr সক্রিয় হয়, কীবোর্ডের শর্টকাট চাপার দরকার হয় না। আবার কিছু ব্যক্তি তাদের ডেস্কের উপর একটি জিওর্জিয়ান মাইক্রোফোন স্থাপন করেছেন, যা তাদের মুখের কয়েক সেন্টিমিটারের কাছে বাঁকিয়ে রাখা হয়েছে, যাতে শুধুমাত্র ফুসফুসের শব্দেই কথা বলা যায়।
একটি ওপেন অফিসের দৃশ্য কল্পনা করুন। ডজন পাঁচেক মানুষ, প্রত্যেকের সামনে একটি স্ক্রিন, মাথায় গেমিং হেডফোন, মুখের পাশে একটি ক্র্যান্ক মাইক্রোফোন, সবাই ফিসফিস করে কথা বলছে।
এটা প্রকৃতপক্ষে কল সেন্টারের মতো। শুধু কিছুটা শান্ত।
টেকক্রঞ্চের প্রতিবেদনে দুইজন ব্যক্তির উল্লেখ করা হয়েছে।
একজন হলেন গাস্টোর সহ-প্রতিষ্ঠাতা এডওয়ার্ড কিম। গাস্টো হল মার্কিন যুক্তরাষ্ট্রের একটি বড় কোম্পানি যা কর্পোরেট বেতন এবং মানবসম্পদ SaaS প্রদান করে। কিম বলেছেন যে তিনি এখন শুধুমাত্র অপরিহার্য পরিস্থিতিতেই টাইপ করেন, অন্যথায় সময়ের বেশিরভাগই কথা বলে কাটান। তিনি তাদের দলকে বলেছেন যে ভবিষ্যতের অফিসটি শুনতে "বিক্রয় বিভাগের মতো" হবে।
কিন্তু কিম নিজেই স্বীকার করেছেন যে অফিসে কম্পিউটারের দিকে কথা বলা একটু অস্বস্তিকর।
অন্যটি হলো এআই উদ্যোক্তা মলি আমক্রাউট মুলার। তিনি রাতে বাড়িতে কম্পিউটারের সামনে কম গলায় কথা বলে কাজ করার অভ্যাস করেছিলেন, যার ফলে তাঁর স্বামী সহ্য করতে পারেননি। এখন তাদের রাতের কাজের পদ্ধতি হয়ে গেছে দুজনে আলাদা আলাদা জায়গায় বসা, অথবা একজন বইয়ের ঘরে চলে যাওয়া।
একটি প্রযুক্তি পণ্য এমনভাবে কাজ করে যে এটি স্বামী-স্ত্রীর রাতের মিলনকে পরিবর্তন করে দেয়, এটি প্রায়শই ঘটে না।
উইস্প্রের প্রতিষ্ঠাতা তানয় কোথারি এই অস্বস্তিকর পরিস্থিতিগুলির প্রতি খুব কম মনোযোগ দেন। তিনি একটি সাক্ষাত্কারে বলেছেন, এটি সবসময় স্বাভাবিক হয়ে যাবে, যেমনটি আমরা আগে মোবাইল ফোনের দিকে তাকানোর সময় হয়েছিল। দশকের শুরুতে, পাবলিক জায়গায় মোবাইল ফোনের দিকে তাকানোকে অসভ্য বলা হত। এখন অনেকেই এটিকে অদ্ভুত মনে করে না।
কম্পিউটারের দিকে কথা বলাও একই বিষয়, তিনি মনে করেন এটি শুধু সময়ের প্রয়োজন।
সৎ হয়ে বলছি, সে হয়তো ঠিক। কিন্তু মধ্যবর্তী সংক্রমণ পর্যায়টি খুব বিশৃঙ্খল হবে।
একজন ব্যক্তি ওপেন অফিসে টাইপ করলে অন্যরা শুনতে পায় না। কিন্তু একজন ব্যক্তি ওপেন অফিসে কম্পন করে কথা বললে, যদিও সর্বনিম্ন স্তরে চাপা দেওয়া হয়, পাশের মানুষগুলো এখনও সেই গুঞ্জনের মতো ফিসফিসানি শুনতে পায়। এক-দুইজন হলে ঠিক আছে, কিন্তু দশটিরও বেশি মানুষ একসাথে ফিসফিসাচ্ছে, তখন শ্রবণমূলক পরিবেশটি খুবই অদ্ভুত হয়ে যায়।

WSJ-এর একটি প্রতিবেদন অনুযায়ী, কিছু মানুষ তাদের সহকর্মীদের কম্পিউটারের দিকে কথা বলার শব্দ বন্ধ করতে নয়েস ক্যানসেলিং হেডফোন পরছে।
এই দৃশ্যটি কল্পনা করুন। A একটি গেমিং হেডফোন পরে কম্পিউটারের দিকে কথা বলছে, B একটি নয়েস-ক্যানসেলিং হেডফোন পরে A-এর কথা বাতিল করছে। দুজনেই পাশাপাশি ডেস্কে বসে, একে অপরের কান দেখতে পাচ্ছে না, কিন্তু প্রত্যেকের মাথায় একটি করে হেডফোন পরা, যার উদ্দেশ্য সম্পূর্ণ ভিন্ন।
এটি আলোচনার মূল্যবান কারণ এটি শুধু একটি দক্ষতা টুলের চেয়ে অনেক বেশি কিছুকে স্পর্শ করে।
সাধারণ কম্পিউটিংয়ের প্রধান ইন্টারফেস প্রায় কয়েকটি বড় ঢেউয়ের মধ্যে দিয়ে গেছে। গ্রাফিক্যাল ইন্টারফেস এবং মাউস কমান্ড লাইনকে সাধারণ ব্যবহারকারীদের পিছনে লুকিয়ে রেখেছে, যাতে কোড না জানা মানুষও কম্পিউটার ব্যবহার করতে পারে। টাচস্ক্রিন বোতামকে প্রতিস্থাপন করেছে, iPhone-এর মাধ্যমে মোবাইল একটি কাচের টুকরোতে পরিণত হয়েছে। প্রতিটি ইন্টারঅ্যাকশন পদ্ধতির পরিবর্তন শুধুমাত্র “ব্যবহার করা সহজতর” হওয়ার চেয়েও বেশি, এটি আপনার এবং ডিভাইসের মধ্যকার ভৌত সম্পর্ককে পরিবর্তন করে, ফলে আপনি এবং আপনার চারপাশের মানুষদের মধ্যকার স্থানিক সম্পর্কও পরিবর্তিত হয়।
কীবোর্ড, স্ক্রিন এবং ব্যক্তিগত কাজের জায়গা নিঃশব্দ স্ক্রিনের অফিসের মুখোমুখি অবস্থানকে শক্তিশালী করে, প্রত্যেকে একটি স্ক্রিনের সামনে বসে, হাতগুলো কীবোর্ডের উপরে রেখে, একে অপরকে বিরক্ত করে না। টাচস্ক্রিন মানুষকে সোফায়, বিছানায়, মেট্রোতে কাজ করতে দেয়, যার ফলে অফিসের সীমানা ধুপচায়।
যদি ভয়েস প্রকৃতপক্ষে প্রধান ইন্টারেকশন মাধ্যম হয়ে উঠে, তবে অফিসের শব্দ পরিবেশ একটি গুরুত্বপূর্ণভাবে ডিজাইন করার প্রয়োজনীয়তা হয়ে উঠবে। শব্দ-বিচ্ছিন্ন ক্যাবিন, ব্যক্তিগত ভয়েস স্টেশন, শব্দ-বিভাজন—এই সব বর্তমানে অপ্রয়োজনীয় মনে হওয়া ধারণাগুলি হয়তো অফিস স্পেস ডিজাইনের স্ট্যান্ডার্ড অংশ হয়ে উঠবে, যেমন আজকাল প্রতিটি অফিসেই মিটিং রুম থাকে।
অবশ্যই, এর অর্থ এই নয় যে প্রত্যেকেই কথা বলে কাজ করবে, বরং অফিস স্পেসগুলিকে ভয়েস ইনপুটের জন্য বিকল্প রাখতে হবে। এবং সামাজিক আচরণও পরিবর্তিত হবে। কখন আপনি কম্পিউটারের দিকে কথা বলতে পারবেন? কখন আপনাকে টাইপিং-এ ফিরে আসা উচিত? ক্যাফেতে ল্যাপটপের দিকে ফুসফুস করা অসভ্যতা কি? এই প্রশ্নগুলির এখন কোনো উত্তর নেই, কিন্তু আরও দুই-তিন বছরের মধ্যে এগুলির জন্য সাধারণভাবে গৃহীত নিয়ম হয়ে উঠতে পারে।
যেমন পাবলিক জায়গায় ফোন করার আচরণ। কেউ শেখায়নি, কিন্তু সবাই জানতে শুরু করেছে।
টেকক্রঞ্চের পত্রিকাকর অ্যানথনি হা লেখার শেষে একটি ব্যক্তিগত আবেগযুক্ত মন্তব্য রেখেছেন। তিনি বলেছেন যে তিনি একসময় তাঁর কাজের টেবিল সেলস বিভাগের পাশে স্থানান্তরিত হওয়ার কারণে ব্যাপকভাবে ক্ষতির শিকার হয়েছিলেন, তাই যখন তিনি এডওয়ার্ড কিমকে বলতে শুনলেন যে ভবিষ্যতের অফিসগুলি সেলস বিভাগের মতো হবে, তখন তাঁর প্রতিক্রিয়া ছিল, ওহ নো।
একজন প্রযুক্তি পত্রিকাকর্মী যদি একটি আনুষ্ঠানিক প্রতিবেদনে 'Oh no' ট্রেন্ড লিখে থাকে, তাহলে এটি দেখার মতো।
