মাইক্রোসফট ফারা-7B চালু করেছে, কম্পিউটার কাজের জন্য প্রথম 7B-প্যারামিটার এজেন্ট মডেল

iconKuCoinFlash
শেয়ার
Share IconShare IconShare IconShare IconShare IconShare IconCopy
AI summary iconসারাংশ

expand icon
অন-চেইন সংবাদ প্রকাশিত হয়েছে, যখন মাইক্রোসফট তাদের প্রথম 7B-প্যারামিটার মডেল Fara-7B প্রকাশ করেছে, যা কম্পিউটার কাজের জন্য তৈরি। এটি Qwen 2.5-VL (7B) এর উপর ভিত্তি করে তৈরি, যা 128k কনটেক্সট সমর্থন করে এবং 64টি H100 GPU-এ 2.5 দিন প্রশিক্ষণ দেওয়া হয়েছে। এই মডেলটি স্ক্রিনশট এবং টেক্সট প্রক্রিয়াকরণ করতে পারে, চিন্তার শৃঙ্খল এবং কাজগুলি পূর্বানুমান করতে পারে। এটি বুকিং এবং ভ্রমণ পরিকল্পনা সহ কাজগুলি পরিচালনা করতে পারে। ব্যক্তিগত তথ্য প্রবেশের মতো গুরুত্বপূর্ণ ধাপগুলিতে নিরাপত্তা ফিচারগুলি স্থগিত করে। Fara-7B 24শে নভেম্বর, 2025-এ MIT লাইসেন্সের অধীনে প্রকাশিত হবে। ক্রিপ্টো সংবাদের বৃত্তগুলি DeFi এবং ব্লকচেইন টুলগুলিতে এর সম্ভাব্য একীভূতকরণের জন্য দৃষ্টি রাখছে।

AIMPACT বার্তা, ১৬ মে (UTC+8), মাইক্রোসফ্ট ফারা-7B চালু করেছে, যা তাদের প্রথম 7B প্যারামিটারের স্মার্ট ল্যাঙ্গুয়েজ মডেল যা কম্পিউটার ব্যবহারের জন্য ডিজাইন করা হয়েছে। এই মডেলটি মাল্টিমোডাল ডিকোডার আর্কিটেকচার ব্যবহার করে, যা স্ক্রিনশট ইমেজ এবং টেক্সট কনটেক্সট গ্রহণ করে, এবং প্যারামিটারসহ থিংকিং চেইন এবং অপারেশন অ্যাকশনগুলির পূর্বানুমান করে। Qwen 2.5-VL (7B) এর উপর ভিত্তি করে তৈরি, 128k কনটেক্সট লংথ সমর্থন করে, 64টি H100 GPU-এ 2.5 দিন প্রশিক্ষণ দেওয়া হয়েছে, এবং ২০২৫ সালের ২৪ নভেম্বর MIT লাইসেন্সের অধীনে প্রকাশিত হয়েছে। Fara-7B স্ক্রিনশট-অনুভূত ব্রাউজার ইনপুটকে গ্রহণ করে, অভ্যন্তরীণ যুক্তি এবং ইতিহাসের অবস্থা রেকর্ডিংয়ের সংমিশ্রণে পরবর্তী অপারেশন এবং প্যারামিটার (যেমন: ক্লিক কোঅর্ডিনেট) পূর্বানুমান করে, যা বড়-স্কেল, সম্পূর্ণভাবে-সিনথেটিক ডেটাসেটেরউপর নির্ভরশীল। মডেলটি উচ্চ-স্তরের কাজগুলি (যেমন: রেস্টুরেন্ট বুকিং, চাকরির আবেদন, ভ্রমণের পরিকল্পনা) পরিকল্পনা এবং বাস্তবায়ন করতে পারে। সুরক্ষা-সমন্বয়ের জন্য, এটি দৃঢ়-পোস্ট-ট্রেইনিংয়ের পদ্ধতি ব্যবহার করে, 7টি ব্যবহার-নীতি-লঙ্ঘনকারী টাস্ককে अস্বীকার करতে,এবং 128k context length, 64 H100 GPUs, 2.5 days training, MIT license on Nov 24, 2025. Fara-7B accepts screenshot-aware browser inputs, combining internal reasoning and historical state records to predict next actions and parameters (e.g., click coordinates), trained on a large-scale fully synthetic dataset. The model can plan and execute high-level tasks such as booking a restaurant, applying for a job, or planning a trip. For safety alignment, it employs robust post-training methods with keypoint recognition capabilities to reject seven categories of policy-violating tasks and pause operations at critical stopping points like entering personal information or completing purchases. Users can deploy and interact with the model via GitHub repository, vllm, and fara-cli tools, primarily for automating web tasks. (Source: InFoQ)

দাবিত্যাগ: এই পৃষ্ঠার তথ্য তৃতীয় পক্ষের কাছ থেকে প্রাপ্ত হতে পারে এবং অগত্যা KuCoin এর মতামত বা মতামত প্রতিফলিত করে না। এই বিষয়বস্তু শুধুমাত্র সাধারণ তথ্যগত উদ্দেশ্যে প্রদান করা হয়, কোন ধরনের প্রতিনিধিত্ব বা ওয়ারেন্টি ছাড়াই, বা এটিকে আর্থিক বা বিনিয়োগ পরামর্শ হিসাবে বোঝানো হবে না। KuCoin কোনো ত্রুটি বা বাদ পড়ার জন্য বা এই তথ্য ব্যবহারের ফলে যে কোনো ফলাফলের জন্য দায়ী থাকবে না। ডিজিটাল সম্পদে বিনিয়োগ ঝুঁকিপূর্ণ হতে পারে। আপনার নিজের আর্থিক পরিস্থিতির উপর ভিত্তি করে একটি পণ্যের ঝুঁকি এবং আপনার ঝুঁকি সহনশীলতা সাবধানে মূল্যায়ন করুন। আরও তথ্যের জন্য, অনুগ্রহ করে আমাদের ব্যবহারের শর্তাবলী এবং ঝুঁকি প্রকাশ পড়ুন।