همه در دنیای هوش مصنوعی دربارۀ Manus صحبت می‌کنند. ما آن را آزمایش کردیم.

عامل هوش مصنوعی عمومی جدید چین با برخی مشکلات سیستمی و بارگذاری بیش از حد سرورها مواجه شد، اما بسیار شهودی است و نویدبخش آینده‌ای روشن برای دستیاران هوش مصنوعی است.

همه در دنیای هوش مصنوعی دربارۀ Manus صحبت می‌کنند. ما آن را آزمایش کردیم.
Image Credits: Stephanie Arnett/MIT Technology Review

از زمانی که عامل هوش مصنوعی عمومی Manus هفته گذشته معرفی شد، به‌سرعت در فضای آنلاین گسترش یافت. و این فقط در چین، جایی که توسط استارتاپ Butterfly Effect در ووهان توسعه یافته، محدود نمانده است. بلکه این ابزار به یکی از موضوعات داغ در سطح بین‌المللی تبدیل شده است و شخصیت‌های تأثیرگذار در حوزه فناوری، از جمله جک دورسی، یکی از بنیان‌گذاران توییتر، و ویکتور موستار، مدیر محصول Hugging Face، از عملکرد آن تمجید کرده‌اند. برخی حتی آن را «دیپ‌سیک دوم» نامیده‌اند، چرا که قابلیت‌های غیرمنتظره آن و همچنین منشأ آن یادآور مدل قبلی‌ای است که صنعت را غافلگیر کرد.

Manus ادعا می‌کند که اولین عامل هوش مصنوعی عمومی در جهان است که از چندین مدل هوش مصنوعی مختلف، مانند Claude 3.5 Sonnet از Anthropic و نسخه‌های اصلاح‌شده مدل Qwen از علی‌بابا، بهره می‌برد و همچنین از چندین عامل مستقل استفاده می‌کند که می‌توانند به‌طور خودکار وظایف مختلفی را انجام دهند. (این تفاوت اصلی آن با چت‌بات‌های مبتنی بر مدل‌های زبانی بزرگ مانند DeepSeek است که عمدتاً برای تعاملات مکالمه‌ای طراحی شده‌اند.)

دسترسی محدود به Manus و استقبال گسترده از آن

با وجود این حجم از هیاهو، افراد کمی توانسته‌اند آن را تجربه کنند. در حال حاضر، کمتر از ۱٪ از کاربران لیست انتظار توانسته‌اند کد دعوت دریافت کنند. (تعداد دقیق افراد در این لیست مشخص نیست، اما برای درک میزان علاقه، کافی است بدانید که کانال دیسکورد Manus بیش از ۱۸۶,۰۰۰ عضو دارد.)

MIT Technology Review موفق شد به این ابزار دسترسی پیدا کند. در آزمایش‌هایی که انجام دادم، احساس کردم کار با آن شبیه همکاری با یک کارآموز بسیار باهوش و کارآمد است: در برخی موارد، درک درستی از وظایف ندارد، گاهی فرض‌های نادرستی می‌سازد یا برای سرعت بخشیدن به کارها از برخی جزئیات می‌گذرد، اما در عین حال، استدلال‌هایش را شفاف توضیح می‌دهد، به طرز چشمگیری سازگار است و وقتی دستورالعمل‌های دقیقی دریافت کند، عملکردش بهبود می‌یابد. در مجموع، Manus ابزار امیدبخشی است، اما هنوز بی‌نقص نیست.

ویژگی‌ها و رابط کاربری Manus

مانند محصول قبلی شرکت Butterfly Effect، یعنی دستیار هوش مصنوعی Monica که در سال ۲۰۲۳ عرضه شد، Manus نیز برای یک مخاطب جهانی طراحی شده است. زبان پیش‌فرض آن انگلیسی است و طراحی آن ساده و مینیمالیستی است.

برای ورود، کاربران باید کد دعوت معتبر وارد کنند. سپس سیستم، آن‌ها را به صفحه اصلی هدایت می‌کند که شباهت زیادی به ChatGPT و DeepSeek دارد: در ستون سمت چپ، جلسات قبلی نمایش داده می‌شوند و در مرکز، کادر ورودی چت قرار دارد. در این صفحه، وظایف نمونه‌ای که توسط شرکت انتخاب شده‌اند، به نمایش گذاشته شده‌اند که شامل مواردی مانند توسعه استراتژی کسب‌وکار، یادگیری تعاملی، و جلسات مدیتیشن صوتی شخصی‌سازی‌شده می‌شوند.

مانند سایر ابزارهای هوش مصنوعی عامل‌محور، مانند ChatGPT DeepResearch، Manus قادر است وظایف را به چندین گام منطقی تقسیم کند و به‌طور مستقل در وب جستجو کند تا اطلاعات موردنیاز خود را جمع‌آوری کند. اما ویژگی خاص آن، پنجره "Manus’s Computer" است که به کاربران امکان می‌دهد نه‌تنها فعالیت‌های عامل را مشاهده کنند، بلکه در هر لحظه وارد عمل شده و در فرآیند آن مداخله کنند.

آزمایش Manus: سه وظیفه متفاوت

برای بررسی عملکرد Manus، سه کار مختلف به آن سپردم:

  1. تهیه فهرستی از خبرنگاران مطرح حوزه فناوری در چین
  2. جستجوی آپارتمان‌های دوخوابه در نیویورک
  3. نامزد کردن افراد برای لیست Innovators Under 35 (فهرستی که MIT Technology Review هرساله منتشر می‌کند)

وظیفه ۱: فهرست خبرنگاران چینی در حوزه فناوری

Manus در ابتدا فهرستی با فقط ۵ نام اصلی و ۵ نام به‌عنوان "ذکر افتخاری" ارائه کرد. در این لیست، برخی از خبرنگاران دارای توضیحات تکمیلی درباره آثارشان بودند، اما برخی دیگر نه. وقتی علت را جویا شدم، پاسخ آن جالب بود: "کمی تنبلی کردم!" در پاسخ گفت که برای سرعت بخشیدن به فرآیند تحقیق، از برخی جزئیات صرف‌نظر کرده است.

وقتی بر دقت و جامعیت اصرار کردم، Manus یک فهرست ۳۰ نفره شامل نام، رسانه‌ای که در آن فعالیت می‌کنند و آثار برجسته آن‌ها ارائه داد. همچنین یک ویژگی کاربردی دیگر این بود که خروجی را می‌توان در فرمت Word یا Excel دانلود کرد.

بااین‌حال، یک چالش اساسی وجود داشت: مشکلات دسترسی به مقالات خبرنگاران در پشت دیوارهای پرداختی (Paywall). Manus اغلب به CAPTCHA برخورد می‌کرد و در برخی سایت‌ها به‌عنوان یک فعالیت مشکوک شناسایی می‌شد. به نظر می‌رسد که در نسخه‌های آینده، این ابزار باید راهی برای دور زدن این موانع یا درخواست کمک از کاربر در چنین مواقعی داشته باشد.

وظیفه ۲: جستجوی آپارتمان در نیویورک

ابتدا Manus تعاریف مبهمی مانند «فضای باز» را بسیار محدود تفسیر کرد و تنها املاکی را ارائه داد که تراس یا بالکن خصوصی داشتند. اما با ارائه راهنمایی‌های بیشتر، توانست یک لیست جامع‌تر و مفیدتر ارائه دهد که دارای دسته‌بندی‌هایی مانند "بهترین انتخاب کلی"، "بهترین گزینه اقتصادی"، و "گزینه لوکس" بود.

این کار کمتر از ۳۰ دقیقه زمان برد، که بسیار سریع‌تر از تهیه لیست خبرنگاران بود.

وظیفه ۳: نامزدهای Innovators Under 35

این وظیفه بسیار پیچیده‌تر بود و Manus برای یافتن ۵۰ نامزد، فرآیند را به چند مرحله تقسیم کرد:

  • تحلیل فهرست‌های سال‌های گذشته
  • تدوین استراتژی جستجو
  • شناسایی و بررسی سوابق نامزدها

بااین‌حال، پس از سه ساعت جستجو در اینترنت، فقط سه نام با اطلاعات کامل ارائه داد. وقتی درخواست فهرست ۵۰ نفره کردم، برخی از حوزه‌ها به‌طرز نامتوازن‌تری نمایان شدند، نشان‌دهنده یک فرآیند تحقیق ناقص.

نتیجه‌گیری: آیا Manus ارزش استفاده دارد؟

Manus یک ابزار بسیار شهودی است که برای کاربران فنی و غیرتکنیکی مناسب است. در دو مورد از سه وظیفه عملکردی بهتر از ChatGPT DeepResearch داشت، اما زمان بیشتری برای انجام کارها نیاز داشت.

بااین‌حال، مشکلاتی مانند کرش‌های مکرر، محدودیت‌های پردازش متن‌های طولانی، و نیاز به بهبود زیرساخت‌های سرور از نقاط ضعف آن هستند. طبق گزارش رسانه ۳۶Kr، هزینه هر وظیفه برای Manus حدود ۲ دلار است، یعنی یک‌دهم هزینه DeepResearch. اگر تیم Manus زیرساخت‌های خود را بهبود ببخشد، می‌تواند به گزینه‌ای جذاب برای حرفه‌ای‌های حوزه فناوری، توسعه‌دهندگان مستقل، و تیم‌های کوچک تبدیل شود.


Credits: "Everyone in AI is talking about Manus. We put it to the test" By Caiwei Chen, published in MIT Technology Review.

Read the full article here: https://www.technologyreview.com/2025/03/11/1113133/manus-ai-review/