اوپناِیآی مدل استدلالی جدید o3-mini را بهصورت رایگان عرضه کرد
اوپنایآی بهتازگی مدل استدلالی o3-mini را منتشر کرده است که نسبت به نسخۀ قبلی خود سریعتر، ارزانتر و دقیقتر است.

روز پنجشنبه، مایکروسافت اعلام کرد که مدل استدلالی o1 اوپنایآی را برای کاربران Copilot فعال کرده است و حالا اوپنایآی مدل استدلالی جدید o3-mini را در اختیار کاربران نسخه رایگان ChatGPT قرار داده است. این اولین باری است که عموم کاربران به یکی از مدلهای استدلالی اوپنایآی دسترسی پیدا میکنند، چرا که این مدلها پیشتر فقط در بستههای پولی Pro و Plus ارائه میشدند.
مدلهای استدلالی چیستند و چه تفاوتی دارند؟
مدلهای استدلالی از روشی به نام "زنجیره تفکر" (Chain of Thought) برای تولید پاسخ استفاده میکنند. در این روش، مدل مرحلهبهمرحله یک مسئله را پردازش میکند و در حین حل آن، میتواند اشتباهات خود را شناسایی و اصلاح کند. این فرایند باعث دقت و عمق بیشتر پاسخها میشود، اما در عین حال، ممکن است منجر به زمان انتظار طولانیتر برای ارائه پاسخ شود. بااینحال، اوپنایآی ادعا میکند که o3-mini نسبت به o1-mini حدود ۲۴٪ سریعتر پاسخ میدهد.
چه کسانی میتوانند از این مدل استفاده کنند؟
مدلهای استدلالی برای حل مسائل پیچیده ایدهآل هستند. اگر با مسائل پیشرفته ریاضی و منطقی سروکار دارید یا مدلهای قبلی در پاسخدهی به درخواستهای دقیق و پیچیده شما با مشکل مواجه بودهاند، میتوانید o3-mini را امتحان کنید. برای استفاده از این مدل، کافی است هنگام ارسال درخواست در ChatGPT، گزینه "Reason" را انتخاب کنید.
هزینه بالای مدلهای استدلالی
هرچند این مدلها قابلیتهای جدیدی ارائه میدهند، اما هزینه اجرای آنها بالاست. مدل o1-mini اوپنایآی ۲۰ برابر گرانتر از مدل غیر استدلالی GPT-4o mini است. با این حال، اوپنایآی اعلام کرده که مدل جدید o3-mini در مقایسه با o1-mini ۶۳٪ ارزانتر است. بااینحال، هزینه اجرای آن همچنان ۷ برابر بیشتر از GPT-4o mini است و ۱.۱۰ دلار برای هر یک میلیون توکن ورودی هزینه دارد.
رقابت با DeepSeek
این مدل جدید درست پس از معرفی مدل DeepSeek منتشر شده است، مدلی که کمتر از دو هفته پیش موج جدیدی در دنیای هوش مصنوعی ایجاد کرد. DeepSeek عملکردی در حد مدلهای برتر اوپنایآی دارد، اما شرکت چینی سازنده ادعا میکند که فقط با ۶ میلیون دلار هزینه آموزش داده شده، در حالی که هزینه تخمینی آموزش GPT-4 بیش از ۱۰۰ میلیون دلار برآورد شده است. البته، این ادعا با شک و تردیدهایی مواجه شده است.
علاوه بر این، مدل استدلالی DeepSeek فقط ۰.۵۵ دلار برای هر یک میلیون توکن ورودی هزینه دارد، که نصف قیمت o3-mini است. این نشان میدهد که اوپنایآی هنوز راه درازی برای کاهش هزینههای خود در پیش دارد. همچنین، تخمین زده میشود که مدلهای استدلالی به دلیل پردازشهای سنگینتر، مصرف انرژی بیشتری نسبت به سایر مدلها داشته باشند.
چالشهای مدلهای استدلالی
موج جدید مدلهای استدلالی چالشهای جدیدی در زمینه ایمنی نیز به همراه دارد. اوپنایآی برای مدلهای سری o از روشی به نام "ترازسازی مبتنی بر تأمل" (Deliberative Alignment) استفاده کرده است که باعث میشود این مدلها در هر مرحله از استدلال خود به سیاستهای داخلی اوپنایآی مراجعه کنند تا از رعایت قوانین اطمینان حاصل شود.
بااینحال، اوپنایآی دریافته که o3-mini، مشابه مدل o1، در دور زدن محدودیتها و چالشهای بسیار قویتر از مدلهای غیر استدلالی عمل میکند. درواقع، کنترل یک مدل استدلالی به دلیل تواناییهای پیشرفتهاش بسیار دشوارتر است.
مدل o3-mini اولین مدل اوپنایآی است که رتبۀ "ریسک متوسط" در زمینه خودمختاری دریافت کرده است. این رتبه به این دلیل داده شده که این مدل در برخی وظایف کدنویسی عملکرد بهتری از خود نشان داده است که میتواند پتانسیل بیشتری برای بهبود خودکار و تسریع تحقیقات هوش مصنوعی ایجاد کند. بااینحال، این مدل همچنان در تحقیقات علمی دنیای واقعی عملکرد ضعیفی دارد. اگر در این زمینه هم پیشرفت میکرد، در دستۀ "ریسک بالا" قرار میگرفت و احتمالاً اوپنایآی از انتشار عمومی آن جلوگیری میکرد.
Credit: "OpenAI releases its new o3-mini reasoning model for free" By Scott J Mulligan, published in MIT Technology Review
Read full article here: https://www.technologyreview.com/2025/01/31/1110757/openai-makes-its-reasoning-model-for-free/
Credit Image: Photo Illustration by Sarah Rogers / MITTR | Photo Getty