به گزارش ایسنا، مدل «O3-pro» یک نسخه از هوش مصنوعی استدلالی o3 شرکت «اوپنایآی»(OpenAI) است که این شرکت در اوایل سال جاری میلادی معرفی کرد. برخلاف مدلهای مرسوم هوش مصنوعی، مدلهای استدلالی گامبهگام مسائل را بررسی میکنند و این امر آنها را قادر میسازد تا عملکرد قابل اعتمادتری در حوزههایی مانند فیزیک، ریاضی و کدنویسی داشته باشند.
به نقل از تک کرانچ، مدل O3-pro از روز سهشنبه برای کاربران «Pro» و «Team» چتبات «چتجیپیتی»(ChatGPT) در دسترس قرار گرفته و جایگزین مدل «o1-pro» شده است. اوپنایآی میگوید کاربران سازمانی و آموزشی نیز هفته بعد به این مدل دسترسی خواهند داشت. همچنین، O3-pro از بعد از ظهر سهشنبه در API توسعهدهندگان اوپنایآی فعال شده است.
قیمت O3-pro در API اوپنایآی، ۲۰ دلار به ازای هر یک میلیون توکن ورودی و ۸۰ دلار به ازای هر یک میلیون توکن خروجی است. توکنهای ورودی، توکنهایی هستند که به مدل وارد میشوند و توکنهای خروجی، توکنهایی هستند که مدل براساس توکنهای ورودی تولید میکند. یک میلیون توکن ورودی معادل حدود ۷۵۰ هزار کلمه و کمی طولانیتر از رمان «جنگ و صلح» است.
اوپنایآی در گزارش تغییرات نوشت: منتقدان در ارزیابیهای تخصصی همواره o3-pro را در هر دستهبندی آزمایششده و به ویژه در حوزههای کلیدی مانند علوم، آموزش، برنامهنویسی، تجارت و کمک به نگارش بر o3 ترجیح میدهند. همچنین، منتقدان o3-pro را از نظر وضوح، جامعیت، پیروی از دستورالعملها و دقت، همواره بالاتر ارزیابی میکنند.
به گفته اوپنایآی، O3-pro به گزینههایی دسترسی دارد که به آن امکان میدهند تا به جستوجو در وب بپردازد، فایلها را تحلیل کند، ورودیهای بصری را تحت استدلال خود قرار دهد، از نرمافزار پایتون استفاده کند، پاسخهای خود را با استفاده از حافظه شخصیسازی کند و موارد دیگری از این دست را انجام دهد. نقطه ضعف این مدل به گفته اوپنایآی این است که معمولا زمان بیشتری نسبت به o1-pro میخواهد تا پاسخهای خود را تکمیل کند.
مدل O3-pro محدودیتهای دیگری هم دارد. چتهای موقت با مدل در چتجیپیتی فعلاً غیرفعال هستند زیرا اوپنایآی در حال رفع یک مشکل فنی است. همچنین، O3-pro نمیتواند تصاویر تولید کند و ویژگی فضای کاری مبتنی بر هوش مصنوعی شرکت اوپنایآی موسوم به «Canvas» نیز توسط o3-pro پشتیبانی نمیشود.
جنبه مثبت o3-pro طبق آزمایشهای داخلی اوپنایآی این است که در معیارهای محبوب هوش مصنوعی به امتیازات چشمگیری دست مییابد. در آزمایش «AIME 2024» که مهارتهای ریاضی یک مدل را ارزیابی میکند، o3-pro امتیاز بهتری را نسبت به مدل هوش مصنوعی برتر گوگل موسوم به «جمینای ۲.۵ پرو»(Gemini 2.5 Pro) به دست آورد. همچنین، O3-pro مدل «کلود ۴ آپتوس»(Claude 4 Opus) شرکت «آنتروپیک»(Anthropic) را در آزمون «GPQA Diamond» برای ارزیابی دانش علمی در سطح دکتری شکست داد.
انتهای پیام
نظرات