به گزارش ایسنا، چتباتهای هوش مصنوعی پیش از پاسخ دادن، استدلالهای طولانی ایجاد میکنند. توکن بیشتر به معنای انتشار کربن دیاکسید بیشتر است. این نشان میدهد که افزایش دقت همیشه به معنای بهبود یافتن نیست.
این گزارش چند نکته کلیدی را در بر دارد که در ادامه با آنها آشنا خواهیم شد.
به نقل از ساستینبیلیتی، برای بیشتر افراد، حتی استفاده متوسط از «چتجیپیتی»(ChatGPT) بخش بسیار کوچکی از ردپای آنها را تشکیل میدهد. شرکتهای فناوری درباره آمار، زیاد شفاف نیستند که ناشی از کمگویی آنهاست. بنابراین، این تخمینها تقریبی هستند و بهترین آماری هستند که مردم میتوانند براساس منابع معقول موجود ببینند.
شرکت هوش مصنوعی «میسترال ایآی»(Mistral AI) نیز یک تحلیل محیطی را درباره مدلهای زبانی بزرگ خود انجام داد. این شرکت از ارزیابی چرخه عمر که توسط آژانسهای مشاوره خارجی انجام شده بود، استفاده کرد. اگرچه این روش چندان شفاف یا دقیق نبود اما جزئیاتی را از وقوع اثرات در فرآیند ارائه داد. در کل، اثرات کم بود و میسترال ایآی گفت که فقط یک گرم کربن دیاکسید به ازای هر صفحه متن تولیدشده که یک پاسخ متنی نسبتاً طولانی است، منتشر میشود. این مقدار بسیار کم است.
مقالهای که در ماه مه مجله «MIT Technology Review» به چاپ رسید، محاسبات جدیدی را درباره ردپای هوش مصنوعی در حوزه انرژی ارائه داد و مرور خوبی بر بسیاری از پیچیدگیها بود. برخی از آمار برجسته این مقاله عبارتند از حدود ۰.۹۳ وات ساعت برای پاسخ به یک پرسش متنی متوسط از هوش مصنوعی «لاما»(Llama) ، بین ۰.۳ تا ۱.۲ وات ساعت برای تولید یک تصویر و تقریباً یک کیلووات ساعت برای تولید یک ویدیوی پنجثانیهای با مدل هوش مصنوعی «سورا»(Sora) شرکت اوپنایآی.
ارزیابی جدید گوگل که براساس مدل «جمینای»(Gemini) منتشر شده است، این موضوع را بیشتر تأیید میکند. این ارزیابی تخمین میزند که میانگین جستوجوی متنی در ۱۲ ماه گذشته ۰.۲۴ وات ساعت مصرف بوده و تنها ۰.۰۳ گرم دیاکسید کربن منتشر کرده است.
گوگل تخمین میزند که مدل جمینای آن فقط ۰.۲۴ وات ساعت برای هر پرسوجوی متنی استاندارد مصرف میکند. این معادل تماشای تلویزیون به مدت ۹ ثانیه است.گوگل اولین شرکت بزرگ فناوری است که گزارش مفصلی را درباره تأثیر هر پرسوجو از مدل زبانی بزرگ خود ارائه میدهد و این کار آن بسیار مورد استقبال قرار گرفت. حتی اگر مردم انتقاداتی به این روش داشته باشند، ارائه شدن آن با جزئیات امکان به چالش کشیدن دقیقتر را فراهم میکند. وقتی مدیرعامل فقط یک عدد را بدون هیچ زمینهای ارائه میدهد، غیر ممکن است که به درستی بتوانیم آن را درک کنیم.
گزارش گوگل، میانگین پرسوجوی متنی و میانگین طول و عمق پاسخ در همه جستوجوهای متنی آن در مه ۲۰۲۵ بود. بنابراین این بازه، اطلاعاتی را از جستوجوهای فوقالعاده کوتاه تا جستوجوهای «پژوهش عمیق»(Deep Research) شامل میشود. اطلاعات بیشتری درباره توزیع ارائه نشده و به همین دلیل، دانستن طول واقعای پاسخ دشوار است. بدیهی است که پاسخهای طولانیتر، انرژی بیشتری مصرف میکنند.
نکته جالب این است که گزارش گوگل، افزایش قابل توجهی را در بهرهوری طی سال گذشته نشان میدهد. تخمین زده شده که ۱۲ ماه پیش، مصرف انرژی به ازای هر پرسوجو ۳۳ برابر بیشتر بوده است. این بدان معناست که پیام متنی استاندارد از ۹ وات ساعت انرژی استفاده میکرده است. این مصرف انرژی احتمالاً به دلیل بهبود در بهرهوری، بیش از ۱۰ برابر نسبت به سال گذشته کمتر شده است.
پیشتر گفته شد که ۰.۲۴ وات ساعت معادل تماشای تلویزیون به مدت ۹ ثانیه است. بنابراین اگر ۱۰ سوال را بپرسید، معادل یک و نیم دقیقه تماشای تلویزیون خواهد بود و ۱۰۰ سوال، ۱۵ دقیقه میشود. بنابراین، میزان انرژی مصرفی جمینای در مقایسه با تماشای تلویزیون کم است اما نکته مهمتر این است که تماشای تلویزیون نیز در مقایسه با بیشتر کارهای دیگر، انرژی کمی میبرد.
چند فعالیت دیگر که حدود ۰.۲۴ وات ساعت انرژی مصرف میکنند، به شرح زیر هستند.
- مایکروویو یک ثانیه
- لپتاپ ۱۷ ثانیه
- فریزر ۶ ثانیه
- شارژ کردن تلفن همراه دو ثانیه
- تولید کربن دیاکسید
عدد قابل توجه دیگر در گزارش گوگل این است که یک جستوجوی متنی متوسط، ۰.۰۳ گرم کربن دیاکسید تولید میکند. این مقدار بسیار کمتر از تخمینهای قبلی است.
گوگل گزارش میدهد که میزان انتشار کربن به ازای هر جستوجو در ۱۲ ماه گذشته، ۴۴ برابر کاهش یافته است. بخش بزرگی از این کاهش به دلیل کاهش مصرف انرژی - ۳۳ برابر - است اما دلیل دیگر آن این است که گوگل رقم بسیار پایینتری را برای شدت کربن برق در نظر میگیرد.
اگر کاهش ۴۴ برابری گزارششده را در نظر بگیریم، میتوانیم تخمین بزنیم که یک سال پیش، میزان انتشار کربن دیاکسید آن ۱.۳۲ گرم بوده است. این مقدار بسیار نزدیک به تخمینهای قبلی است.
عامل دیگر این است که چه میزان آموزش در تخمینهای انتشار گازهای گلخانهای لحاظ میشود. گوگل کاملاً واضح میگوید که این تخمینها درباره مصرف انرژی و انتشار گازهای گلخانهای فقط برای استنتاج هستند. استنتاج اساسا اجرای یک مدل از قبل آموزشدیده برای تولید خروجی است. این کاری است که شما هر بار سؤالی را از جمینای یا چتجیپیتی میپرسید، انجام میدهید.
این یعنی تخمینهای گوگل احتمالا نسبت به برخی دیگر از سیستمهای شامل آموزش، محدودتر هستند. برای مثال، تحلیل چرخه عمر هوش مصنوعی میسترال که قبلاً بررسی کردیم، ظاهراً شامل آموزش و استنتاج بود. آن گزارش هم چندان به روششناسی متکی نبود و به همین دلیل، دشوار است که بدانیم این موضوع به طور ویژه چگونه محاسبه شده است. آمار ارائهشده توسط این گزارش، کمی بیش از یک گرم دیاکسید کربن را به ازای هر صفحه متن نشان میداد.
خواه تخمین گوگل مبنی بر ۰.۰۳ گرم و خواه تخمین بیشتر را در نظر بگیریم، نتیجه اصلی تغییر نمیکند. با توجه به این که اعداد از نظر بزرگی متفاوت هستند، ممکن است این عدد عجیب به نظر برسد اما نکته این است که این میزان انتشار در مقایسه با انتشار کنونی ناشی از فعالیتهای بیشتر مردم ناچیز است.
ردپای کربنی چتباتهای هوش مصنوعی
هر بار که از یک چتبات هوش مصنوعی سوالی میپرسید، نه تنها به شما پاسخ میدهد، بلکه با بهره بردن از انرژی، کربن دیاکسید تولید میکند که به محیط زیست آسیب میرساند.
به نقل از اکونومیک تایمز، پژوهشگران آلمانی دریافتند که برخی از مدلهای هوش مصنوعی به ویژه مدلهایی که پیش از پاسخ دادن، با استدلال طولانی و گامبهگام به یک مسئله فکر میکنند، میتوانند تا ۵۰ برابر بیشتر از مدلهایی که پاسخهای کوتاه و مستقیم میدهند، کربن دیاکسید منتشر کنند.
اما چرا چتباتهای هوش مصنوعی به انتشار گازهای گلخانهای منجر میشوند و چگونه این اتفاق رخ میدهد؟ پاسخهای هوش مصنوعی از توکنها تشکیل شدهاند. توکنها، واژهها یا بخشهایی از واژهها هستند که به دادههای عددی تبدیل شدهاند و هوش مصنوعی میتواند آنها را پردازش کند. تولید این توکنها همراه با قدرت محاسباتی مورد نیاز، به انتشار کربن دیاکسید منجر میشود. از آنجا که این اتفاق در پشت صحنه رخ میدهد و قابل مشاهده نیست، بیشتر مردم متوجه نمیشوند که استفاده از چتباتهای هوش مصنوعی در واقع با انتشار کربن قابل توجهی همراه است.
مدلهای هوش مصنوعی به ویژه مدلهایی که پیش از پاسخ دادن، با استدلال طولانی و گامبهگام به یک مسئله فکر میکنند، میتوانند تا ۵۰ برابر بیشتر از مدلهایی که پاسخهای کوتاه و مستقیم میدهند، کربن دیاکسید منتشر کنند.در پژوهشی که در مجله «Frontiers in Communication» به چاپ رسید، «ماکسیمیلیان داونر»(Maximilian Dauner) و گروهش در «دانشگاه علوم کاربردی مونیخ»(Munich University of Applied Sciences) ۱۴ مدل زبانی بزرگ را با اندازههای بین هفت تا ۷۲ میلیارد پارامتر (پارامترها نحوه یادگیری و تصمیمگیری یک مدل را تعیین میکنند) با استفاده از ۱۰۰۰ سوال استاندارد اپیرامون موضوعات گوناگون آزمایش کردند.
این گروه پژوهشی دریافتند مدلهایی که برای استدلال دقیق طراحی شدهاند، به طور میانگین ۵۴۳.۵ توکن تفکر را در هر سوال تولید میکنند که بسیار بیشتر از ۳۷.۷ توکن مدلهایی است که پاسخها را کوتاه نگه میدارند. توکن بیشتر به معنای کربن دیاکسید بیشتر است اما همیشه دقت را بهبود نمیبخشد. توکنهای تفکر، محتوای داخلی اضافی تولیدشده توسط مدل هوش مصنوعی پیش از رسیدن به پاسخ نهایی هستند و جزئیات اضافی ممکن است دقت پاسخ را بهبود نبخشند اما هزینه زیستمحیطی را افزایش میدهند.
داونر توضیح داد که بین دقت و تأثیر زیستمحیطی، رابطه معکوس آشکاری وجود دارد زیرا براساس این گزارش، دقت هیچکدام از مدلهایی که میزان انتشار گازهای گلخانهای را زیر ۵۰۰ گرم کربن دیاکسید نگه داشته بودند، زیاد بالا نبود. داونر گفت: ما در حال حاضر شاهد یک بدهبستان آشکار بین دقت و پایداری در مدلهای زبانی بزرگ هستیم. هیچکدام از مدلهایی که میزان انتشار گازهای گلخانهای را زیر ۵۰۰ گرم کربن دیاکسید نگه داشتند، در پاسخ درست به ۱۰۰۰ سوال، به دقت بالاتر از ۸۰ دست نیافتند.
دستورالعملهای هوشمندانهتر برای کاهش ردپای کربن هوش مصنوعی
پژوهشگران با تکیه بر یافتههای خود اظهار امیدواری کردهاند که پژوهش آنها کمک کند تا مردم تصمیمهای آگاهانهتری را درباره استفاده از هوش مصنوعی بگیرند. پیشنهاد پژوهشگران این است که کاربران، هوش مصنوعی را به ارائه پاسخهای مختصر ترغیب کنند و مدلهای سنگین را برای کارهایی نگه دارند که برای انجام شدن واقعاً نیازمند آن هستند. داونر گفت: کاربران میتوانند با ترغیب کردن هوش مصنوعی به تولید پاسخهای مختصر یا محدود کردن استفاده از مدلهای با ظرفیت بالا به کارهایی که واقعاً به قدرت آن نیاز دارند، میزان انتشار گازهای گلخانهای را به میزان قابل توجهی کاهش دهند.
کاربران میتوانند با ارائه پاسخهای مختصر به چتباتهای هوش مصنوعی، انتشار گازهای گلخانهای را کاهش دهند. انتخاب مدل مناسب نیز یک روش کارآمد است. پژوهشگران خاطرنشان کردند که حتی انتخاب مدل نیز میتواند تفاوت قابل توجهی را در میزان انتشار کربن دیاکسید ایجاد کند. به عنوان مثال، آنها گزارش دادند که پاسخ دادن به ۶۰۰ هزار سوال با مدل «R۱» شرکت «دیپسیک»(DeepSeek)، ۷۰ میلیارد پارامتر را در بر دارد که به اندازه یک پرواز رفت و برگشت از لندن به نیویورک، کربن دیاکسید منتشر میکند. این در حالی است که مدل «کوئن ۲.۵»(Qwen 2.5) شرکت «علیبابا»(Alibaba)، ۷۲ میلیارد پارامتر را در بر دارد و میتواند با دقت مشابه به حدود ۱.۹ میلیون سوال پاسخ دهد و در عین حال همان میزان انتشار را داشته باشد.
با وجود این، پژوهشگران خاطرنشان کردند که نتایج آنها ممکن است تحت تأثیر انتخاب سختافزار مورد استفاده در پژوهش، عامل انتشار و مدلهای مورد بررسی قرار گرفته باشد و این عوامل ممکن است تعمیمپذیری نتایج را محدود کرده باشند.
داونر گفت: اگر کاربران هزینه دقیق کربن دیاکسید خروجیهای تولیدشده توسط هوش مصنوعی مانند تبدیل کردن خود به یک شخصیت اکشن را بدانند، ممکن است درباره زمان و نحوه استفاده از این فناوریها گزینشیتر و متفکرانهتر عمل کنند.
GPT-5 و افزایش مصرف انرژی
کارشناسانی که روی معیار استفاده از منابع مدلهای هوش مصنوعی کار میکنند، میگویند قابلیتهای پیشرفته نسخه جدید چتجیپیتی با هزینه گزافی همراه هستند.
به نقل از گاردین، اگر در اواسط سال ۲۰۲۳ یک کاربر از چتجیپیتی دستور پخت پاستای کنگر فرنگی یا دستورالعمل تهیه یک نذر آیینی برای خدای باستانی کنعان میخواست، پاسخ آن ممکن بود به طور تقریبی، دو وات ساعت یا تقریباً به اندازه میزان برقی باشد که یک لامپ رشتهای در دو دقیقه مصرف میکند.
اکنون کارشناسان میگویند اگر از GPT-5 دستور پخت پاستای کنگر فرنگی را بپرسید، میتواند چندین برابر - حتی ۲۰ برابر - آن مقدار انرژی را مصرف کند.
اوپنایآی مانند بیشتر رقبای خود، از زمان انتشار GPT-3 در سال ۲۰۲۰ هیچ اطلاعات رسمی را درباره میزان مصرف برق مدلهای خود منتشر نکرده است. سم آلتمن در ماه ژوئن امسال در وبلاگ خود، اعدادی را درباره مصرف منابع چتپیتیتی منتشر کرد اما این اعداد به مدل خاصی اشاره نمیکردند و هیچ سند پشتیبانی نداشتند.
«راکش کومار»(Rakesh Kumar) استاد «دانشگاه ایلینوی»(University of Illinois) که در حال حاضر روی مصرف انرژی محاسبات و مدلهای هوش مصنوعی کار میکند، گفت: یک مدل پیچیدهتر مانند GPT-5 هم در طول آموزش و هم در طول استنتاج، انرژی بیشتری مصرف میکند. همچنین، این مدل برای تفکر بلندمدت طراحی شده است. میتوانم با اطمینان بگویم که مصرف انرژی بسیار بیشتری نسبت به GPT-4 خواهد داشت.
روزی که GPT-5 منتشر شد، پژوهشگران آزمایشگاه هوش مصنوعی «دانشگاه رود آیلند»(University of Rhode Island) دریافتند که این مدل میتواند تا ۴۰ وات ساعت برق را برای تولید پاسخی با طول متوسط حدود ۱۰۰۰ توکن استفاده کند.
«شائولی رن»(Shaolei Ren) استاد «دانشگاه کالیفرنیا ریورساید»(UC Riverside) که ردپای منابع هوش مصنوعی را مطالعه میکند، گفت: براساس اندازه مدل، میزان منابع مورد استفاده توسط GPT-5 احتمالا چندین برابر بیشتر از GPT-3 هستند.
«مروان عبدالعاطی»(Marwan Abdelatti) استاد دانشگاه دانشگاه رود آیلند گفت: رسیدگی به هزینههای واقعی زیستمحیطی هوش مصنوعی اکنون بیش از هر زمان دیگری حیاتی است. ما از اوپنایآی و سایر توسعهدهندگان میخواهیم که از این فرصت استفاده کنند و با افشای عمومی تأثیر زیستمحیطی GPT-5، به شفافیت کامل متعهد شوند.
انتهای پیام
نظرات