حامد شهبازی در گفتوگو با ایسنا اظهار کرد: یادگیری تقویتی عمدتاً در محیطهای شبیهسازیشده استفاده میشود. اگرچه در برخی موارد روی رباتهای واقعی نیز پیادهسازی شده، اما به دلیل خطراتی که ممکن است در محیط واقعی برای ربات به وجود آید، استفاده از شبیهسازی ترجیح داده میشود.
وی افزود: در بسیاری از کاربردها از محیطهایی مانند Mujoco ،Gym و PyBullet و سایر ابزارهای شبیهسازی برای آموزش رباتها استفاده میشود. کمتر پیش میآید که این محیطها بهصورت مستقیم در فضای واقعی مورد استفاده قرار گیرند، چراکه ممکن است خطراتی جدی برای ربات ایجاد شود.
دکترای هوش مصنوعی ادامه داد: پس از اینکه ربات در محیط شبیهسازی شده تا حد زیادی آموزش دید، میتوان آن را وارد محیط واقعی کرد تا مراحل نهایی آموزش را طی کند. مهمترین چالش در این مرحله، دینامیکهای غیرقابل پیشبینی محیط واقعی است؛ در حالی که در شبیهسازیها دینامیک سیستم مشخص و قابل کنترل است، در محیط واقعی تغییر شرایط، نویز و خروج از وضعیت ایدهآل از چالشهای اساسی محسوب میشود.
شهبازی با بیان اینکه تعامل با محیط واقعی هزینهبر و پرخطر است، تصریح کرد: امکان دارد در فرایند آموزش، ربات تخریب شود یا یک کوادکوپتر سقوط کند. به همین دلیل، ما معمولاً هزاران یا میلیونها تکرار را در محیطهای شبیهسازی انجام میدهیم و تنها در مراحل پایانی آموزش، با استفاده از یادگیری انتقالی(Transfer Learning)، وزنهای آموزشدیده شبکه عصبی را به ربات واقعی منتقل میکنیم تا در آنجا آموزش تکمیلی ببیند.
این پژوهشگر هوش مصنوعی در بخش دیگری از سخنان خود به چالشهای ترکیب بینایی ماشین و رباتیک اشاره کرد و گفت: چالشهایی مانند تشخیص اشیا با استفاده از مدلهای پیشرفته مانند YOLO یا مدلهای زبانمحور نظیر LLaMA و Gemini در این حوزه وجود دارد. این مدلها نیازمند پردازندهها یا GPUهای پیشرفتهای هستند که بتوانند بار محاسباتی سنگین را تحمل کنند، در حالی که پیادهسازی چنین سختافزارهایی در رباتها بهدلیل هزینه و پیچیدگی، دشوار است.
وی ادامه داد: یکی دیگر از چالشها، شرایط نوری محیط است؛ کاهش یا افزایش نور، وجود نویز و تغییر هیستوگرام تصویر ممکن است باعث شود که تصاویر دریافتی دقیق نباشند، همچنین از آنجا که بیشتر دوربینها RGB هستند، تصاویر بهصورت دوبعدی دریافت میشوند و رباتها برای داشتن درکی سهبعدی از محیط نیازمند بازسازی فضا و نقشهبرداری درونی هستند.
شهبازی افزود: ربات باید بتواند دادههای بصری را به دستورات کنترلی ترجمه کند و این تبدیل از تصویر به فرمان، یکی از چالشهای اصلی در رباتیک است. علاوه بر آن، نبود یک تابع تبدیل مشخص برای سیستم یا قطعی نبودن دینامیک محیط باعث میشود نتوان فرامین دقیقی را برای کنترل ربات در نظر گرفت و در نتیجه، پیشبینی خروجیها دشوار میشود.
وی درباره چالش سوم در حوزه رباتیک گفت: ترکیب دادههای سنسوری مختلف و سنجش اعتماد به هرکدام، موضوع مهمی است. برای مثال، دادههایی که از لیدار یا دوربینهای مختلف به دست میآید، باید وزندهی و میزان اعتبار آنها مشخص شود، همچنین این دادهها باید در طول زمان هماهنگ شوند و این هماهنگی، بهویژه در سیستمهای بلادرنگ، چالشبرانگیز است.
این پژوهشگر تأکید کرد: ترکیب دادههای چند سنسور نیاز به پردازش کلانداده دارد و این امر مستلزم برخورداری از سختافزارهای پیشرفته و توان محاسباتی بالا است؛ بار محاسباتی بالا خود یکی از چالشهای اصلی در پیادهسازی رباتهای بلادرنگ محسوب میشود.
شهبازی در پاسخ به این پرسش که آینده رباتیک بیشتر وابسته به سختافزار است یا الگوریتم گفت: به نظر میرسد در شرایط فعلی به بلوغ سختافزاری رسیدهایم. اکنون آنچه تعیینکننده است، بیشتر دادهها هستند. ما در عصر دادههای کلان زندگی میکنیم و هر چه دادهها بیشتر و باکیفیتتر باشند، هم سختافزار و هم نرمافزار میتوانند تصمیمات بهتری بگیرند. حتی الگوریتمها نیز به بلوغ نسبی رسیدهاند.
وی در خصوص رباتهای انساننما نیز اظهار کرد: رباتهای انساننما در حال ورود به زندگی بشر هستند، اما بهدلیل قیمت بالای آنها، ورودشان به عرصه عمومی با چالشهایی مواجه است. در حال حاضر، پژوهشهای متمرکز و عمیقی درباره نقش اجتماعی این رباتها صورت نگرفته یا حداقل قابل توجه نبوده است.
این پژوهشگر حوزه هوش مصنوعی در پایان درباره رباتهای صنعتی بلادرنگ گفت: بهینهسازی در این زمینه مستلزم کاهش حجم محاسبات است. هرچه بتوانیم با خلاقیت، نیاز محاسباتی الگوریتمها را کاهش دهیم، هوش مصنوعی بهتر میتواند در محیط صنعتی عمل کند. همانگونه که در پروژه دیپسیک این اتفاق افتاد و با نوآوری، الگوریتمی با حجم پایین ولی عملکرد بالا ارائه شد، در اینجا نیز خلاقیت نقشی کلیدی ایفا میکند.
انتهای پیام
نظرات