به گزارش ایسنا، نویسنده این گزارش در مورد تولید یک پروتئین با هوش مصنوعی نوشته است: من از هوش مصنوعی برای طراحی یک پروتئین افتضاح استفاده کردم. با پیروی از دستورالعملهای گام به گام، یک مدل زبانی پروتئین (PLM) ابتدایی ساختم. نوعی هوش مصنوعی (AI) که به جای کلمات، توالیهای پروتئینی را تولید میکند. با چند خط کد کپی و پیست شده، از مدل خواستم که یک توالی کوتاه از اسیدهای آمینه را ایجاد کند.
به نقل از نیچر، من نمیدانستم پروتئین من چقدر نامناسب است تا اینکه از آلفا فولد (AlphaFold) که هوش مصنوعی پیشبینیکننده ساختار پروتئین دیپمایند گوگل (Google DeepMind) است، خواستم ساختار آن را پیشبینی کند. ساختار پیشبینی شده دارای مارپیچ، حلقه و سایر عناصر واقعگرایانه بود. اما آلفافولد نسبت به پیشبینی خود زیاد مطمئن نبود و این نشان میداد مولکول من احتمالا نمیتواند در سلولهای آزمایشگاه ساخته شود، چه برسد به اینکه کار مفیدی انجام دهد.
اکنون، افرادی مثل من که بهصورت آماتور در زیستشناسی محاسباتی فعالیت میکنند، امید تازهای یافتهاند.
دانشمندان در حال توسعه نسل جدیدی از ابزارهای هوش مصنوعی زیستی هستند که دستورالعملها را به زبان ساده دریافت کرده و آنها را به پروتئینها و سایر مولکولها، از جمله داروهای بالقوه، تبدیل میکنند. این مدلها همچنین به محققان اجازه میدهند تا با سلولها به زبان انگلیسی معمولی «صحبت» کنند تا عملکرد داخلی آنها را رمزگشایی کرده و درک زیستی دیگری را به دست آورند.
این تازهترین تحول در انقلاب زیستهوش مصنوعی (bio-AI) است که در حال دگرگون کردن حوزههایی مانند طراحی پروتئین و زیستشناسی ساختاری است. مدلهای زبانی بزرگ (PLMs) و دیگر ابزارهای هوش مصنوعی به دانشمندان این امکان را میدهند که مولکولهایی مانند آنزیمها و پادتنها را با نسبتی از سهولت طراحی کنند. اما بهرهبرداری کامل از این ابزارها معمولا نیازمند تخصص قابلتوجهی است.
دانشمندان میگویند مدلهایی که به کاربران امکان میدهند محصولات زیستی را با استفاده از متن ساده بررسی کنند، میتوانند موانع پیوستن به انقلاب هوش مصنوعی زیستی را کاهش دهند. این هوشهای مصنوعی همچنین این پتانسیل را دارند که کنترل بیشتری بر طراحیها و خروجیهای حاصل فراهم کنند.
محمد القریشی، زیستشناس محاسباتی در دانشگاه کلمبیا در شهر نیویورک، میگوید: اگر بتوانیم دقیقا مشخص کنیم چه میخواهیم و پروتئینی با آن ویژگیها طراحی شود، مفید خواهد بود.
تبدیل دستور متنی به پروتئین
ماه گذشته، گروهی به رهبری فاجی یوان (Fajie Yuan)، دانشمند یادگیری ماشینی در دانشگاه وستلیک در هانگژو، چین، نشان داد که یک مدل تبدیل متن به پروتئین که گروهش توسعه داده است، میتواند پروتئینهای عملکردی، از جمله آنزیمهای آزمایششده در آزمایشگاه و پروتئینهای فلورسنت، را طراحی کند که در طراحیهای خود جدید هستند و شبیه مولکولهای موجود نیستند. یوان میگوید: ما اولین کسانی هستیم که یک آنزیم عملکردی را فقط با استفاده از متن طراحی میکنیم. این درست مثل داستانهای علمی تخیلی است.
این مدل که پینال نام دارد، یکی از چندین هوش مصنوعی طراحی پروتئین است که میتواند با زبان معمولی هدایت شود که برخلاف توالی پروتئین یا مشخصات مبتنی بر ساختار است که در بیشتر هوشهای مصنوعی مشابه رایج هستند.
آنتونی گیتر (Anthony Gitter)، زیستشناس محاسباتی در دانشگاه ویسکانسین-مدیسون، میگوید: این روزهای اولیه این مدلهای هوش مصنوعی زیستی است. من آن را به عنوان یک حوزه پرخطر و پربازده میبینم.
چگونه با متن یک مولکول بسازیم؟
آموزش مدلهای هوش مصنوعی زیستی برای برقراری ارتباط به زبان انگلیسی یا هر زبان دیگری معمولا شامل قرار دادن آنها در معرض توضیحات متنی از دادههای زیستی است. گروه یوان، پینال را با استفاده از توضیحات مختصری از ساختارها، عملکردها و سایر ویژگیهای ۱.۷ میلیارد پروتئین آموزش دادند. پس از آموزشهای اضافی، این مدل میتوانست یک دستور را دریافت کند و صدها طرح توالی تولید کند. این به صورت عمومی در دسترس نیست.
یکی از دستوراتی که محققان استفاده کردند این بود: لطفا پروتئینی طراحی کنید که یک الکل دهیدروژناز باشد، این اشاره به به یک آنزیم دارد که الکل را متابولیزه میکند. یوان و همکارانش سپس از ابزارهای محاسباتی دیگری برای شناسایی امیدوارکنندهترین طرحها استفاده کردند و با همکاری یک زیستشناس، فعالیت آنزیمی آنها را آزمایش کردند.
دو مورد از هشت طرح الکل دهیدروژناز با موفقیت تجزیه الکل را کاتالیز کردند، البته با کارایی بسیار کمتر از آنزیمهای طبیعی. یوان میگوید گروهش همچنین پروتئینهای فلورسنت سبز (GFP) و آنزیمهای تجزیهکننده پلاستیک را طراحی کرده است که همگی از نظر توالی با نمونههای طبیعی متفاوت هستند.
چندین گروه دیگر مدلهای هوش مصنوعی مشابهی را توسعه دادهاند، از جمله مدلی به نام ESM-۳ که میتواند با کلمات کلیدی و همچنین با توالیها و ساختارهای پروتئینی هدایت کرد. یک شرکت نوپا به نام ۳۱۰.ai ابزاری اختصاصی به نام MP۴ توسعه داده است که مجموعهای از پروتئینها را از ورودیهای متنی طراحی میکند، از جمله چندین پروتئین که در آزمایشگاه میتوانند به منبع انرژی سلولی ATP متصل شوند. تیموتی رایلی (Timothy Riley)، معاون رئیس این بررسی، میگوید این شرکت از این مدل برای طراحی پروتئینهایی استفاده میکند که مانند داروهای GLP-۱که درمانهای چاقی پرفروشی هستند، عمل میکنند.
کتی وی (Kathy Wei)، یکی از بنیانگذاران این شرکت، میگوید یکی از چالشهای مدلهایی مانند ۳۱۰.ai، ارائه دستورالعملهای متنی مناسب برای پیروی یک هوش مصنوعی است، اگرچه مدلهای زبانی بزرگ میتوانند به ایجاد دستورالعملهای موفق کمک کنند. او این را به روزهای اولیه هوش مصنوعیهای تولیدکننده تصویر مانند Dall-E تشبیه میکند و میگوید: در هوش مصنوعی تولید کننده تصویر برخی از دستورالعملها مثمر ثمرتر از بقیه بودند و به عنوان مثال، تلاشهای مدلها برای به تصویر کشیدن دست انسان اغلب یک عامل برای لو رفتن جعلی بودن تصویر به شمار میرفت.
در مقابل وی میگوید MP۴ به جای دستهای عجیب و غریب، گاهی اوقات میتواند پروتئینهایی با توالیهای تکراری را تولید کند.
طراحی دارو
طراحی پروتئین تنها زمینهای نیست که دانشمندان در آن از هوش مصنوعی استفاده میکنند. مجموعهای از مدلها با هدف اعمال رویکردی مشابه در طراحی مواد شیمیایی طراحی شدهاند.
به عنوان مثال، سال گذشته، گروه گیتر مدلی را منتشر کرد که مولکولهای کوچک را در پاسخ به پیامهای متنی طراحی میکند و نشان داد که میتواند مهارکنندههای شبهدارویی از اهداف پروتئینی شناخته شده طراحی کند.
این طرحها در آزمایشگاه بررسی نشدهاند، اما ابزارهای محاسباتی که به طور گسترده در کشف دارو استفاده میشوند، نشان میدهند که برخی از آنها امیدوارکننده هستند.
دانشمندان همچنین از هوش مصنوعی زیستی برای «صحبت» با سلولها استفاده میکنند. تلاشها برای توالییابی تمام مولکولهای آرانای در سلولهای منفرد به یک روش اساسی در زیستشناسی سلولی تبدیل شده است و تنوع ناشناختهای را آشکار میکند. اما کریستوف بوک (Christoph Bock)، زیستشناس محاسباتی در دانشگاه پزشکی وین، میگوید: تفسیر این آزمایشهای دادهمحور معمولا نیازمند همکاری فشرده بین زیستشناسان و دانشمندان داده است.
به عنوان یک راه میانبر، آزمایشگاه او یک چتبات هوش مصنوعی به نام CellWhisperer۴ توسعه داد. این چتبات میتواند دستورالعملهای ساده انگلیسی را دریافت کند برای مثال دستورالعملی مانند: این سلولها را با جزئیات توصیف کن و خلاصهای را به صورت متن ساده دریافت کند، یا به کاربران اجازه دهد با «به هم چسباندن» سلولهای مورد علاقه، نمایش بصری از جمعیتی از سلولهای متنوع را بررسی کنند. باک میگوید: این به یک شریک جرم در تجزیه و تحلیل دادههای شما تبدیل میشود.
جملات سلولی
در تلاشی دیگر، یک مدل هوش مصنوعی، مجموعه دادههای توالییابی شده از تک سلولی را به فهرستهای طولانی از ژنهایی که سلولها بیان میکنند، ترجمه میکند و این دادهها را به یک مدل زبانی بزرگ (LLM) موجود منتقل میکند. مدل حاصل، به نام Cell۲Sentence، میتواند یک مجموعه داده تک سلولی را دریافت کند و ویژگیهایی مانند نوع سلول را به زبان انگلیسی ساده توصیف کند.
و از آنجا که این مدل بر اساس مقالات و دادههای زیستی آموزش دیده است، میتواند نقاط را به هم متصل کند و کارهایی مانند پیشبینی چگونگی تغییر ژنهای بیان شده توسط یک سلول توسط یک داروی ایمونوتراپی سرطان را انجام دهد. دیوید ون دایک (David van Dijk)، زیستشناس محاسباتی در دانشگاه ییل در نیوهیون، کنتیکت، که این کار را به همراه دانشمندانی در مرکز تحقیقات گوگل و سازمانهای دیگر رهبری میکرد، میگوید: مدل ما میتواند بین زبان زیستی و زبان انسانی ترجمه انجام دهد.
گیتر به صورت دورهای توانایی مدلهای زبانی بزرگ آماده برای طراحی پروتئینها را ارزیابی میکند، اما هنوز تحت تاثیر نتایج قرار نگرفته است.
القرشی میگوید موج کنونی از هوشهای مصنوعی زیستی سخنگو «کمی نمایشی» است. اما او اضافه میکند که ایدهی تقویت مدلهای زبانی بزرگ (LLMs) با دادههای علمی، مانند توالیهای پروتئینی و ساختارهای شیمیایی، ایدهای امیدوارکننده است. او میگوید: تعجب نخواهم کرد اگر برخی از شرکتهای بزرگ فناوری هماکنون در حال کار روی این موضوع باشند.
بعد از تلاش ناموفقم، به رابط وب پینال رفتم و عبارت «یک پروتئین خوب برای من بساز» را تایپ کردم. وقتی توالی را به آلفافولد وصل کردم، پیشبینی بسیار قابل اعتمادتری را ارائه کرد. مدل ساخته شده شبیه مخلوطی از اسپاگتی و فوسیلی بود، بنابراین انتظار نداشتم که بتواند واکنشی را کاتالیز کند، پلاستیک بخورد یا کار خاصی انجام دهد. اما این یک شروع است.
انتهای پیام
نظرات