طراحی پروتئین و مرور آخرین پیشرفتها در این زمینه

پروتئینها، اجزای بنیادین حیات
پروتئینها از اجزای بنیادین حیات هستند و نقشهای حیاتی در اغلب فرآیندهای سلولی ایفا میکنند. آنها از زنجیرههایی از اسیدهای آمینه تشکیل شدهاند که در نهایت به ساختارهای سهبعدی ویژهای تا میخورند؛ ساختارهایی که برای عملکرد بیولوژیکی پروتئینها ضروریاند.
طراحی پروتئین
از این رو همانطور که در دورهی شبیهسازی دینامیک مولکولی بیان کردیم، مدلهای زبانی پروتئین یا اصطلاحا Protein language models موجب پیشرفتهای چشمگیری در درک رابطه بین توالی و عملکرد پروتئینها شدهاند و نقش مهمی در طراحی پروتئین ایفا میکنند. اما مدلهایی که بر پایهی همترازی چندگانه توالی یا multiple sequence alignment عمل میکنند، اطلاعات تکاملی میان توالیهای همولوگ را بهخوبی استخراج میکنند، اما فرآیند ساخت MSA خود دارای محدودیتها و نواقصی است. در همین راستا امروز میخواهیم در مورد مدل ProtMamba که توسط Damiano Sgarbossa و همکارانش ارائه شده است صحبت کنیم.
این مدل با وجود آگاهی از همولوژی، بدون استفاده از همترازی و مبتنی بر معماری Mamba طراحی شده است و قادر است بهطور مؤثر با صدها توالی پروتئینی کار کند و در عین حال از نظر محاسباتی نیز بهینه باشد. این مدل با بهرهگیری از دو کارت گرافیک (GPU) و مجموعه دادهای بزرگ از توالیهای همولوگ بههمپیوسته آموزش داده شده است.
مدل ProtMamba
ProtMamba مدلی زبانی برای پروتئینها است که آگاه از همولوژی است اما بدون نیاز به همترازی عمل میکند. توسعهدهندگان این مدل را بر پایه معماری Mamba طراحی کردهاند و آن را به قابلیت پردازش صدها توالی همولوگ مجهز کردهاند. در مرحله استنتاج، این مدل با هیچ محدودیتی در طول توالی مواجه نیست. این مدل، بهدلیل سرعت بالاتر نسبت به مدلهای مشابه، امکان تولید سریع توالی و پیشبینی اثر جهشها را فراهم میکند. همچنین این مدل یک رویکرد نویدبخش برای مدلسازی نواحی ذاتاً بینظم (intrinsically disordered regions) و سایر توالیهایی است که همترازی آنها دشوار است. در مجموع ProtMamba قادر است سیگنالها را در مقیاسهای مختلف استخراج و یاد بگیرد. این مدل بهطور خاص میتواند محدودیتهای عملکردی را شناسایی کند؛ هم با بهرهگیری از اطلاعات کلی حاصل از پیشآموزش روی کل پروتئوم، و هم با زمینهسازی بر اساس توالیهای همولوگ خاص.
اطلاعات بیشتر و رفرنس
شما میتوانید برای کسب اطلاعات بیشتر در این زمینه، علاوه بر مطالعه پست رازهایی درمورد طراحی پروتئین که باید بدانید بر روی این لینک کلیک کنید و مقالهی این پروژه را مطالعه کنید. همچنین برای دریافت کد پایتون مربوط به ProtMamba به این مخزن GitHub و یا Zenodo مراجعه کنید.
درباره کمپ بیوانفورماتیک
کمپ بیوانفورماتیک نام مجموعه جوانی است که با هدف توسعه علم بیوانفورماتیک تشکیل شده است. این مجموعه با تیم تحقیقاتی قوی و بهروزی که دارد، دورههای آموزشی هوشمندانهای طراحی میکند تا بتواند در گسترش علم بیوانفورماتیک قدم بردارد. در همین راستا کمپ بیوانفورماتیک تاکنون بیش از هزاران نفر را به طور مستقیم و غیر مستقیم آموزش داده است. همچنین این کمپ با انجام پروژههای بیوانفورماتیکی در قالب “تیم پروژه کمپ بیوانفورماتیک” در تلاش است تا در پیشرفت پروژههای بیوانفورماتیکی کشور سهیم باشد.
نوشته های بیشتر از کمپ بیوانفورماتیک
دیدگاهتان را بنویسید
برای نوشتن دیدگاه باید وارد بشوید.