کمبود دادههای AlphaFold و راهکار جدید شرکتهای داروسازی

از جایزه نوبل تا چالشها
AlphaFold، ابزار پیشبینی ساختارهای پروتئینی که برنده جایزه نوبل شده، با یک مشکل اساسی روبهرو است: کمبود داده. نسخه جدید این مدل، AlphaFold 3، که در کشف دارو تحولی ایجاد کرده، قادر است تعامل پروتئینها با سایر مولکولها را مدلسازی کند. اما دادههای عمومی موجود درباره این تعاملات محدود هستند و این مانعی برای کاربردهای مورد علاقه شرکتهای داروسازی محسوب میشود. برای حل این مشکل، گروهی از شرکتهای داروسازی مطرح تصمیم گرفتهاند نسخهای از مدل AlphaFold 3 را با استفاده از ساختارهای پروتئینی انحصاری خود توسعه دهند.
مشکل کمبود دادههای دارویی
مدل AlphaFold برای پیشبینی ساختارهای سهبعدی پروتئینها از مجموعه بزرگی از ساختارهای پروتئینی عمومی مانند Protein Data Bank (PDB) استفاده میکند. بسیاری از این ساختارها شامل مولکولهای در تعامل با پروتئینها هستند، اما بیشتر این مولکولها، ترکیبات زیستی مانند ATP هستند و اطلاعات کمی درباره داروها ارائه میدهند. در نتیجه، پیشبینی تعامل پروتئینها با داروها همچنان چالشبرانگیز باقی مانده است.
شرکتهای داروسازی در فرآیند توسعه دارو، بهطور معمول ساختارهای متعددی از یک پروتئین در حال تعامل با ترکیبات دارویی مختلف تولید میکنند. این دادههای انحصاری که اغلب در پایگاههای عمومی ثبت نمیشوند، میتوانند تعداد ساختارهای موجود را دو برابر یا حتی بیشتر کنند. به عنوان مثال، شرکت AbbVie بیش از 9,000 ساختار پروتئینی را برای این پروژه ارائه خواهد کرد.
نحوه استفاده از دادههای انحصاری
شرکتها قصد ندارند دادههای پروتئینی خود را مستقیماً به اشتراک بگذارند. بهجای آن، از پلتفرمی که توسط شرکت استارتآپی Apheris در برلین توسعه یافته، استفاده خواهد شد. این پلتفرم امکان آموزش مجدد OpenFold 3 را با دادههای انحصاری فراهم میکند، بدون اینکه این دادهها از سرورهای شرکتها خارج شوند.
تأثیر احتمالی این مدل جدید
سؤال اصلی این است که آیا این دادههای اضافی میتوانند دقت پیشبینیهای AlphaFold را بهبود ببخشند؟ محمد القریشی، زیستشناس محاسباتی در دانشگاه کلمبیا و رهبر پروژه OpenFold، میگوید که این موضوع هنوز مشخص نیست. تیم او قصد دارد دقت مدل جدید را با مقایسه پیشبینیهای آن با دادههای تجربی ارزیابی کند.
استفانی وانکویچ، زیستشناس ساختاری از دانشگاه وندربیلت، معتقد است که اگرچه دادههای شرکتهای داروسازی احتمالاً تأثیری بر دقت پیشبینی ساختار پروتئینها ندارند، اما میتوانند پیشبینی تعاملات دارو-پروتئین را به طور چشمگیری بهبود ببخشند. برایان شویشت، شیمیدان دارویی در دانشگاه کالیفرنیا، سانفرانسیسکو، میگوید که حتی یک بهبود جزئی، مانند افزایش دقت پیشبینی اتصال داروها به پروتئینها، میتواند تأثیر زیادی بر توسعه دارو داشته باشد. در همین راستا پیشنهاد میکنیم پست “هوش مصنوعی سرعت طراحی دارو برای بیماریهای مختلف را ده برابر میکند” را هم مطالعه کنید.
مسئله شفافیت دادهها
در حال حاضر، دسترسی به این مدل، محدود به اعضای کنسرسیوم است، اما شرکتها ممکن است در آینده درباره اشتراکگذاری گستردهتر دادهها تصمیم بگیرند. استفانی وانکویچ معتقد است که شرکتهای داروسازی باید دادههای بیشتری را در پایگاههای عمومی ثبت کنند. در حال حاضر، تنها 6% از 233,000 ساختار موجود در PDB متعلق به شرکتهای داروسازی است.
اگرچه برخی دانشمندان مانند شویشت تردید دارند که شرکتها دادههای خود را آزادانه منتشر کنند، اما استیون برلی، مدیر یکی از سازمانهای میزبان PDB، خوشبین است که دوران AlphaFold 2 و AlphaFold 3 میتواند شرکتها را به سمت شفافیت بیشتر سوق دهد.

درباره کمپ بیوانفورماتیک
کمپ بیوانفورماتیک نام مجموعه جوانی است که با هدف توسعه علم بیوانفورماتیک تشکیل شده است. این مجموعه با تیم تحقیقاتی قوی و بهروزی که دارد، دورههای آموزشی هوشمندانهای طراحی میکند تا بتواند در گسترش علم بیوانفورماتیک قدم بردارد. در همین راستا کمپ بیوانفورماتیک تاکنون بیش از هزاران نفر را به طور مستقیم و غیر مستقیم آموزش داده است. همچنین این کمپ با انجام پروژههای بیوانفورماتیکی در قالب “تیم پروژه کمپ بیوانفورماتیک” در تلاش است تا در پیشرفت پروژههای بیوانفورماتیکی کشور سهیم باشد.
نوشته های بیشتر از کمپ بیوانفورماتیک
دیدگاهتان را بنویسید
برای نوشتن دیدگاه باید وارد بشوید.