وو انهوی، کیائو لیانگ*
گروه شیمی، دانشگاه فودان، شانگهای 200433، چین
میکروارگانیسم ها ارتباط نزدیکی با بیماری ها و سلامت انسان دارند. چگونگی درک ترکیب جوامع میکروبی و کارکردهای آنها موضوعی اساسی است که نیاز به بررسی فوری دارد. در سالهای اخیر، متاپروتئومیکس به یک ابزار فنی مهم برای مطالعه ترکیب و عملکرد میکروارگانیسمها تبدیل شده است. با این حال، به دلیل پیچیدگی و ناهمگونی بالای نمونههای جامعه میکروبی، پردازش نمونه، جمعآوری دادههای طیفسنجی جرمی و تجزیه و تحلیل دادهها به سه چالش اصلی در حال حاضر متاپروتئومیکس تبدیل شدهاند. در تجزیه و تحلیل متاپروتئومیکس، اغلب لازم است که پیش تیمار انواع مختلف نمونهها را بهینه کرد و طرحهای جداسازی، غنیسازی، استخراج و لیز میکروبی مختلف را اتخاذ کرد. شبیه به پروتئوم یک گونه واحد، حالتهای اکتساب دادههای طیفسنجی جرمی در متاپروتئومیکس شامل حالت اکتساب وابسته به داده (DDA) و حالت اکتساب مستقل از داده (DIA) است. حالت اکتساب داده DIA می تواند اطلاعات پپتیدی نمونه را به طور کامل جمع آوری کند و پتانسیل توسعه بالایی دارد. با این حال، به دلیل پیچیدگی نمونههای متاپروتئوم، تجزیه و تحلیل دادههای DIA آن به یک مشکل بزرگ تبدیل شده است که مانع از پوشش عمیق متاپروتئومیکس میشود. از نظر تجزیه و تحلیل داده ها، مهمترین مرحله ساخت پایگاه داده توالی پروتئین است. اندازه و کامل بودن پایگاه داده نه تنها تأثیر زیادی بر تعداد شناسایی ها دارد، بلکه بر تجزیه و تحلیل در سطوح گونه ای و عملکردی نیز تأثیر می گذارد. در حال حاضر، استاندارد طلایی برای ساخت پایگاه داده متاپروتئوم، پایگاه داده توالی پروتئین بر اساس متاژنوم است. در عین حال، روش فیلتر پایگاه داده عمومی مبتنی بر جستجوی تکراری نیز ارزش عملی قوی دارد. از منظر استراتژیهای تجزیه و تحلیل دادههای خاص، روشهای تجزیه و تحلیل دادههای پپتید محور DIA جریان اصلی مطلق را اشغال کردهاند. با توسعه یادگیری عمیق و هوش مصنوعی، دقت، پوشش و سرعت تجزیه و تحلیل داده های ماکروپروتئومی را تا حد زیادی ارتقا می دهد. از نظر تجزیه و تحلیل بیوانفورماتیک پایین دست، یک سری ابزار حاشیه نویسی در سال های اخیر توسعه یافته است که می تواند حاشیه نویسی گونه ها را در سطح پروتئین، سطح پپتید و سطح ژن برای به دست آوردن ترکیب جوامع میکروبی انجام دهد. در مقایسه با سایر روش های omics، تجزیه و تحلیل عملکردی جوامع میکروبی یک ویژگی منحصر به فرد ماکروپروتئومیکس است. ماکروپروتئومیکس به بخش مهمی از تجزیه و تحلیل چند omics جوامع میکروبی تبدیل شده است و هنوز هم از نظر عمق پوشش، حساسیت تشخیص و کامل بودن تجزیه و تحلیل داده ها، دارای پتانسیل توسعه زیادی است.
01 پیش تصفیه نمونه
در حال حاضر، فناوری متاپروتئومیکس به طور گسترده در تحقیقات میکروبیوم انسانی، خاک، غذا، اقیانوس، لجن فعال و سایر زمینه ها استفاده شده است. در مقایسه با آنالیز پروتئوم یک گونه، پیش تیمار نمونه متاپروتئوم نمونه های پیچیده با چالش های بیشتری مواجه است. ترکیب میکروبی در نمونه های واقعی پیچیده است، محدوده دینامیکی فراوانی زیاد است، ساختار دیواره سلولی انواع مختلف میکروارگانیسم ها بسیار متفاوت است و نمونه ها اغلب حاوی مقدار زیادی پروتئین میزبان و سایر ناخالصی ها هستند. بنابراین، در تجزیه و تحلیل متاپروتئوم، اغلب به بهینه سازی انواع مختلف نمونه ها و اتخاذ طرح های مختلف جداسازی، غنی سازی، استخراج و لیز میکروبی نیاز است.
استخراج متاپروتئومهای میکروبی از نمونههای مختلف شباهتهای خاصی و همچنین تفاوتهایی دارد، اما در حال حاضر یک فرآیند پیش پردازش یکپارچه برای انواع مختلف نمونههای متاپروتئوم وجود ندارد.
02 جمع آوری داده های طیف سنجی جرمی
در آنالیز پروتئوم شاتگان، مخلوط پپتید پس از پیش تیمار ابتدا در ستون کروماتوگرافی جدا می شود و سپس برای بدست آوردن داده ها پس از یونیزاسیون وارد طیف سنج جرمی می شود. شبیه به تجزیه و تحلیل پروتئوم تک گونه، حالت های اکتساب داده های طیف سنجی جرمی در آنالیز ماکروپروتئوم شامل حالت DDA و حالت DIA است.
با تکرار و به روز رسانی مداوم ابزارهای طیف سنجی جرمی، ابزارهای طیف سنجی جرمی با حساسیت و وضوح بالاتر به متاپروتئوم اعمال می شوند و عمق پوشش تجزیه و تحلیل متاپروتئوم نیز به طور مداوم بهبود می یابد. برای مدت طولانی، مجموعه ای از ابزارهای طیف سنجی جرمی با وضوح بالا به سرپرستی Orbitrap به طور گسترده در متاپروتئوم استفاده شده است.
جدول 1 متن اصلی برخی از مطالعات معرف بر متاپروتئومیکس را از سال 2011 تا کنون از نظر نوع نمونه، استراتژی تجزیه و تحلیل، ابزار طیف سنجی جرمی، روش اکتساب، نرم افزار تجزیه و تحلیل و تعداد شناسایی ها نشان می دهد.
03 تجزیه و تحلیل داده های طیف سنجی جرمی
3.1 استراتژی تجزیه و تحلیل داده های DDA
3.1.1 جستجو در پایگاه داده
3.1.2از نواستراتژی توالی
3.2 استراتژی تجزیه و تحلیل داده های DIA
04 طبقه بندی گونه ها و حاشیه نویسی عملکردی
ترکیب جوامع میکروبی در سطوح مختلف طبقه بندی یکی از زمینه های تحقیقاتی کلیدی در تحقیقات میکروبیوم است. در سال های اخیر، یک سری ابزار حاشیه نویسی برای حاشیه نویسی گونه ها در سطح پروتئین، سطح پپتید و سطح ژن برای به دست آوردن ترکیب جوامع میکروبی توسعه یافته است.
ماهیت حاشیه نویسی عملکردی مقایسه توالی پروتئین هدف با پایگاه داده توالی پروتئین عملکردی است. با استفاده از پایگاه های داده عملکرد ژن مانند GO، COG، KEGG، eggNOG و غیره، می توان آنالیزهای حاشیه نویسی عملکردی متفاوتی را بر روی پروتئین های شناسایی شده توسط ماکروپروتئوم ها انجام داد. ابزارهای حاشیه نویسی عبارتند از Blast2GO، DAVID، KOBAS و غیره.
05 خلاصه و چشم انداز
میکروارگانیسم ها نقش مهمی در سلامت و بیماری انسان دارند. در سال های اخیر، متاپروتئومیکس به یک ابزار فنی مهم برای مطالعه عملکرد جوامع میکروبی تبدیل شده است. فرآیند تحلیلی متاپروتئومیکس مشابه پروتئومیکس تک گونه ای است، اما به دلیل پیچیدگی موضوع تحقیق متاپروتئومیکس، استراتژی های تحقیقاتی خاصی باید در هر مرحله تجزیه و تحلیل اتخاذ شود، از پیش تیمار نمونه، اکتساب داده تا تجزیه و تحلیل داده ها. در حال حاضر، به لطف بهبود روشهای پیش تصفیه، نوآوری مداوم فناوری طیفسنجی جرمی و توسعه سریع بیوانفورماتیک، متاپروتئومیکس پیشرفت زیادی در عمق شناسایی و دامنه کاربرد داشته است.
در فرآیند پیش تصفیه نمونه های ماکروپروتئوم، ابتدا باید ماهیت نمونه در نظر گرفته شود. نحوه جداسازی میکروارگانیسمها از سلولها و پروتئینهای محیطی یکی از چالشهای کلیدی پیش روی ماکروپروتئومها است و تعادل بین کارایی جداسازی و از دست دادن میکروبی مشکلی فوری است که باید حل شود. ثانیاً، استخراج پروتئین از میکروارگانیسم ها باید تفاوت های ناشی از ناهمگونی ساختاری باکتری های مختلف را در نظر بگیرد. نمونههای ماکروپروتئوم در محدوده ردیابی نیز به روشهای پیش تصفیه خاصی نیاز دارند.
از نظر ابزارهای طیفسنجی جرمی، ابزارهای طیفسنجی جرمی جریان اصلی از طیفسنجهای جرمی مبتنی بر تحلیلگرهای جرم Orbitrap مانند LTQ-Orbitrap و Q Exactive به طیفسنجهای جرمی مبتنی بر تحلیلگرهای جرمی همراه با تحرک یونی مانند timsTOF Pro تغییر کردهاند. . سری timsTOF از ابزار با اطلاعات ابعاد تحرک یون دارای دقت تشخیص بالا، محدودیت تشخیص کم و تکرارپذیری خوب است. آنها به تدریج به ابزارهای مهمی در زمینه های مختلف تحقیقاتی تبدیل شده اند که نیاز به تشخیص طیف سنجی جرمی دارند، مانند پروتئوم، متاپروتئوم و متابولوم یک گونه منفرد. شایان ذکر است که برای مدت طولانی، دامنه دینامیکی ابزارهای طیف سنجی جرمی، عمق پوشش پروتئین تحقیقات متاپروتئوم را محدود کرده است. در آینده، ابزارهای طیفسنجی جرمی با دامنه دینامیکی بزرگتر میتوانند حساسیت و دقت شناسایی پروتئین در متاپروتئومها را بهبود بخشند.
برای جمعآوری دادههای طیفسنجی جرمی، اگرچه حالت اکتساب دادههای DIA به طور گسترده در پروتئوم یک گونه منفرد پذیرفته شده است، اکثر تحلیلهای ماکروپروتئوم فعلی هنوز از حالت اکتساب دادههای DDA استفاده میکنند. حالت اکتساب داده DIA می تواند اطلاعات یون قطعه نمونه را به طور کامل بدست آورد و در مقایسه با حالت اکتساب داده های DDA، پتانسیل بدست آوردن کامل اطلاعات پپتیدی نمونه ماکروپروتئوم را دارد. با این حال، به دلیل پیچیدگی بالای داده های DIA، تجزیه و تحلیل داده های ماکروپروتئوم DIA هنوز با مشکلات زیادی روبرو است. انتظار می رود توسعه هوش مصنوعی و یادگیری عمیق باعث بهبود دقت و کامل بودن تجزیه و تحلیل داده های DIA شود.
در تجزیه و تحلیل داده های متاپروتئومیکس، یکی از مراحل کلیدی ساخت پایگاه داده توالی پروتئین است. برای حوزه های تحقیقاتی رایج مانند فلور روده، می توان از پایگاه های داده میکروبی روده مانند IGC و HMP استفاده کرد و نتایج شناسایی خوبی به دست آمده است. برای بسیاری دیگر از آنالیزهای متاپروتئومیکس، موثرترین استراتژی ساخت پایگاه داده هنوز ایجاد یک پایگاه داده توالی پروتئینی خاص بر اساس داده های توالی یابی متاژنومی است. برای نمونه های جامعه میکروبی با پیچیدگی بالا و دامنه دینامیکی زیاد، لازم است عمق توالی یابی افزایش یابد تا شناسایی گونه های کم فراوانی افزایش یابد و در نتیجه پوشش پایگاه داده توالی پروتئین بهبود یابد. هنگامی که دادههای توالیبندی وجود ندارد، میتوان از یک روش جستجوی تکراری برای بهینهسازی پایگاه داده عمومی استفاده کرد. با این حال، جستجوی تکراری ممکن است بر کنترل کیفیت FDR تأثیر بگذارد، بنابراین نتایج جستجو باید به دقت بررسی شوند. علاوه بر این، کاربرد مدلهای کنترل کیفیت FDR سنتی در تجزیه و تحلیل فراپروتئومیکس هنوز ارزش بررسی دارد. از نظر استراتژی جستجو، استراتژی کتابخانه طیفی ترکیبی می تواند عمق پوشش متاپروتئومیکس DIA را بهبود بخشد. در سالهای اخیر، کتابخانه طیفی پیشبینیشده تولید شده بر اساس یادگیری عمیق، عملکرد برتر را در پروتئومیکس DIA نشان داده است. با این حال، پایگاههای داده متاپروتئوم اغلب حاوی میلیونها ورودی پروتئینی است که منجر به مقیاس بزرگی از کتابخانههای طیفی پیشبینیشده، مصرف منابع محاسباتی زیادی و منجر به فضای جستجوی بزرگ میشود. علاوه بر این، شباهت بین توالیهای پروتئینی در متاپروتئومها بسیار متفاوت است و اطمینان از دقت مدل پیشبینی کتابخانه طیفی را دشوار میکند، بنابراین کتابخانههای طیفی پیشبینیشده به طور گسترده در متاپروتئومیکس مورد استفاده قرار نگرفتهاند. علاوه بر این، استراتژیهای استنباط و حاشیهنویسی طبقهبندی پروتئین جدید برای اعمال آنالیز متاپروتئومیک پروتئینهای بسیار مشابه توالی باید ایجاد شود.
به طور خلاصه، به عنوان یک فناوری تحقیقاتی میکروبیوم در حال ظهور، فناوری متاپروتئومیکس به نتایج تحقیقاتی قابل توجهی دست یافته است و همچنین دارای پتانسیل توسعه عظیمی است.
زمان ارسال: اوت-30-2024