ساساوا

متاپروتئومیکس میکروبی: از پردازش نمونه، جمع آوری داده تا تجزیه و تحلیل داده ها

وو انهوی، کیائو لیانگ*

گروه شیمی، دانشگاه فودان، شانگهای 200433، چین

 

 

 

میکروارگانیسم ها ارتباط نزدیکی با بیماری ها و سلامت انسان دارند. چگونگی درک ترکیب جوامع میکروبی و کارکردهای آنها موضوعی اساسی است که نیاز به بررسی فوری دارد. در سال‌های اخیر، متاپروتئومیکس به یک ابزار فنی مهم برای مطالعه ترکیب و عملکرد میکروارگانیسم‌ها تبدیل شده است. با این حال، به دلیل پیچیدگی و ناهمگونی بالای نمونه‌های جامعه میکروبی، پردازش نمونه، جمع‌آوری داده‌های طیف‌سنجی جرمی و تجزیه و تحلیل داده‌ها به سه چالش اصلی در حال حاضر متاپروتئومیکس تبدیل شده‌اند. در تجزیه و تحلیل متاپروتئومیکس، اغلب لازم است که پیش تیمار انواع مختلف نمونه‌ها را بهینه کرد و طرح‌های جداسازی، غنی‌سازی، استخراج و لیز میکروبی مختلف را اتخاذ کرد. شبیه به پروتئوم یک گونه واحد، حالت‌های اکتساب داده‌های طیف‌سنجی جرمی در متاپروتئومیکس شامل حالت اکتساب وابسته به داده (DDA) و حالت اکتساب مستقل از داده (DIA) است. حالت اکتساب داده DIA می تواند اطلاعات پپتیدی نمونه را به طور کامل جمع آوری کند و پتانسیل توسعه بالایی دارد. با این حال، به دلیل پیچیدگی نمونه‌های متاپروتئوم، تجزیه و تحلیل داده‌های DIA آن به یک مشکل بزرگ تبدیل شده است که مانع از پوشش عمیق متاپروتئومیکس می‌شود. از نظر تجزیه و تحلیل داده ها، مهمترین مرحله ساخت پایگاه داده توالی پروتئین است. اندازه و کامل بودن پایگاه داده نه تنها تأثیر زیادی بر تعداد شناسایی ها دارد، بلکه بر تجزیه و تحلیل در سطوح گونه ای و عملکردی نیز تأثیر می گذارد. در حال حاضر، استاندارد طلایی برای ساخت پایگاه داده متاپروتئوم، پایگاه داده توالی پروتئین بر اساس متاژنوم است. در عین حال، روش فیلتر پایگاه داده عمومی مبتنی بر جستجوی تکراری نیز ارزش عملی قوی دارد. از منظر استراتژی‌های تجزیه و تحلیل داده‌های خاص، روش‌های تجزیه و تحلیل داده‌های پپتید محور DIA جریان اصلی مطلق را اشغال کرده‌اند. با توسعه یادگیری عمیق و هوش مصنوعی، دقت، پوشش و سرعت تجزیه و تحلیل داده های ماکروپروتئومی را تا حد زیادی ارتقا می دهد. از نظر تجزیه و تحلیل بیوانفورماتیک پایین دست، یک سری ابزار حاشیه نویسی در سال های اخیر توسعه یافته است که می تواند حاشیه نویسی گونه ها را در سطح پروتئین، سطح پپتید و سطح ژن برای به دست آوردن ترکیب جوامع میکروبی انجام دهد. در مقایسه با سایر روش های omics، تجزیه و تحلیل عملکردی جوامع میکروبی یک ویژگی منحصر به فرد ماکروپروتئومیکس است. ماکروپروتئومیکس به بخش مهمی از تجزیه و تحلیل چند omics جوامع میکروبی تبدیل شده است و هنوز هم از نظر عمق پوشش، حساسیت تشخیص و کامل بودن تجزیه و تحلیل داده ها، دارای پتانسیل توسعه زیادی است.

 

01 پیش تصفیه نمونه

در حال حاضر، فناوری متاپروتئومیکس به طور گسترده در تحقیقات میکروبیوم انسانی، خاک، غذا، اقیانوس، لجن فعال و سایر زمینه ها استفاده شده است. در مقایسه با آنالیز پروتئوم یک گونه، پیش تیمار نمونه متاپروتئوم نمونه های پیچیده با چالش های بیشتری مواجه است. ترکیب میکروبی در نمونه های واقعی پیچیده است، محدوده دینامیکی فراوانی زیاد است، ساختار دیواره سلولی انواع مختلف میکروارگانیسم ها بسیار متفاوت است و نمونه ها اغلب حاوی مقدار زیادی پروتئین میزبان و سایر ناخالصی ها هستند. بنابراین، در تجزیه و تحلیل متاپروتئوم، اغلب به بهینه سازی انواع مختلف نمونه ها و اتخاذ طرح های مختلف جداسازی، غنی سازی، استخراج و لیز میکروبی نیاز است.

استخراج متاپروتئوم‌های میکروبی از نمونه‌های مختلف شباهت‌های خاصی و همچنین تفاوت‌هایی دارد، اما در حال حاضر یک فرآیند پیش پردازش یکپارچه برای انواع مختلف نمونه‌های متاپروتئوم وجود ندارد.

 

02 جمع آوری داده های طیف سنجی جرمی

در آنالیز پروتئوم شاتگان، مخلوط پپتید پس از پیش تیمار ابتدا در ستون کروماتوگرافی جدا می شود و سپس برای بدست آوردن داده ها پس از یونیزاسیون وارد طیف سنج جرمی می شود. شبیه به تجزیه و تحلیل پروتئوم تک گونه، حالت های اکتساب داده های طیف سنجی جرمی در آنالیز ماکروپروتئوم شامل حالت DDA و حالت DIA است.

 

با تکرار و به روز رسانی مداوم ابزارهای طیف سنجی جرمی، ابزارهای طیف سنجی جرمی با حساسیت و وضوح بالاتر به متاپروتئوم اعمال می شوند و عمق پوشش تجزیه و تحلیل متاپروتئوم نیز به طور مداوم بهبود می یابد. برای مدت طولانی، مجموعه ای از ابزارهای طیف سنجی جرمی با وضوح بالا به سرپرستی Orbitrap به طور گسترده در متاپروتئوم استفاده شده است.

 

جدول 1 متن اصلی برخی از مطالعات معرف بر متاپروتئومیکس را از سال 2011 تا کنون از نظر نوع نمونه، استراتژی تجزیه و تحلیل، ابزار طیف سنجی جرمی، روش اکتساب، نرم افزار تجزیه و تحلیل و تعداد شناسایی ها نشان می دهد.

 

03 تجزیه و تحلیل داده های طیف سنجی جرمی

3.1 استراتژی تجزیه و تحلیل داده های DDA

3.1.1 جستجو در پایگاه داده

3.1.2از نواستراتژی توالی

3.2 استراتژی تجزیه و تحلیل داده های DIA

 

04 طبقه بندی گونه ها و حاشیه نویسی عملکردی

ترکیب جوامع میکروبی در سطوح مختلف طبقه بندی یکی از زمینه های تحقیقاتی کلیدی در تحقیقات میکروبیوم است. در سال های اخیر، یک سری ابزار حاشیه نویسی برای حاشیه نویسی گونه ها در سطح پروتئین، سطح پپتید و سطح ژن برای به دست آوردن ترکیب جوامع میکروبی توسعه یافته است.

 

ماهیت حاشیه نویسی عملکردی مقایسه توالی پروتئین هدف با پایگاه داده توالی پروتئین عملکردی است. با استفاده از پایگاه های داده عملکرد ژن مانند GO، COG، KEGG، eggNOG و غیره، می توان آنالیزهای حاشیه نویسی عملکردی متفاوتی را بر روی پروتئین های شناسایی شده توسط ماکروپروتئوم ها انجام داد. ابزارهای حاشیه نویسی عبارتند از Blast2GO، DAVID، KOBAS و غیره.

 

05 خلاصه و چشم انداز

میکروارگانیسم ها نقش مهمی در سلامت و بیماری انسان دارند. در سال های اخیر، متاپروتئومیکس به یک ابزار فنی مهم برای مطالعه عملکرد جوامع میکروبی تبدیل شده است. فرآیند تحلیلی متاپروتئومیکس مشابه پروتئومیکس تک گونه ای است، اما به دلیل پیچیدگی موضوع تحقیق متاپروتئومیکس، استراتژی های تحقیقاتی خاصی باید در هر مرحله تجزیه و تحلیل اتخاذ شود، از پیش تیمار نمونه، اکتساب داده تا تجزیه و تحلیل داده ها. در حال حاضر، به لطف بهبود روش‌های پیش تصفیه، نوآوری مداوم فناوری طیف‌سنجی جرمی و توسعه سریع بیوانفورماتیک، متاپروتئومیکس پیشرفت زیادی در عمق شناسایی و دامنه کاربرد داشته است.

 

در فرآیند پیش تصفیه نمونه های ماکروپروتئوم، ابتدا باید ماهیت نمونه در نظر گرفته شود. نحوه جداسازی میکروارگانیسم‌ها از سلول‌ها و پروتئین‌های محیطی یکی از چالش‌های کلیدی پیش روی ماکروپروتئوم‌ها است و تعادل بین کارایی جداسازی و از دست دادن میکروبی مشکلی فوری است که باید حل شود. ثانیاً، استخراج پروتئین از میکروارگانیسم ها باید تفاوت های ناشی از ناهمگونی ساختاری باکتری های مختلف را در نظر بگیرد. نمونه‌های ماکروپروتئوم در محدوده ردیابی نیز به روش‌های پیش تصفیه خاصی نیاز دارند.

 

از نظر ابزارهای طیف‌سنجی جرمی، ابزارهای طیف‌سنجی جرمی جریان اصلی از طیف‌سنج‌های جرمی مبتنی بر تحلیلگرهای جرم Orbitrap مانند LTQ-Orbitrap و Q Exactive به طیف‌سنج‌های جرمی مبتنی بر تحلیل‌گرهای جرمی همراه با تحرک یونی مانند timsTOF Pro تغییر کرده‌اند. . سری timsTOF از ابزار با اطلاعات ابعاد تحرک یون دارای دقت تشخیص بالا، محدودیت تشخیص کم و تکرارپذیری خوب است. آنها به تدریج به ابزارهای مهمی در زمینه های مختلف تحقیقاتی تبدیل شده اند که نیاز به تشخیص طیف سنجی جرمی دارند، مانند پروتئوم، متاپروتئوم و متابولوم یک گونه منفرد. شایان ذکر است که برای مدت طولانی، دامنه دینامیکی ابزارهای طیف سنجی جرمی، عمق پوشش پروتئین تحقیقات متاپروتئوم را محدود کرده است. در آینده، ابزارهای طیف‌سنجی جرمی با دامنه دینامیکی بزرگ‌تر می‌توانند حساسیت و دقت شناسایی پروتئین در متاپروتئوم‌ها را بهبود بخشند.

 

برای جمع‌آوری داده‌های طیف‌سنجی جرمی، اگرچه حالت اکتساب داده‌های DIA به طور گسترده در پروتئوم یک گونه منفرد پذیرفته شده است، اکثر تحلیل‌های ماکروپروتئوم فعلی هنوز از حالت اکتساب داده‌های DDA استفاده می‌کنند. حالت اکتساب داده DIA می تواند اطلاعات یون قطعه نمونه را به طور کامل بدست آورد و در مقایسه با حالت اکتساب داده های DDA، پتانسیل بدست آوردن کامل اطلاعات پپتیدی نمونه ماکروپروتئوم را دارد. با این حال، به دلیل پیچیدگی بالای داده های DIA، تجزیه و تحلیل داده های ماکروپروتئوم DIA هنوز با مشکلات زیادی روبرو است. انتظار می رود توسعه هوش مصنوعی و یادگیری عمیق باعث بهبود دقت و کامل بودن تجزیه و تحلیل داده های DIA شود.

 

در تجزیه و تحلیل داده های متاپروتئومیکس، یکی از مراحل کلیدی ساخت پایگاه داده توالی پروتئین است. برای حوزه های تحقیقاتی رایج مانند فلور روده، می توان از پایگاه های داده میکروبی روده مانند IGC و HMP استفاده کرد و نتایج شناسایی خوبی به دست آمده است. برای بسیاری دیگر از آنالیزهای متاپروتئومیکس، موثرترین استراتژی ساخت پایگاه داده هنوز ایجاد یک پایگاه داده توالی پروتئینی خاص بر اساس داده های توالی یابی متاژنومی است. برای نمونه های جامعه میکروبی با پیچیدگی بالا و دامنه دینامیکی زیاد، لازم است عمق توالی یابی افزایش یابد تا شناسایی گونه های کم فراوانی افزایش یابد و در نتیجه پوشش پایگاه داده توالی پروتئین بهبود یابد. هنگامی که داده‌های توالی‌بندی وجود ندارد، می‌توان از یک روش جستجوی تکراری برای بهینه‌سازی پایگاه داده عمومی استفاده کرد. با این حال، جستجوی تکراری ممکن است بر کنترل کیفیت FDR تأثیر بگذارد، بنابراین نتایج جستجو باید به دقت بررسی شوند. علاوه بر این، کاربرد مدل‌های کنترل کیفیت FDR سنتی در تجزیه و تحلیل فراپروتئومیکس هنوز ارزش بررسی دارد. از نظر استراتژی جستجو، استراتژی کتابخانه طیفی ترکیبی می تواند عمق پوشش متاپروتئومیکس DIA را بهبود بخشد. در سال‌های اخیر، کتابخانه طیفی پیش‌بینی‌شده تولید شده بر اساس یادگیری عمیق، عملکرد برتر را در پروتئومیکس DIA نشان داده است. با این حال، پایگاه‌های داده متاپروتئوم اغلب حاوی میلیون‌ها ورودی پروتئینی است که منجر به مقیاس بزرگی از کتابخانه‌های طیفی پیش‌بینی‌شده، مصرف منابع محاسباتی زیادی و منجر به فضای جستجوی بزرگ می‌شود. علاوه بر این، شباهت بین توالی‌های پروتئینی در متاپروتئوم‌ها بسیار متفاوت است و اطمینان از دقت مدل پیش‌بینی کتابخانه طیفی را دشوار می‌کند، بنابراین کتابخانه‌های طیفی پیش‌بینی‌شده به طور گسترده در متاپروتئومیکس مورد استفاده قرار نگرفته‌اند. علاوه بر این، استراتژی‌های استنباط و حاشیه‌نویسی طبقه‌بندی پروتئین جدید برای اعمال آنالیز متاپروتئومیک پروتئین‌های بسیار مشابه توالی باید ایجاد شود.

 

به طور خلاصه، به عنوان یک فناوری تحقیقاتی میکروبیوم در حال ظهور، فناوری متاپروتئومیکس به نتایج تحقیقاتی قابل توجهی دست یافته است و همچنین دارای پتانسیل توسعه عظیمی است.


زمان ارسال: اوت-30-2024