อู๋ เอินฮุย, เฉียว เหลียง*
ภาควิชาเคมี มหาวิทยาลัย Fudan เซี่ยงไฮ้ 200433 จีน
จุลินทรีย์มีความสัมพันธ์อย่างใกล้ชิดกับโรคของมนุษย์และสุขภาพ การทำความเข้าใจองค์ประกอบของชุมชนจุลินทรีย์และหน้าที่ของจุลินทรีย์เป็นประเด็นสำคัญที่ต้องได้รับการศึกษาอย่างเร่งด่วน ในช่วงไม่กี่ปีที่ผ่านมา metaproteomics ได้กลายเป็นวิธีการทางเทคนิคที่สำคัญในการศึกษาองค์ประกอบและหน้าที่ของจุลินทรีย์ อย่างไรก็ตาม เนื่องจากตัวอย่างชุมชนจุลินทรีย์มีความซับซ้อนและมีความหลากหลายสูง การประมวลผลตัวอย่าง การเก็บข้อมูลแมสสเปกโตรเมทรี และการวิเคราะห์ข้อมูลจึงกลายเป็นความท้าทายหลักสามประการที่เมตาโปรตีโอมิกส์เผชิญอยู่ในปัจจุบัน ในการวิเคราะห์เมตาโปรตีโอมิกส์ มักจำเป็นต้องปรับการบำบัดล่วงหน้าสำหรับตัวอย่างประเภทต่างๆ ให้เหมาะสม และใช้แผนการแยกจุลินทรีย์ การเพิ่มคุณค่า การสกัด และการสลายจุลินทรีย์ที่แตกต่างกัน เช่นเดียวกับโปรตีโอมของสปีชีส์เดี่ยว โหมดการรับข้อมูลแมสสเปกโตรเมทรีในเมตาโปรตีโอมิกส์รวมถึงโหมดการได้มาซึ่งข้อมูลโดยอาศัยข้อมูล (DDA) และโหมดการได้มาซึ่งข้อมูลโดยไม่ขึ้นอยู่กับข้อมูล (DIA) โหมดการรับข้อมูล DIA สามารถรวบรวมข้อมูลเปปไทด์ของกลุ่มตัวอย่างได้อย่างสมบูรณ์และมีศักยภาพในการพัฒนาที่ยอดเยี่ยม อย่างไรก็ตาม เนื่องจากความซับซ้อนของตัวอย่างเมตาโปรตีน การวิเคราะห์ข้อมูล DIA จึงกลายเป็นปัญหาสำคัญที่เป็นอุปสรรคต่อความครอบคลุมเชิงลึกของเมตาโปรตีน ในแง่ของการวิเคราะห์ข้อมูล ขั้นตอนที่สำคัญที่สุดคือการสร้างฐานข้อมูลลำดับโปรตีน ขนาดและความสมบูรณ์ของฐานข้อมูลไม่เพียงแต่ส่งผลกระทบอย่างมากต่อจำนวนการระบุตัวตนเท่านั้น แต่ยังส่งผลต่อการวิเคราะห์สายพันธุ์และระดับการทำงานด้วย ปัจจุบัน มาตรฐานทองคำสำหรับการสร้างฐานข้อมูลเมตาโปรตีโอมคือฐานข้อมูลลำดับโปรตีนที่อิงจากเมตาจีโนม ในเวลาเดียวกัน วิธีการกรองฐานข้อมูลสาธารณะตามการค้นหาซ้ำได้รับการพิสูจน์แล้วว่ามีคุณค่าในทางปฏิบัติอย่างมาก จากมุมมองของกลยุทธ์การวิเคราะห์ข้อมูลเฉพาะ วิธีการวิเคราะห์ข้อมูล DIA ที่มีเปปไทด์เป็นศูนย์กลางได้ครอบครองกระแสหลักอย่างแท้จริง ด้วยการพัฒนาการเรียนรู้เชิงลึกและปัญญาประดิษฐ์ จะช่วยส่งเสริมความแม่นยำ ความครอบคลุม และความเร็วในการวิเคราะห์ของการวิเคราะห์ข้อมูลแมคโครโปรตีนอย่างมาก ในแง่ของการวิเคราะห์ชีวสารสนเทศศาสตร์ขั้นปลาย ชุดเครื่องมือคำอธิบายประกอบได้รับการพัฒนาในช่วงไม่กี่ปีที่ผ่านมา ซึ่งสามารถดำเนินการคำอธิบายประกอบชนิดพันธุ์ในระดับโปรตีน ระดับเปปไทด์ และระดับยีน เพื่อให้ได้องค์ประกอบของชุมชนจุลินทรีย์ เมื่อเปรียบเทียบกับวิธี Omics อื่น ๆ การวิเคราะห์เชิงหน้าที่ของชุมชนจุลินทรีย์เป็นคุณลักษณะเฉพาะของโปรตีนขนาดใหญ่ โปรตีนขนาดใหญ่ได้กลายเป็นส่วนสำคัญของการวิเคราะห์หลายโอมิกส์ของชุมชนจุลินทรีย์ และยังคงมีศักยภาพในการพัฒนาที่ยอดเยี่ยมในแง่ของความลึกของการครอบคลุม ความไวในการตรวจจับ และความสมบูรณ์ของการวิเคราะห์ข้อมูล
01ตัวอย่างการปรับสภาพ
ปัจจุบัน เทคโนโลยีเมตาโปรตีโอมิกส์ถูกนำมาใช้กันอย่างแพร่หลายในการวิจัยไมโครไบโอมของมนุษย์ ดิน อาหาร มหาสมุทร ตะกอนเร่ง และสาขาอื่นๆ เมื่อเปรียบเทียบกับการวิเคราะห์โปรตีโอมของสปีชีส์เดียว การปรับสภาพตัวอย่างเมตาโปรตีโอมของตัวอย่างที่ซับซ้อนต้องเผชิญกับความท้าทายที่มากกว่า องค์ประกอบของจุลินทรีย์ในตัวอย่างจริงมีความซับซ้อน ช่วงไดนามิกของความอุดมสมบูรณ์มีขนาดใหญ่ โครงสร้างผนังเซลล์ของจุลินทรีย์ประเภทต่างๆ นั้นแตกต่างกันมาก และตัวอย่างมักประกอบด้วยโปรตีนโฮสต์และสิ่งสกปรกอื่นๆ จำนวนมาก ดังนั้น ในการวิเคราะห์เมตาโปรตีโอม จึงมักจำเป็นต้องปรับตัวอย่างประเภทต่างๆ ให้เหมาะสม และใช้แผนการแยกจุลินทรีย์ การเพิ่มคุณค่า การสกัด และการสลายจุลินทรีย์ที่แตกต่างกัน
การสกัดเมตาโปรตีโอมของจุลินทรีย์จากตัวอย่างต่างๆ มีความคล้ายคลึงกันและความแตกต่างบางประการ แต่ในปัจจุบัน ยังขาดกระบวนการเตรียมการประมวลผลแบบรวมศูนย์สำหรับตัวอย่างเมตาโปรตีนประเภทต่างๆ
02การเก็บข้อมูลแมสสเปกโตรเมตรี
ในการวิเคราะห์โปรตีโอมของปืนลูกซอง ส่วนผสมของเปปไทด์หลังการปรับสภาพจะถูกแยกออกจากคอลัมน์โครมาโตกราฟีก่อน จากนั้นจึงเข้าสู่แมสสเปกโตรมิเตอร์เพื่อเก็บข้อมูลหลังจากการไอออไนซ์ เช่นเดียวกับการวิเคราะห์โปรตีโอมสปีชีส์เดี่ยว โหมดการรับข้อมูลแมสสเปกโตรเมทรีในการวิเคราะห์มาโครโปรตีนประกอบด้วยโหมด DDA และโหมด DIA
ด้วยการวนซ้ำและอัปเดตเครื่องมือแมสสเปกโตรเมทรีอย่างต่อเนื่อง เครื่องมือแมสสเปกโตรเมทรีที่มีความไวและความละเอียดสูงจะถูกนำไปใช้กับเมตาโปรตีโอม และความลึกของการครอบคลุมของการวิเคราะห์เมตาโปรตีโอมก็ได้รับการปรับปรุงอย่างต่อเนื่องเช่นกัน เป็นเวลานานแล้วที่ชุดเครื่องมือแมสสเปกโตรเมตรีความละเอียดสูงที่นำโดย Orbitrap ถูกนำมาใช้กันอย่างแพร่หลายในเมตาโปรตีโอม
ตารางที่ 1 ของข้อความต้นฉบับแสดงการศึกษาที่เป็นตัวแทนบางส่วนเกี่ยวกับเมตาโปรตีโอมิกส์ตั้งแต่ปี 2011 ถึงปัจจุบัน ในแง่ของประเภทตัวอย่าง กลยุทธ์การวิเคราะห์ เครื่องมือแมสสเปกโตรเมทรี วิธีการได้มา ซอฟต์แวร์การวิเคราะห์ และจำนวนการระบุ
03การวิเคราะห์ข้อมูลแมสสเปกโตรเมตรี
3.1 กลยุทธ์การวิเคราะห์ข้อมูล DDA
3.1.1 การค้นหาฐานข้อมูล
3.1.2เดอโนโวกลยุทธ์การเรียงลำดับ
3.2 กลยุทธ์การวิเคราะห์ข้อมูล DIA
04การจำแนกชนิดและหมายเหตุประกอบการทำงาน
องค์ประกอบของชุมชนจุลินทรีย์ในระดับอนุกรมวิธานที่แตกต่างกันเป็นหนึ่งในสาขาการวิจัยที่สำคัญในการวิจัยไมโครไบโอม ในช่วงไม่กี่ปีที่ผ่านมา มีการพัฒนาชุดเครื่องมือคำอธิบายประกอบเพื่ออธิบายสปีชีส์ในระดับโปรตีน ระดับเปปไทด์ และระดับยีน เพื่อให้ได้องค์ประกอบของชุมชนจุลินทรีย์
สาระสำคัญของคำอธิบายประกอบเชิงฟังก์ชันคือการเปรียบเทียบลำดับโปรตีนเป้าหมายกับฐานข้อมูลลำดับโปรตีนเชิงฟังก์ชัน การใช้ฐานข้อมูลฟังก์ชันของยีน เช่น GO, COG, KEGG, eggNOG ฯลฯ การวิเคราะห์คำอธิบายประกอบเชิงฟังก์ชันต่างๆ สามารถดำเนินการกับโปรตีนที่ระบุโดยแมคโครโปรตีน เครื่องมือคำอธิบายประกอบ ได้แก่ Blast2GO, DAVID, KOBAS เป็นต้น
05สรุปและแนวโน้ม
จุลินทรีย์มีบทบาทสำคัญในสุขภาพและโรคของมนุษย์ ในช่วงไม่กี่ปีที่ผ่านมา metaproteomics ได้กลายเป็นวิธีการทางเทคนิคที่สำคัญในการศึกษาการทำงานของชุมชนจุลินทรีย์ กระบวนการวิเคราะห์ของเมตาโปรตีโอมิกส์นั้นคล้ายคลึงกับกระบวนการของโปรตีโอมิกส์ชนิดเดียว แต่เนื่องจากความซับซ้อนของวัตถุการวิจัยของเมตาโปรตีโอมิกส์ จึงจำเป็นต้องนำกลยุทธ์การวิจัยเฉพาะมาใช้ในแต่ละขั้นตอนการวิเคราะห์ ตั้งแต่การปรับตัวอย่างล่วงหน้า การเก็บข้อมูล ไปจนถึงการวิเคราะห์ข้อมูล ปัจจุบัน ต้องขอบคุณการปรับปรุงวิธีการปรับสภาพ นวัตกรรมอย่างต่อเนื่องของเทคโนโลยีแมสสเปกโตรเมทรี และการพัฒนาอย่างรวดเร็วของชีวสารสนเทศศาสตร์ ทำให้เมตาโปรตีโอมิกส์มีความก้าวหน้าอย่างมากในด้านการระบุความลึกและขอบเขตการใช้งาน
ในกระบวนการเตรียมตัวอย่างมาโครโปรตีโอม จะต้องพิจารณาถึงลักษณะของตัวอย่างก่อน วิธีการแยกจุลินทรีย์ออกจากเซลล์และโปรตีนในสิ่งแวดล้อมเป็นหนึ่งในความท้าทายสำคัญที่แมคโครโปรตีนต้องเผชิญ และความสมดุลระหว่างประสิทธิภาพการแยกและการสูญเสียจุลินทรีย์ถือเป็นปัญหาเร่งด่วนที่ต้องแก้ไข ประการที่สอง การสกัดโปรตีนของจุลินทรีย์จะต้องคำนึงถึงความแตกต่างที่เกิดจากความแตกต่างทางโครงสร้างของแบคทีเรียที่แตกต่างกัน ตัวอย่างมาโครโปรตีโอมในช่วงการติดตามยังต้องการวิธีบำบัดล่วงหน้าที่จำเพาะอีกด้วย
ในแง่ของเครื่องมือแมสสเปกโตรเมตรี เครื่องมือแมสสเปกโตรเมทรีกระแสหลักได้ผ่านการเปลี่ยนแปลงจากแมสสเปกโตรมิเตอร์ที่ใช้เครื่องวิเคราะห์มวล Orbitrap เช่น LTQ-Orbitrap และ Q Exactive มาเป็นแมสสเปกโตรมิเตอร์ที่อิงการเคลื่อนที่ของไอออนควบคู่กับเครื่องวิเคราะห์มวลตามเวลาบิน เช่น timsTOF Pro . ชุดเครื่องมือ timsTOF ที่มีข้อมูลขนาดการเคลื่อนที่ของไอออนมีความแม่นยำในการตรวจจับสูง ขีดจำกัดการตรวจจับต่ำ และความสามารถในการทำซ้ำที่ดี พวกมันค่อยๆ กลายเป็นเครื่องมือสำคัญในสาขาการวิจัยต่างๆ ที่จำเป็นต้องมีการตรวจจับแมสสเปกโตรเมตรี เช่น โปรตีโอม เมตาโปรตีโอม และเมตาโบโลมของสปีชีส์เดียว เป็นที่น่าสังเกตว่าเป็นเวลานานแล้วที่ช่วงไดนามิกของเครื่องมือแมสสเปกโตรเมตรีได้จำกัดความลึกของการครอบคลุมโปรตีนของการวิจัยเมตาโปรตีน ในอนาคต เครื่องมือแมสสเปกโตรเมตรีที่มีช่วงไดนามิกกว้างกว่าสามารถปรับปรุงความไวและความแม่นยำในการระบุโปรตีนในเมตาโปรตีนได้
สำหรับการเก็บข้อมูลแมสสเปกโตรเมตรี แม้ว่าโหมดการเก็บข้อมูล DIA จะถูกนำมาใช้กันอย่างแพร่หลายในโปรตีโอมของสปีชีส์เดียว แต่การวิเคราะห์มาโครโปรตีนในปัจจุบันส่วนใหญ่ยังคงใช้โหมดการเก็บข้อมูล DDA โหมดการรับข้อมูล DIA สามารถรับข้อมูลไอออนส่วนย่อยของตัวอย่างได้อย่างสมบูรณ์ และเมื่อเปรียบเทียบกับโหมดการรับข้อมูล DDA โหมดดังกล่าวมีศักยภาพในการรับข้อมูลเปปไทด์ของตัวอย่างโปรตีนมาโครได้อย่างสมบูรณ์ อย่างไรก็ตาม เนื่องจากข้อมูล DIA มีความซับซ้อนสูง การวิเคราะห์ข้อมูล Macroproteome ของ DIA ยังคงเผชิญกับความยากลำบากอย่างมาก การพัฒนาปัญญาประดิษฐ์และการเรียนรู้เชิงลึกคาดว่าจะปรับปรุงความแม่นยำและความสมบูรณ์ของการวิเคราะห์ข้อมูล DIA
ในการวิเคราะห์ข้อมูลของเมตาโปรตีโอมิกส์ ขั้นตอนสำคัญประการหนึ่งคือการสร้างฐานข้อมูลลำดับโปรตีน สำหรับพื้นที่การวิจัยยอดนิยม เช่น พืชในลำไส้ สามารถใช้ฐานข้อมูลจุลินทรีย์ในลำไส้ เช่น IGC และ HMP ได้ และได้ผลลัพธ์ในการระบุตัวตนที่ดี สำหรับการวิเคราะห์เมตาโปรตีโอมิกส์อื่นๆ ส่วนใหญ่ กลยุทธ์การสร้างฐานข้อมูลที่มีประสิทธิผลสูงสุดยังคงเป็นการสร้างฐานข้อมูลลำดับโปรตีนเฉพาะตัวอย่างโดยอิงตามข้อมูลลำดับเมตาเจโนมิก สำหรับตัวอย่างชุมชนจุลินทรีย์ที่มีความซับซ้อนสูงและช่วงไดนามิกสูง จำเป็นต้องเพิ่มความลึกในการเรียงลำดับเพื่อเพิ่มการระบุสายพันธุ์ที่มีความอุดมสมบูรณ์ต่ำ ซึ่งจะช่วยปรับปรุงความครอบคลุมของฐานข้อมูลลำดับโปรตีน เมื่อข้อมูลการเรียงลำดับขาดหายไป สามารถใช้วิธีค้นหาซ้ำเพื่อเพิ่มประสิทธิภาพฐานข้อมูลสาธารณะได้ อย่างไรก็ตาม การค้นหาซ้ำอาจส่งผลต่อการควบคุมคุณภาพ FDR ดังนั้นผลการค้นหาจึงต้องได้รับการตรวจสอบอย่างรอบคอบ นอกจากนี้ การบังคับใช้แบบจำลองการควบคุมคุณภาพ FDR แบบดั้งเดิมในการวิเคราะห์เมตาโปรตีโอมิกส์ยังคงคุ้มค่าที่จะสำรวจ ในแง่ของกลยุทธ์การค้นหา กลยุทธ์ไลบรารีสเปกตรัมแบบไฮบริดสามารถปรับปรุงความลึกของการครอบคลุมของเมตาโปรตีโอมิกส์ของ DIA ได้ ในช่วงไม่กี่ปีที่ผ่านมา ไลบรารีสเปกตรัมที่คาดการณ์ซึ่งสร้างขึ้นจากการเรียนรู้เชิงลึกได้แสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าในโปรตีโอมิกส์ของ DIA อย่างไรก็ตาม ฐานข้อมูลเมตาโปรตีโอมมักจะมีรายการโปรตีนหลายล้านรายการ ซึ่งส่งผลให้มีไลบรารีสเปกตรัมที่คาดการณ์ไว้จำนวนมาก ใช้ทรัพยากรคอมพิวเตอร์จำนวนมาก และส่งผลให้มีพื้นที่การค้นหาขนาดใหญ่ นอกจากนี้ ความคล้ายคลึงกันระหว่างลำดับโปรตีนในเมตาโปรตีโอมนั้นแตกต่างกันอย่างมาก ทำให้ยากต่อการรับรองความถูกต้องของแบบจำลองการทำนายไลบรารีสเปกตรัม ดังนั้นไลบรารีสเปกตรัมที่คาดการณ์ไว้จึงไม่ถูกนำมาใช้กันอย่างแพร่หลายในเมตาโปรตีโอมิกส์ นอกจากนี้ จำเป็นต้องพัฒนากลยุทธ์การอนุมานโปรตีนใหม่และคำอธิบายประกอบการจำแนกประเภทเพื่อนำไปใช้กับการวิเคราะห์เมตาโปรตีโอมิกส์ของโปรตีนที่มีลำดับคล้ายกันสูง
โดยสรุป ในฐานะเทคโนโลยีการวิจัยไมโครไบโอมที่เกิดขึ้นใหม่ เทคโนโลยีเมตาโปรตีโอมิกส์ได้รับผลการวิจัยที่สำคัญและยังมีศักยภาพในการพัฒนาอย่างมาก
เวลาโพสต์: 30 ส.ค.-2024