معلومة

ما هي أنواع التفاعلات في الشبكة البيولوجية (شبكات البروتين)؟

ما هي أنواع التفاعلات في الشبكة البيولوجية (شبكات البروتين)؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

في ملفات KGML ، تكون أنواع العلاقات بين الجينات أو البروتينات على وجه التحديد التنشيط ، والتثبيط ، والتعبير ، والقمع ، والتأثير غير المباشر ، وتغيير الحالة ، والربط / الارتباط ، والتفكك ، والفسفرة ، ونزع الفسفرة ، والجليكوزيل ، والانتشار ، والمثيلة. أريد معرفة المزيد عن هذه التفاعلات. هل هناك مصدر معين من حيث سأفهم ما تعنيه هذه التفاعلات في العمق؟


معظمهم تشرح نفسها بنفسها. غالبًا ما تكون مسارات KEGG غامضة ، نظرًا لأن الكثير من البيولوجيا المحددة لبعض البروتينات لم يتم التحقيق فيها بشكل صحيح - في بعض الأحيان تعرف فقط أن هناك بروتينين مرتبطين ، وليس ما يقومان به بالفعل.

يسهل التنبؤ بالعلاقة بين الاثنين عندما تعرف وظيفة أحدهما ، على سبيل المثال بروتين يتفاعل مع كيناز المحتمل أن فسفرته قال كيناز. يرتبط الكثير من تلك العلاقات بـ تعديلات ما بعد الترجمة (الارتباط بالجليكوزيل ، الفسفرة ، التواجد في كل مكان ، الأسيتيل ، الميثيل ، إلخ) المصنوع من بروتين لآخر. تحتوي ويكيبيديا في الواقع على نظرة عامة جيدة عن هذه الأشياء مع الكثير من الأمثلة.

العديد من العلاقات الأخرى لها علاقة بـ تنظيم نشاط البروتين أو التعبير. يتماشى هذا إلى حد ما مع ما ذكرته أعلاه. يتم تنشيط بعض البروتينات بمجرد الفسفرة أو إزالة الميثيل ، إلخ. قد تزيل إنزيمات أخرى مجموعات الفوسفو ، مما يؤدي إلى القمع. لا يزال البعض الآخر يتفاعل بشكل مباشر مع البروتين ، مما يمنعه من ربط الركيزة أو الهدف. ربما يؤدي الارتباط إلى تغيير تكوين في بروتين واحد يسمح له بربط ركائزه عندما يتعذر ذلك بشكل طبيعي. تعمل بعض البروتينات كعوامل نسخ تنشط أو تثبط التعبير عن جينات معينة ، مما يؤثر بشكل غير مباشر على مستويات البروتين.

هناك كل أنواع الاحتمالات - تحاول ملفات KGML تمثيلها بطريقة تعطي على الأقل بعض المؤشرات عن كيفية تأثير التفاعلات بين بروتينين على كل منهما. آمل أن يقدم هذا بعض البصيرة.


الشبكات البيولوجية: من المبادئ الفيزيائية إلى الرؤى البيولوجية

تقرير عن مؤتمر Georgia Tech و UGA الدولي الرابع حول الشبكات البيولوجية للمعلوماتية الحيوية: من علم الجينوم إلى علم الأوبئة ، أتلانتا ، الولايات المتحدة الأمريكية ، 13-16 نوفمبر 2003.

كان المؤتمر الدولي الرابع لجورجيا للتكنولوجيا حول المعلوماتية الحيوية بعنوان "الشبكات البيولوجية: من الجينوميات إلى علم الأوبئة" وجمعت مجموعة متعددة التخصصات من الفيزيائيين والرياضيين وعلماء الكمبيوتر وعلماء الأحياء الذين يعملون جميعًا على فهم الشبكات البيولوجية. تم تنظيم المؤتمر من قبل مارك بورودوفسكي (معهد جورجيا للتكنولوجيا ، أتلانتا ، الولايات المتحدة الأمريكية) ويوجين كونين (المركز الوطني لمعلومات التكنولوجيا الحيوية ، بيثيسدا ، الولايات المتحدة الأمريكية) وغطى بشكل أساسي ثلاثة مجالات بحثية نشطة: إعادة البناء الحسابي ، التحليل ، ومحاكاة الشبكات البيولوجية. يعني سيل من البيانات التجريبية القادمة من مختلف مشاريع الجينوميات و "التفاعل" أن المجالات البؤرية الثلاثة تشهد حاليًا نموًا هائلاً في النتائج والمنشورات. على الرغم من النكهة الحسابية للمؤتمر ، كان التفاعل المثمر بين النظرية والتجربة واضحًا بشكل واضح ، حيث أن غالبية المشاركين إما يتعاونون مع المعامل التجريبية أو يستخدمونها مباشرة.

غطت العروض عدة أنواع من الشبكات البيولوجية: التفاعل البروتيني البروتيني ، الجيني ، التنظيمي ، والتمثيل الغذائي. بينما تمثل هذه الأنواع من الشبكات عمليات خلوية مختلفة ، إلا أنها تشترك جميعها في مبادئ تنظيمية ووظيفية مشتركة. في الاجتماع ، تمت دراسة الشبكات الجزيئية على مستويات مكانية مختلفة ، من مستوى الشبكة بالكامل ، عبر المسارات والوحدات البيولوجية إلى مستوى الأشكال الطوبولوجية الأولية. سلطت العديد من المحادثات المثيرة الضوء على التقدم السريع في هذا المجال.

وصف آدم أركين (جامعة كاليفورنيا ، بيركلي ، الولايات المتحدة الأمريكية) كيف يمكن استخدام أساليب الديناميكيات غير الخطية ونظرية الألعاب لتحديد الاستراتيجيات التطورية المثلى لنمو البكتيريا في البيئات العشوائية. لقد أوضح كيف يمكن للعشوائية المتأصلة في العمليات البيولوجية أن تساعد البكتيريا على البقاء في بيئات غير مؤكدة. قدم Arkin أيضًا تحليلًا مقارنًا شاملاً لوحدات الانجذاب الكيميائي من بكتيريا مختلفة. تؤدي الاختلافات في بنية وحدة الانجذاب الكيميائي بين البكتيريا إلى اختلافات في الحساسية للمعلمات الحركية التي تحدد استجابة الانجذاب الكيميائي. اتضح أن الوحدات عادة ما تكون حساسة لعدد قليل من المعلمات "الحاسمة" فقط ، والتي يمكن أن تزيد من "قابلية التطور" للوحدات ، بينما يضمن عدم الحساسية للمعلمات الأخرى المتانة ، ومقاومة تأثيرات الطفرات الضارة. من المحتمل أن تمثل الدراسات المماثلة ، التي لا تشمل فقط مقارنة قائمة الأجزاء ولكن أيضًا التحليل الديناميكي المفصل ، خطوة تالية مهمة في علم الجينوم المقارن.

وصف ألبرت لازلو باراباسي (جامعة نوتردام ، الولايات المتحدة الأمريكية) ، الرائد في التحليل الإحصائي للشبكات البيولوجية ، كيف يتم مشاركة السلوك الخالي من المقاييس من قبل مجموعة واسعة من الشبكات. تحتوي الشبكات الخالية من النطاق على محاور متصلة للغاية ، والتي عادةً ما تمثل بروتينات أساسية ومحفوظة للغاية. أظهر باراباسي أنه بالإضافة إلى الشبكات الثابتة ، فإن العديد من الشبكات البيولوجية الديناميكية - مثل شبكات التعبير المشترك والشبكات المكونة من التدفقات الأيضية - تعرض أيضًا خصائص خالية من المقاييس. كما أوضح أن الشبكات البيولوجية تعرض درجة عالية من النمطية وأن الوحدات شديدة الترابط منظمة بشكل هرمي في هياكل أكبر. في تحليل ذي صلة ، أظهر ريكارد سولي (جامعة بومبيو فابرا ، برشلونة ، إسبانيا) أن الخصائص المهمة للشبكات البيولوجية ، مثل التوزيعات الخالية من المقاييس والوحدات النمطية ، يمكن أن تظهر كمنتج ثانوي لقواعد تطور الشبكة ، وليس كمنتج ثانوي. نتيجة الاختيار الوظيفي. أظهر Martijn Huynen (جامعة Nijmegen ، هولندا) أيضًا كيف يمكن لنموذج ميكانيكي بسيط ، بدون اختيار ، أن يفسر الهندسة المعمارية المرصودة للشبكات البيولوجية.

كرس أندرياس واجنر (جامعة نيو مكسيكو ، البوكيرك ، الولايات المتحدة الأمريكية) حديثه للمسألة المثيرة للاهتمام حول تطور وقوة الشبكات البيولوجية. أظهر كيف تتطور شبكات البروتين من حيث التغييرات في شركاء التفاعلات ، والتوطين الخلوي ، والتنظيم. أظهر سيرجي ماسلوف (مختبر بروكهافن الوطني ، أبتون ، الولايات المتحدة الأمريكية) أيضًا اختلافًا مثيرًا للاهتمام في معدلات التطور بين تفاعل البروتين والبروتين والشبكات التنظيمية. من الخصائص المهمة للشبكات البيولوجية المتانة تجاه الطفرات الجينية. يمكن أن تحدث القوة تجاه الطفرات الضارة بسبب ازدواج الجينات - يمكن تعويض فقدان الوظيفة في نسخة واحدة عن طريق النسخة الأخرى - أو عن طريق تأثيرات الشبكة الأكثر تعقيدًا ، مثل استخدام طرق التمثيل الغذائي البديلة. قدم فاغنر عدة أسطر من الأدلة تشير إلى ذلك في خميرة الخميرة يتم تعويض 25-50٪ من عمليات حذف الجينات بواسطة جينات مكررة. أظهر كل من Wagner و Maslov النتائج بناءً على أنواع معينة انيقة تم الحصول على "عمليات الحذف" مؤخرًا باستخدام تداخل RNA (RNAi) ، مما يوضح مدى سرعة استخدام البيانات من المشاريع التجريبية واسعة النطاق حاليًا للتحقيق في مبادئ تنظيم الشبكة البيولوجية.

قدم جويل بدر (جامعة جونز هوبكنز ، بالتيمور ، الولايات المتحدة الأمريكية) عملاً منشورًا مؤخرًا على خريطة تفاعل البروتين الهجين ثنائي البروتين ذبابة الفاكهة سوداء البطن. تحتوي خريطة الطيران هذه على أكثر من 20000 تفاعل وهي أول خريطة تفاعلية لكائن متعدد الخلايا. الأهم من ذلك ، نظرًا لأنه من المعروف أن الطريقتين الهجينتين تحتويان على عدد كبير من الإيجابيات والسلبيات الخاطئة ، قدم بدر طريقة حسابية لاكتشاف التفاعلات عالية الثقة. تحتوي الخريطة الناتجة عالية الثقة على 4679 بروتينًا و 4780 تفاعلًا. ال D. melanogaster تمثل الخريطة التفاعلية مصدرًا غنيًا للمعلومات ، وسيتم بالتأكيد تحليلها لسنوات قادمة. أظهر التحليل الأولي لهذه الشبكة انحرافًا عن توزيع قانون القوة الذي يتم ملاحظته بشكل شائع في الشبكات البيولوجية. بالإضافة إلى ذلك ، يُظهر التحليل الإحصائي تنظيم شبكة من مستويين: هياكل قصيرة المدى ، تمثل مجمعات بروتينية ، ومكونات أكبر يُفترض أنها تمثل اتصالات بين معقدة.

أظهر ليونيد ميرني (معهد ماساتشوستس للتكنولوجيا ، كامبريدج ، الولايات المتحدة الأمريكية) أن هناك تنظيمًا مشابهًا في شبكة تفاعل البروتين والبروتين الخميرة وقدم العديد من الخوارزميات لتحديد مثل هذه الهياكل. الأهم من ذلك ، أن الهياكل المستمدة من البيانات الثابتة مثل تفاعلات البروتين-البروتين يمكن أن تتوافق مع مجمعات البروتين ، حيث تتجمع جميع البروتينات معًا في نفس الوقت (على سبيل المثال ، الريبوسوم أو spliceosome) ، أو إلى وحدات وظيفية ديناميكية حيث يتم تحقيق تفاعلات مختلفة في أوقات مختلفة ، على سبيل المثال ، مسارات الإشارات أو وحدات التحكم في دورة الخلية. قدم ميرني أيضًا عمليات محاكاة عشوائية لمسار إشارات الخلية مؤكدة أنه حتى مثل هذه الوحدة البسيطة يمكنها تحقيق ترشيح غير تافه للإشارة.

بينما نتحرى عن الشبكات التنظيمية المنتشرة في الكائنات الحية الحديثة ، من المثير للاهتمام أيضًا دراسة التفاعلات التنظيمية القديمة. المحولات الريبية هي هياكل مكانية من الرنا المرسال يمكنها ربط الجزيئات الصغيرة وتغيير شكل الرنا المرسال ، وقد تمثل أقدم نظام لتنظيم التعبير الجيني. قدم ميخائيل جيلفاند (مركز GosNIIGenetika ، موسكو ، روسيا) عملًا رائعًا حول المحولات الريبية ، والذي يوضح عمل مجموعته أن المحولات الريبية يبدو أنها تتحكم في تركيزات البروتين من خلال تنظيم كل من النسخ والترجمة. تم العثور على المحولات الريبية لتنظيم عملية التمثيل الغذائي ، على سبيل المثال ، الفيتامينات والأحماض الأمينية والبورينات ، ويتم حفظها على مسافات نسجية كبيرة جدًا. قدم غيلفاند أيضًا بعض الأعمال الأولية حول تطور الشبكات التنظيمية التي تتضمن المحولات الريبية.

أدى الهدف المتمثل في شرح التوزيع الملحوظ لعائلات مجال البروتين في الجينوم المتسلسل إلى قيام كونين وزملائه بتطوير نموذج الولادة والموت والابتكار (BDIM). من خلال تغيير المعلمات في BDIM ، يمكن للباحثين التحقيق في كيفية تشكيل العمليات التطورية المختلفة للتوزيعات المرصودة لعائلات المجال. في حين أن أبسط BDIM الخطي يُظهر ملاءمة ممتازة للتوزيع الملحوظ لأحجام عائلة المجال في الجينوم ، فإن إدخال العشوائية في النموذج يؤدي إلى أوقات تطور كبيرة بشكل مانع. أوضح كونين كيف يمكن للتغييرات في النموذج أن تسرع التطور ، على الأقل في السيليكو.


الملخص

لقد كان هدفًا طويل الأمد في بيولوجيا الأنظمة لإيجاد علاقات بين الخصائص الطوبولوجية والسمات الوظيفية لشبكات البروتين. ومع ذلك ، فإن معظم التركيز في دراسات الشبكة كان على البروتينات شديدة الارتباط ("المحاور"). كمفهوم تكميلي ، من الممكن تعريف الاختناقات على أنها بروتينات ذات مركزية عالية (أي عقد الشبكة التي لديها العديد من "المسارات الأقصر" تمر عبرها ، على غرار الجسور والأنفاق الرئيسية على خريطة الطريق السريع). الاختناقات هي ، في الواقع ، بروتينات موصل رئيسية ذات خصائص وظيفية وديناميكية مدهشة. على وجه الخصوص ، من المرجح أن تكون بروتينات أساسية. في الواقع ، في الشبكات التنظيمية وغيرها من الشبكات الموجهة ، يعتبر التباين (أي "الاختناق") مؤشرًا أكثر أهمية على الأهمية من الدرجة (أي "المحور"). علاوة على ذلك ، تتوافق الاختناقات مع المكونات الديناميكية لشبكة التفاعل - فهي أقل ارتباطًا بشكل ملحوظ مع جيرانها من الاختناقات غير المزدحمة ، مما يعني ضمنيًا أن ديناميكيات التعبير موصولة بطوبولوجيا الشبكة.


علم الوجود الجيني وتحليل المسار

كما نوقش أعلاه ، فإن الناتج الأولي لمعظم تجارب "omics" على مستوى الجينوم هو قائمة الجينات (أو منتجاتها) التي تم تغييرها بشكل كبير في حالة الاهتمام. عادةً ما تكون الخطوة الأولى في التحقيق في مجموعات البيانات هذه هي تحليل الإثراء الوظيفي ، والذي يحدد ما إذا كانت قائمة الجينات غنية إحصائيًا لبعض العمليات أو الوظائف البيولوجية. يوفر اتحاد علم الوجود الجيني (GO) ، على سبيل المثال ، مفردات هرمية مضبوطة للمصطلحات لوصف الجينات ومنتجاتها المشفرة من حيث وظائفها الجزيئية أو العمليات البيولوجية أو المكونات الخلوية [1]. يمكن إجراء تحليل تخصيب GO باستخدام إحدى الأدوات العديدة المتاحة للجمهور (http://geneontology.org/page/go-enrichment-analysis) وتفحص هذه التحليلات قائمة الجينات لحدوث مصطلحات GO الأكثر انتشارًا في قائمة جينات الاستعلام أكثر من المتوقع بالصدفة (من المهم ملاحظة أن استخدام خلفية مناسبة أو "كون" لتقييم الأهمية الإحصائية أمر ضروري) [2]. قد تبرز هذه المصطلحات التي تم تمثيلها بشكل مفرط العمليات البيولوجية غير المعترف بها سابقًا (على عكس الجينات الفردية) التي يتم تنظيمها بشكل تفضيلي وتفاضلي في حالة الاهتمام. من سمات GO التي تعد قوة وقيودًا هي هيكلها الهرمي. على الرغم من الجهود المبذولة لتفسير هذا الهيكل في تحليلات التخصيب GO [3] ، لا يزال من الصعب تحديد أي مستوى من التسلسل الهرمي هو المسؤول الأكبر عن الإثراء الإحصائي. غالبًا ما تكون أكثر المصطلحات إثراءً عبارة عن فئات وظيفية واسعة يمكن أن تكون ذات فائدة محدودة لإبلاغ رؤية وظيفية جديدة.

في الخلايا ، المسارات البيولوجية هي المحركات الكيميائية الحيوية المسؤولة عن تحويل الإشارات (التي تتلقاها المستقبلات غالبًا) إلى استجابات المخرجات (مثل تنشيط عامل النسخ والتعبير الجيني المصب). وبالتالي ، يمكن أن يحتوي تحليل الإثراء المستند إلى التعليقات التوضيحية للمسار على معلومات أكثر صلة وقابلة للتفسير بشكل مباشر فيما يتعلق بالعمليات المهمة في اللعب في حالة معينة. تتوفر مجموعة متنوعة من طرق تحليل المسار [4] ، بما في ذلك طرق التمثيل الزائد مثل تلك المطبقة في KEGG [5] أو Reactome [6] أو WikiPathways [7 ، 8] ، InnateDB [9] ، أو DAVID [10] المزيد من الأساليب الكمية القائمة على إثراء مجموعة الجينات [11] والطرق الأحدث التي تحاول تفسير حقيقة أن ليس كل الجينات لديها نفس القوة للتمييز بين المسارات المختلفة [12].

على الرغم من قوتها ، إلا أن طرق تحليل المسار لها حدودها أيضًا. أولاً ، لم يتم تخصيص غالبية الجينات لمسار قانوني (على سبيل المثال ، أكثر من 85٪ من البشر فرقة لم يتم تعيين الجينات لأي مسار KEGG) ، وثانيًا ، بالنسبة لتلك الموجودة ، هناك انحياز كبير نحو مسارات إشارات مدروسة جيدًا [13]. وبالتالي ، يمكن أن يخبرنا تحليل المسار كثيرًا عما نعرفه بالفعل ولكن أقل عن العلاقات الجديدة وغير المتوقعة بين الجينات ذات الاهتمام أو في الواقع بين المسارات نفسها.


توقع الجينات المسببة للأمراض

المجال الثاني الذي أبلغت فيه شبكات التفاعل الجزيئي الحيوي دراسة الأمراض البشرية هو التنبؤ بالجينات الجديدة المرتبطة بالأمراض. الافتراض الرئيسي في هذه الدراسات هو أن الجار الشبكي للجين المسبب للمرض من المحتمل أن يتسبب في نفس المرض أو مرض مشابه (Goh et al.2007 Oti and Brunner 2007). هذا المفهوم موضح في الشكل 2.

شبكة النمط الظاهري الجيني. الظاهر هو الجين المدمج & # x02013gene ، الجين & # x02013 النمط الظاهري ، والنمط الظاهري & # x02013 شبكة تفاعل النمط الظاهري. في هذا المثال الافتراضي ، الأمراض 1 و 2 و 3 لها جينات مسببة معروفة (الجينات A و C و E ، على التوالي) ، وكلها مرتبطة ظاهريًا بالمرض 4 ، الذي يفتقر إلى الجين المسبب المحدد. إذا كانت الجينات المسببة المعروفة مرتبطة وظيفيًا ارتباطًا وثيقًا ، كما هو الحال في هذه الحالة ، فيمكن افتراض وجود الجينات المرشحة (الجينات B و D) للمرض 4 نظرًا لعلاقاتها الوظيفية الوثيقة مع الجينات المعروفة للأمراض المرتبطة بالنمط الظاهري. تشير الخطوط السوداء ذات السماكة المتفاوتة إلى درجة التشابه الظاهري والوظيفي بين الأمراض والجينات ، على التوالي. مستنسخ من Oti and Brunner (2007) وأعيد طبعه بإذن من Blackwell Publishing Ltd. & # x000a9 2007 (www.blackwell-synergy.com).

أوتي وآخرون (2006) يهدف إلى التنبؤ بالجينات المسببة للأمراض للأمراض غير المتجانسة وراثيًا والتي تم فيها تحديد بعض الجينات المسببة ، بينما بالنسبة للعوامل الوراثية الأخرى ، كانت المعلومات الموضعية متاحة فقط. هذا السيناريو هو نموذجي لدراسات الارتباط الجيني الكبيرة ، حيث توجد عادةً عدة مواقع مهمة (تحتوي على علامات متعددة الأشكال مرتبطة بالمرض) ، لكن الجين المسبب المحدد في كل موضع ليس من السهل تحديده. لمرض معين ، Oti et al. (2006) تنبأ جينات مرضية جديدة كتلك التي تقع ضمن أحد المواقع المهمة ولها تفاعل بروتيني مع جين معروف بالفعل أنه يسبب المرض. لقد أظهروا أن التنبؤات باستخدام هذه الطريقة غنية 10 أضعاف بالجينات الحقيقية المسببة للأمراض ، مقارنةً بالاختيار العشوائي للجينات في نفس المكان.

فرانك وآخرون. (2006) ابتكر خوارزمية الأولوية بناءً على مبادئ مماثلة. تصنف الخوارزمية الخاصة بهم مجموعة من الجينات المرشحة المسببة للأمراض في مواقع حساسية متعددة لمزيد من تحليل التسلسل أو الارتباط. ولهذه الغاية ، قاموا ببناء شبكة جينات بشرية وظيفية تعتمد على التفاعلات الجزيئية المعروفة وكذلك العلاقات الوظيفية المتوقعة حسابيًا. تم استخدام الشبكة لتصنيف الجينات المرشحة على أساس تفاعلاتها ، على افتراض أن الجينات المسببة لأي اضطراب واحد ستشارك فقط في عدد قليل من المسارات البيولوجية المتميزة. يشير هذا الافتراض إلى أن الجينات من مواقع القابلية المختلفة ستتجمع ، مما يؤدي إلى مسافات شبكة أقصر (انظر الإطار 1) بين جينات المرض أكثر من التوقع العشوائي.

أخيرًا ، Lage et al. (2007) مدد الأعمال المذكورة أعلاه باستخدام معلومات عن العديد من الأمراض ذات الصلة لمعالجة مهمة التنبؤ. على وجه التحديد ، ابتكروا درجة تشابه النمط الظاهري واستخدموها للبحث عن معقدات البروتين التي ارتبطت جيناتها بأنماط ظاهرية مماثلة. تم إجراء البحث عن مجمعات البروتين على شبكة من تفاعلات البروتين والبروتين # x02013 ، بما في ذلك التفاعلات المبلغ عنها والتفاعلات التي تم نقلها من الكائنات الحية النموذجية. تم تصنيف كل بروتين مرشح من خلال درجة تشابه النمط الظاهري للأمراض المرتبطة بالبروتين وجيرانه الشبكيين المباشرين. كان التفسير البيولوجي لمرشح عالي الدرجات هو أن هذا البروتين من المحتمل أن يكون متورطًا في علم الأمراض الجزيئي لاضطراب مثير للاهتمام ، لأنه جزء من مركب مرشح عالي الثقة يُعرف أن بعض البروتينات متورطة فيه بدرجة عالية. اضطرابات متشابهة (أو متطابقة).

وهكذا ، فإن فكرة أن البروتينات القريبة من بعضها في شبكة تسبب أمراضًا مماثلة أصبحت عاملاً متزايد الأهمية في البحث عن جينات المرض. تعالج المناهج المختلفة مشكلة التنبؤ باستخدام أنواع مختلفة من البيانات المتكاملة ، ولكن جميعها تتضمن تركيب مجموعة من الجينات المرشحة جنبًا إلى جنب مع مجموعة من جينات المرض المعروفة على شبكة مادية أو وظيفية. & # x0201cDe-novo & # x0201d المناهج التي لا تعتمد على المعرفة السابقة بجينات المرض لم يتم تطويرها بعد.


3 طرق مقترحة

تم اعتماد خوارزميات MOMA و MOMA الخطية [27 ، 28] في شبكات التمثيل الغذائي لتوسيع نموذج ILP في المعادلة (1) لإنشاء عدة مجموعات MDS لشبكات PPI ، حيث قد يكون لواحد أو أكثر من مجموعات MDSs وظائف بيولوجية. نظرًا لأن خوارزميات MOMA هي خوارزميات شهيرة في إعادة البناء والتحليل المستند إلى القيود (COBRA) لنماذج التمثيل الغذائي [36] ، فقد أطلق المؤلفون على نماذجهم المطورة نماذج مقيدة للسيطرة على شبكات PPI (https://github.com/Alofairi1976/ MOIA). بشكل أساسي ، كان الهدف هو إنشاء مجموعات MDS مع أكبر عدد من الاختلافات فيما بينها. يمكن استخدام مجموعات MDS المختلفة هذه لتحديد العقد الحرجة ، والتي تعكس البروتينات الفعالة واكتساب معلومات مهمة حول شبكة PPI. على سبيل المثال ، تحتوي الشبكة في الشكل 2 على 10 مجموعات MDS ، ومع ذلك ، فإن اثنتين فقط من مجموعات MDS الموضحة في الأشكال 2 (ب ، ج) كافية للعثور على المجموعة الحرجة كما هو موضح باللون الأحمر في الشكل 2 (د).

تتكون الطريقة المقترحة من ثلاث مراحل رئيسية ، كما هو موضح في الشكل 3. تقوم المرحلة الأولى بتحسين مجموعة البيانات المحددة باستخدام تقنيات معالجة البيانات المناسبة ، والتي تتضمن جمع بيانات PPI ، واختيار البروتين ، وتنفيذ الرسم البياني (المصفوفة المجاورة). تتضمن المرحلة الثانية استخدام نموذج واحد تم اختياره من ثلاثة نماذج مطورة: النموذجان الأكثر اختلافًا من MDSets (2MD-MDSets) هما نموذج MDSets التكراري (ITR-MDSets) ، ونموذج MDSet المحدد من قبل المستخدم (URD-MDSet). يهدف نموذج 2MD-MDSets إلى إنشاء مجموعتي MDS في وقت واحد مع أقصى عدد من العقد المختلفة بين مجموعات MDS. يمكن استخدام نموذج ITR-MDSets لإنشاء العديد من مجموعات MDS المختلفة. يمكن لنموذج URD-MDSet إنشاء مجموعة MDSet تحتوي على عقد محددة يحددها المستخدم. في المرحلة الثالثة من طريقة MOIA المقترحة ، تمت مناقشة النتائج التي تم الحصول عليها وتفسيرها. تتضمن هذه النتائج العديد من مجموعات MDS التي تم إنشاؤها وفقًا لمعايير مختلفة لاستخدامها في تحديد بروتينات المجموعة الحرجة ، والمتقطعة ، والبروتينات الزائدة عن الحاجة. في هذا البحث ، سلط المؤلفون الضوء على أهمية ما يسمونه المجموعة الحرجة (k - 1) في شبكة PPI. في القسم الفرعي التالي ، تمت مناقشة نموذج Basic-MDSet في [8]. بعد ذلك ، يتم تقديم النماذج المقترحة في الأقسام الفرعية المتبقية. للتعبير عن الخوارزميات المقترحة هنا ، يتم تحديد الرموز التالية:

أنا n × n: مصفوفة الهوية n -by- مع تلك الموجودة على القطر الرئيسي والأصفار في مكان آخر.

J n × m: مصفوفة الآحاد ، حيث تكون جميع مدخلات n -by- م واحدة.

O n × m: مصفوفة الأصفار ، حيث تكون جميع مدخلات n -by- m أصفارًا.

A n × n: المصفوفة المجاورة ، حيث تكون جميع مدخلات n -by- m عبارة عن ثنائيات 0 أو 1.

X Y: تنتمي مجموعة جميع العناصر إلى المتجه X وليس المتجه Y.

X ∪ Y: اتحاد المتجهين X و Y.

| X | : حجم المتجه X وعددها.

هيكل طريقة MOIA المقترحة. (أ) يوضح الرسم البياني البسيط أنواع العقد أو البروتينات المسيطرة (MDSet) الدنيا. (ب) خط أنابيب MOIA الذي يصف النماذج المطورة جنبًا إلى جنب مع نتائج النموذج k - الحرجة و (k - 1) - المجموعات الحرجة تعظيم تعديل التفاعل (MOIA)

3.1 نموذج Basic-MDSet المستند إلى ILP

طبق Wuchty [8] النموذج القائم على ILP [22] لإيجاد الحل الأمثل لمشكلة MDSet لشبكات PPI على النحو التالي: حل المشكلة في المعادلة (1) هو ناقل ثنائي x ، حيث x = 1 إذا كان البروتين أنا أنتمي إلى MDSet الذي تم إنشاؤه و xi = 0 وإلا. تقدم الخوارزمية 1 رمزًا زائفًا يصف الخطوات المستخدمة لترجمة تنفيذ النموذج المقترح في المعادلة (1).

الخوارزمية 1. نموذج Basic-MDSet

1.1. اقرأ عدد العقد n وملف البيانات.

1.2 أنشئ مصفوفة الجوار An × n.

2. قم ببناء النموذج كما هو موضح في المعادلة (1):

3. احسب MDSet M = Solver (C ، A ، Lc ، Uc ، Lx ، Ux).

3.2 نموذج 2MD-MDSets

تقدم الخوارزمية 2 رمزًا زائفًا يصف الخطوات المستخدمة لترجمة النموذج المقترح في المعادلة (3).

الخوارزمية 2. نموذج 2MD-MDSets

1.1. اقرأ عدد العقد n وملف البيانات.

1.2 أنشئ مصفوفة الجوار An × n.

2. قم باستدعاء الخوارزمية 1 للعثور على MDSet M وحساب حجمها | M |.

3. قم ببناء النموذج كما هو موضح في المعادلة (3):

3.2 اضبط BigA = [An × nOn × nOn × nOn × nAn × nOn × nJ1 × nO1 × nO1 × nO1 × nJ1 × nO1 × nin × nin × nin × nin × n In × n]

3.3 اضبط BigLc = [Jn × 1Jn × 1 | M || M | تشغيل × 1On × 1] و BigUc = [nJn × 1nJn × 1 | M || M | 2Jn × 12Jn × 1]

3.4. اضبط BigLx = O3n × 1 و BigUx = J3n × 1

4. احسب المجموعة BigM = Solver (BigC ، BigA ، BigLc ، BigUc ، BigLx ، BigUx).

5. استخرج MDSets M1 و M2 من BigM ، حيث BigM = [M1M2O1 × n].

6. أعد مجموعتي MDSets M1 و M2.

3.3 نموذج ITR-MDSets

تقدم الخوارزمية 3 رمزًا زائفًا يصف الخطوات المستخدمة في ترجمة النموذج المقترح في المعادلة (4).

الخوارزمية 3. نموذج ITR-MDSets

1.1. اقرأ عدد العقد n وملف البيانات.

1.2 أنشئ مصفوفة الجوار An × n.

2. استخدم الخوارزمية 2 للعثور على مجموعتي MDSets M1 و M2.

3. اضبط X = O1 × n ، Xnew = M1∪M2 واضبط العداد l = 3.

4. أثناء | Xnew | & gt0 ، كرر الخطوات من 4.1 إلى 4.8

4.2 قم ببناء النموذج كما هو موضح في المعادلة (4):

4.4 تعيين BigA = [An × nOn × nJ1 × nO1 × nIn × nIn × n × n − In × n]

4.5 اضبط BigLc = [Jn × 1 | M1 | تشغيل × 1 − XT] و BigUc = [nJn × 1 | M1 | 2 − XTJn × 1]

4.6 اضبط BigLx = O2n × 1 و BigUx = J2n × 1

4.7 احسب المجموعة BigM = Solver (BigC و BigA و BigLc و BigUc و BigLx و BigUx).

4.8 استخرج MDSets M1 من BigM ، حيث BigM = [O1 × nM1].

5. قم بإرجاع X ومجموعات MDSets المتعددة M1 ، M2 ، M3 ، ... ، Mk.

هنا ، بعد العثور على X ومجموعات MDS المتعددة ، M 1 ، M 2 ، M 3 ، ... ، M k ، يمكن تنفيذ الخطوات التالية لتصنيف جميع البروتينات في شبكة PPI المستهدفة:

المجموعة الحرجة k = ∩ i M i ، هي تقاطع جميع مجموعات MDS M 1 ، M 2 ، M 3 ، ... ، M k.

المجموعة الحرجة (k - 1) = ∑ i ∩ j ≠ i M j ، هي مجموعة جميع العقد الموجودة في (k - 1) MDSets.

المجموعة المتقطعة = ∪ i M i ، هي اتحاد كل MDSets M 1 ، M 2 ، M 3 ، ... ، M k.

المجموعة الزائدة هي تكملة المجموعة المتقطعة.

3.4 نموذج URD-MDSet

تصف الخوارزمية 4 الخطوات اللازمة لإنشاء MDSet المستهدفة عن طريق تجنب بعض العقد المحددة.

الخوارزمية 4. نموذج URD-MDSet

1.1. اقرأ عدد العقد n وملف البيانات.

1.2 أنشئ مصفوفة الجوار An × n.

1.3 اقرأ متجه جميع العقد التي سيتم تجنبها ، إن أمكن ، في MDSet المستهدفة.

2. استخدم الخوارزمية 1 للعثور على MDSet M.

3. قم ببناء النموذج كما هو موضح في المعادلة (4):

3.2 تعيين BigA = [An × nOn × nJ1 × nO1 × nIn × nIn × n × n − In × n]

3.3 اضبط BigLc = [Jn × 1 | M | تشغيل × 1 − XT] و BigUc = [nJn × 1 | M | 2 − XTJn × 1]

3.4. اضبط BigLx = O2n × 1 و BigUx = J2n × 1

4. احسب المجموعة BigM = Solver (BigC ، BigA ، BigLc ، BigUc ، BigLx ، BigUx).

5. استخرج MDSets M1 من BigM ، حيث BigM = [O1 × nM1].


نبذة عن الكاتب

فالك شرايبر هو عالم كمبيوتر عمل في المعلوماتية الحيوية لأكثر من عشر سنوات. تشمل مجالات بحثه الحالية نمذجة وتحليل وتصور خوارزميات الرسم البياني للشبكات البيولوجية واستكشاف البيانات وتصور المعلومات في علوم الحياة. منذ عام 2003 ، كان رئيسًا لمجموعة أبحاث تحليل الشبكة في معهد لايبنيز لعلم الوراثة النباتية وبحوث المحاصيل النباتية. تم تعيينه أستاذا للمعلوماتية الحيوية في جامعة مارتن لوثر هالي-فيتنبرغ ، ألمانيا ، في عام 2007.


مراجع

هارتويل ، إل إتش ، هوبفيلد ، جيه ، ليبلر ، إس آند موراي ، إيه دبليو من الجزيئية إلى بيولوجيا الخلية المعيارية. طبيعة سجية 402، C47-C52 (1999). تدافع ورقة المفاهيم المؤثرة هذه بقوة عن التنظيم المعياري للوظائف البيولوجية.

هيستي ، ج. ، ماكميلن ، د. وأمبير كولينز ، جيه.دارات الجينات المهندسة. طبيعة سجية 420, 224–230 (2002).

كيتانو ، هـ. بيولوجيا الأنظمة الحاسوبية. طبيعة سجية 420, 206–210 (2002).

Koonin، E. V.، Wolf، Y.I & amp Karev، G. P. هيكل الكون البروتين وتطور الجينوم. طبيعة سجية 420, 218–223 (2002).

Oltvai، Z.N & amp Barabási، A. -L. هرم تعقيد الحياة. علم 298, 763–764 (2002).

Wall ، M. E. ، Hlavacek ، W. S. & amp Savageau ، M.A. تصميم الدوائر الجينية: دروس من البكتيريا. القس الطبيعة جينيه. 5, 34–42 (2004).

براي ، د. الشبكات الجزيئية: العرض من أعلى لأسفل. علم 301, 1864–1865 (2003).

ألون ، يو. الشبكات البيولوجية: المصلح كمهندس. علم 301, 1866–1867 (2003).

Albert، R. & amp Barabási، A. -L. الميكانيكا الإحصائية من الشبكات المعقدة. القس وزارة الدفاع. فيز. 74, 47–97 (2002).

Dorogovtsev، S.N & amp Mendes، J. F. تطور الشبكات: من الشبكات البيولوجية إلى الإنترنت والمراقبة العالمية للطقس. (مطبعة جامعة أكسفورد ، أكسفورد ، 2003).

Bornholdt، S. & amp Schuster، H. G. كتيب الرسوم البيانية والشبكات: من الجينوم إلى الإنترنت (Wiley-VCH ، برلين ، ألمانيا ، 2003).

Strogatz ، S. H. استكشاف الشبكات المعقدة. طبيعة سجية 410, 268–276 (2001).

بولوبا ، ب. الرسوم البيانية العشوائية (المطبعة الأكاديمية ، لندن ، 1985).

Erdös، P. & amp Rényi، A. حول تطور الرسوم البيانية العشوائية. سنة النشر. رياضيات. إنست. التعلق. أكاد. علوم. 5, 17–61 (1960).

Barabási، A. -L. & amp Albert، R. ظهور التدرج في الشبكات العشوائية. علم 286, 509–512 (1999). قدمت هذه الورقة مفهوم الشبكات الخالية من المقاييس واقترحت آلية لظهورها.

جيونج ، إتش ، تومبور ، بي ، ألبرت ، آر ، أولتفاي ، زد إن آند باراباسي ، إيه-إل. التنظيم الواسع النطاق لشبكات التمثيل الغذائي. طبيعة سجية 407, 651–654 (2000).

Wagner، A. & amp Fell، D. A. العالم الصغير داخل شبكات التمثيل الغذائي الكبيرة. بروك. R. Soc. لوند. ب 268, 1803–1810 (2001). تقدم المراجع 16 و 17 التقرير الأول عن التنظيم الواسع النطاق لشبكات التمثيل الغذائي ، مما يوضح طبيعتها الخالية من المقاييس.

جيونج ، هـ. ، ميسون ، س. ، باراباسي ، إيه-إل. & amp Oltvai، Z. N. الفتك ومركزية في شبكات البروتين. طبيعة سجية 411, 41–42 (2001).

Wagner، A. تتطور شبكة تفاعل بروتين الخميرة بسرعة وتحتوي على عدد قليل من الجينات المكررة الزائدة. مول. بيول. Evol. 18, 1283–1292 (2001).

جيوت ، ل. وآخرون. خريطة تفاعل البروتين ذبابة الفاكهة سوداء البطن. علم 302, 1727–1736 (2003).

لي ، إس وآخرون. خريطة للشبكة التفاعلية للميتازوان ، C. ايليجانس. علم 2 يناير 2004 (دوى: 10.1126 / العلوم 1091403)

Yook، S. -H.، Oltvai، Z.N & amp Barabási، A. -L. التوصيف الوظيفي والطوبولوجي لشبكات تفاعل البروتين. البروتيوميات (في الصحافة).

Uetz ، P. وآخرون. تحليل شامل لتفاعلات البروتين والبروتين في خميرة الخميرة. طبيعة سجية 403, 623–627 (2000).

إيتو ، ت. وآخرون. تحليل شامل ثنائي الهجين لاستكشاف تفاعل بروتين الخميرة. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 98, 4569–4574 (2001).

Featherstone، D.E & amp Broadie، K. المصارعة مع تعدد الأشكال: التحليل الجيني والطوبولوجي لشبكة التعبير الجيني للخميرة. بيوسيس 24, 267–274 (2002).

Agrawal ، H. التنظيم الذاتي المتطرف في الشبكات التي تم إنشاؤها من بيانات التعبير الجيني. فيز. القس ليت. 89, 268702 (2002).

Wuchty، S. السلوك الخالي من المقاييس في شبكات مجال البروتين. مول. بيول. Evol. 18, 1694–1702 (2001).

Apic، G.، Gough، J. & amp Teichmann، S. A. نظرة ثاقبة على تركيبات المجال. المعلوماتية الحيوية 17، S83 - S89 (2001).

Shen-Orr، S. S.، Milo، R.، Mangan، S. & amp Alon، U. شبكة الزخارف في شبكة تنظيم النسخ الخاصة بـ الإشريكية القولونية. طبيعة الجينات. 31, 64–68 (2002).

Milo، R.، Shen-Orr، S. S.، Itzkovitz، S.، Kashtan، N. & amp Alon، U. زخارف الشبكة: لبنات بناء بسيطة لشبكات معقدة. علم 298, 824–827 (2002). تقدم المراجع 29 و 30 مفهوم الزخارف في الشبكات البيولوجية وغير البيولوجية.

Vogelstein، B.، Lane، D. & amp Levine، A. J. Surfing the p53 network. طبيعة سجية 408, 307–310 (2000).

ميلجرام ، س. مشكلة العالم الصغير. بسيتشول. اليوم 2, 60 (1967).

Watts، D.J & amp Strogatz، S.H. الديناميات الجماعية لشبكات "العالم الصغير". طبيعة سجية 393, 440–442 (1998).

Chung، F. & amp Lu، L. متوسط ​​المسافات في الرسوم البيانية العشوائية بالدرجات المتوقعة المعطاة. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 99, 15879–15882 (2002).

Cohen، R. & amp Havlin، S. الشبكات الخالية من النطاق صغيرة جدًا. فيز. القس ليت. 90, 058701 (2003).

Maslov، S. & amp Sneppen، K. الخصوصية والاستقرار في طوبولوجيا شبكات البروتين. علم 296, 910–913 (2002). تشير هذه الورقة البحثية إلى أنه في شبكات تفاعل البروتين ، تميل العقد شديدة الارتباط إلى الارتباط ببروتينات أقل ارتباطًا ، وهو ما يسمى بالخاصية التحريضية.

Pastor-Satorras، R.، Vázquez، A. & amp Vespignani، A. الخصائص الديناميكية والترابطية للإنترنت. فيز. القس ليت. 87, 258701 (2001).

نيومان ، إم إي جيه الخلط المتنوع في الشبكات. فيز. القس ليت. 89, 208701 (2002).

Rzhetsky، A. & amp Gomez، S. M. ولادة شبكات جزيئية خالية من المقاييس وعدد مجالات الحمض النووي والبروتين المتميزة لكل جينوم. المعلوماتية الحيوية 17, 988–996 (2001).

Qian، J.، Luscombe، N.M & amp Gerstein، M. عائلة البروتين وظهور أضعاف في الجينوم: سلوك قانون القوة والنموذج التطوري. جيه مول. بيول. 313, 673–681 (2001).

Bhan، A.، Galas، D.J & amp Dewey، T.G. نموذج نمو مضاعف لشبكات التعبير الجيني. المعلوماتية الحيوية 18, 1486–1493 (2002).

Pastor-Satorras، R.، Smith، E. & amp Sole، R. تطور شبكات تفاعل البروتين من خلال تكرار الجينات. J. Theor. بيول. 222, 199–210 (2003).

Vazquez، A.، Flammini، A.، Maritan، A. & amp Vespignani، A. نمذجة شبكات تفاعل البروتين. ComPlexUs 1, 38–44 (2003).

Kim، J.، Krapivsky، P. L.، Kahng، B. & amp Redner، S. الترشيح اللانهائي والتقلبات العملاقة في شبكة تفاعل البروتين. فيز. Rev. E. Stat. Nonlin. Soft Matter Phys. 66, 055101 (2002).

Wagner, A. How the global structure of protein interaction networks evolves. بروك. R. Soc. لوند. ب 270, 457–466 (2003).

Eisenberg, E. & Levanon, E. Y. Preferential attachment in the protein network evolution. فيز. القس ليت. 91, 138701 (2003).

Ravasz, E. & Barabási, A. -L. Hierarchical organization in complex networks. فيز. Rev. E. Stat. Nonlin. Soft Matter Phys. 67, 026112 (2003).

Alberts, B. The cell as a collection of protein machines: preparing the next generation of molecular biologists. زنزانة 92, 291–294 (1998).

سيمون ، آي وآخرون. Serial regulation of transcriptional regulators in the yeast cell cycle. زنزانة 106, 697–708 (2001).

Tyson, J. J., Csikasz-Nagy, A. & Novak, B. The dynamics of cell cycle regulation. بيوسيس 24, 1095–1109 (2002).

McAdams, H. H. & Shapiro, L. A bacterial cell-cycle regulatory network operating in time and space. علم 301, 1874–1877 (2003).

Bhalla, U. S., Ram, P. T. & Iyengar, R. MAP kinase phosphatase as a locus of flexibility in a mitogen-activated protein kinase signaling network. علم 297, 1018–1023 (2002).

Ravasz, E., Somera, A. L., Mongru, D. A., Oltvai, Z. N. & Barabási, A. -L. Hierarchical organization of modularity in metabolic networks. علم 297, 1551–1555 (2002). This paper introduced the concept of hierarchical networks, specifically in the context of metabolism.

Itzkovitz, S., Milo, R., Kashtan, N., Ziv, G. & Alon, U. Subgraphs in random networks. فيز. Rev. E. Stat. Nonlin. Soft Matter Phys. 68, 026127 (2003).

Wuchty, S., Oltvai, Z. N. & Barabási, A. -L. Evolutionary conservation of motif constituents within the yeast protein interaction network. طبيعة الجينات. 35, 176–179 (2003).

Conant, G. C. & Wagner, A. Convergent evolution of gene circuits. طبيعة الجينات. 34, 264–246 (2003).

Hinman, V. F., Nguyen, A. T., Cameron, R. A. & Davidson, E. H. Developmental gene regulatory network architecture across 500 million years of echinoderm evolution. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 100, 13356–13361 (2003).

Dorogovtsev, S. N., Goltsev, A. V. & Mendes, J. F. F. Pseudofractal scale-free web. فيز. Rev. E. Stat. Nonlin. Soft Matter Phys. 65, 066122 (2002).

Schuster, S., Pfeiffer, T., Moldenhauer, F., Koch, I. & Dandekar, T. Exploring the pathway structure of metabolism: decomposition into subnetworks and application to الميكوبلازما الرئوية. المعلوماتية الحيوية. 18, 351–361 (2002).

Snel, B., Bork, P. & Huynen, M. A. The identification of functional modules from the genomic association of genes. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 99, 5890–5895 (2002).

Girvan, M. & Newman, M. E. J. Community structure in social and biological networks. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 99, 7821–7826 (2002).

Holme, P., Huss, M. & Jeong, H. Subnetwork hierarchies of biochemical pathways. المعلوماتية الحيوية 19, 532–538 (2003).

Rives, A. W. & Galitski, T. Modular organization of cellular networks. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 100, 1128–1133 (2003).

Spirin, V. & Mirny, L. A. Protein complexes and functional modules in molecular networks. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 100, 12123–12128 (2003).

Ihmels, J. et al. Revealing modular organization in the yeast transcriptional network. طبيعة الجينات. 31, 370–377 (2002).

Bader, G. D. & Hogue, C. W. Analyzing yeast protein-protein interaction data obtained from different sources. Nature Biotechnol. 20, 991–997 (2002).

Stuart, J. M., Segal, E., Koller, D. & Kim, S. K. A gene-coexpression network for global discovery of conserved genetic modules. علم 302, 249–255 (2003).

Tornow, S. & Mewes, H. W. Functional modules by relating protein interaction networks and gene expression. الدقة الأحماض النووية. 31, 6283–6289 (2003).

Jansen, R. et al. A Bayesian networks approach for predicting protein–protein interactions from genomic data. علم 302, 449–453 (2003).

Bar-Joseph, Z. et al. Computational discovery of gene modules and regulatory networks. Nature Biotechnol. 21, 1337–1342 (2003).

Albert, R., Jeong, H. & Barabási, A. -L. Error and attack tolerance of complex networks. طبيعة سجية 406, 378–382 (2000). This paper addresses the topological robustness and vulnerability of complex networks.

Winzeler, E. A. et al. Functional characterization of the S. cerevisiae genome by gene deletion and parallel analysis. علم 285, 901–906 (1999).

Giaever, G. et al. Functional profiling of the خميرة الخميرة الجينوم. طبيعة سجية 418, 387–391 (2002).

Gerdes, S. Y. et al. Experimental determination and system-level analysis of essential genes in الإشريكية القولونية MG1655. J. باكتيريول. 185, 5673–5684 (2003).

Yu, B. J. et al. Minimization of the الإشريكية القولونية genome using a Tn5-targeted Cre/loxP excision system. Nature Biotechnol. 20, 1018–1023 (2002).

Kolisnychenko, V. et al. Engineering a reduced الإشريكية القولونية الجينوم. الدقة الجينوم. 12, 640–647 (2002).

Fraser, H. B., Hirsh, A. E., Steinmetz, L. M., Scharfe, C. & Feldman, M. W. Evolutionary rate in the protein interaction network. علم 296, 750–752 (2002).

Krylov, D. M., Wolf, Y. I., Rogozin, I. B. & Koonin, E. V. Gene loss, protein sequence divergence, gene dispensability, expression level, and interactivity are correlated in eukaryotic evolution. الدقة الجينوم. 13, 2229–2235 (2003).

Dezso, Z., Oltvai, Z. N. & Barabási, A. -L. Bioinformatics analysis of experimentally determined protein complexes in the yeast, خميرة الخميرة. الدقة الجينوم. 13, 2450–2454 (2003).

Barkai, N. & Leibler, S. Robustness in simple biochemical networks. طبيعة سجية 387, 913–917 (1997).

Alon, U., Surette, M. G., Barkai, N. & Leibler, S. Robustness in bacterial chemotaxis. طبيعة سجية 397, 168–171 (1999). References 80 and 81 represents the first theoretical/experimental study on the functional robustness of a cellular sub-network, focusing on the bacterial chemotaxis receptor module.

von Dassow, G., Meir, E., Munro, E. M. & Odell, G. M. The segment polarity network is a robust developmental module. طبيعة سجية 406, 188–192 (2000).

Albert, R. & Othmer, H. G. The topology of the regulatory interactions predicts the expression pattern of the segment polarity genes in ذبابة الفاكهة سوداء البطن. J. Theor. بيول. 223, 1–18 (2003).

Kirschner, M. & Gerhart, J. Evolvability. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 95, 8420–8427 (1998).

Savageau, M. Biochemical Systems Analysis: a Study of Function and Design in Molecular Biology (Addison-Wesley, Reading, 1976).

Fell, D. A. فهم السيطرة على التمثيل الغذائي (Portland, London, 1997).

Schilling, C. H. & Palsson, B. O. The underlying pathway structure of biochemical reaction networks. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 95, 4193–4198 (1998).

Segre, D., Vitkup, D. & Church, G. M. Analysis of optimality in natural and perturbed metabolic networks. بروك. ناتل أكاد. علوم. الولايات المتحدة الأمريكية 99, 15112–15117 (2002).

Edwards، J. S.، Ibarra، R. U. & amp Palsson، B. O. في السيليكو predictions of الإشريكية القولونية تتوافق قدرات التمثيل الغذائي مع البيانات التجريبية. Nature Biotechnol. 19, 125–130 (2001).

Ibarra, R. U., Edwards, J. S. & Palsson, B. O. الإشريكية القولونية K-12 undergoes adaptive evolution to achieve في السيليكو predicted optimal growth. طبيعة سجية 420, 186–189 (2002). After their theoretical work on flux–balance analysis, the authors of references 89 and 90 show its relevance to predicting experimentally observable metabolic flux values.

Almaas, E., Kovács, B., Vicsek, T., Oltvai, Z. N. & Barabási, A. -L. Global organization of metabolic fluxes in بكتريا قولونية. طبيعة سجية, (in the press).

de la Fuente, A., Brazhnik, P. & Mendes, P. Linking the genes: inferring quantitative gene networks from microarray data. اتجاهات الجينات. 18, 395–398 (2002).

Kuznetsov, V. A., Knott, G. D. & Bonner, R. F. General statistics of stochastic processes of gene expression in eucaryotic cells. علم الوراثة 161, 1321–1332 (2002).

Farkas, I. J., Jeong, H., Vicsek, T., Barabási, A. -L. & Oltvai, Z. N. The topology of the transcription regulatory network in the yeast, خميرة الخميرة. Physica A 318, 601–612 (2003).

Grigoriev, A. A relationship between gene expression and protein interactions on the proteome scale: analysis of the bacteriophage T7 and the yeast خميرة الخميرة. الدقة الأحماض النووية. 29, 3513–3519 (2001).

Ge, H., Liu, Z., Church, G. M. & Vidal, M. Correlation between transcriptome and interactome mapping data from خميرة الخميرة. طبيعة الجينات. 29, 482–486 (2001).

Jansen, R., Greenbaum, D. & Gerstein, M. Relating whole-genome expression data with protein-protein interactions. الدقة الجينوم. 12, 37–46 (2002).

Goh, K. I., Kahng, B. & Kim, D. Fluctuation-driven dynamics of the internet topology. فيز. القس ليت. 88, 108701 (2002).

Braunstein, L. A., Buldyrev, S. V., Cohen, R., Havlin, S. & Stanley, H. E. Optimal paths in disordered complex networks. فيز. القس ليت. 91, 168701 (2003).

Menezes, M. A. & Barabási, A. -L. Fluctuations in network dynamics. فيز. القس ليت. (في الصحافة).

Elowitz, M. B., Levine, A. J., Siggia, E. D. & Swain, P. S. Stochastic gene expression in a single cell. علم 297, 1183–1186 (2002).

تسايتلينجر ، جيه وآخرون. Program-specific distribution of a transcription factor dependent on partner transcription factor and MAPK signaling. زنزانة 113, 395–404 (2003).

Ideker, T. et al. Integrated genomic and proteomic analyses of a systematically perturbed metabolic network. علم 292, 929–934 (2001).

Danial, N. N. et al. BAD and glucokinase reside in a mitochondrial complex that integrates glycolysis and apoptosis. طبيعة سجية 424, 952–956 (2003).

Alizadeh, A. A. et al. Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. طبيعة سجية 403, 503–511 (2000).

Emmerling, M. et al. Metabolic flux responses to pyruvate kinase knockout in الإشريكية القولونية. J Bacteriol 184, 152–164 (2002).


الملخص

The modern synthesis of evolutionary theory and genetics has enabled us to discover underlying molecular mechanisms of organismal evolution. We know that in order to maximize an organism's fitness in a particular environment, individual interactions among components of protein and nucleic acid networks need to be optimized by natural selection, or sometimes through random processes, as the organism responds to changes and/or challenges in the environment. Despite the significant role of molecular networks in determining an organism's adaptation to its environment, we still do not know how such inter- and intra-molecular interactions within networks change over time and contribute to an organism's evolvability while maintaining overall network functions. One way to address this challenge is to identify connections between molecular networks and their host organisms, to manipulate these connections, and then attempt to understand how such perturbations influence molecular dynamics of the network and thus influence evolutionary paths and organismal fitness. In the present review, we discuss how integrating evolutionary history with experimental systems that combine tools drawn from molecular evolution, synthetic biology and biochemistry allow us to identify the underlying mechanisms of organismal evolution, particularly from the perspective of protein interaction networks.


Systems biology and metabolic networks predict heterosis

When genetically distant individuals are crossed, their offspring often show greater vigour than their parents for quantitative traits. For example, growth is faster, age of reproduction is earlier, fertility is higher and resistance to disease is stronger. This phenomenon, called heterosis, has been exploited by humans in animal and plant breeding and has implications for evolutionary biology.

The introduction of cross-pollinated (hybrid) plants was one of the most important innovations in agriculture and global food security. Most annual crops show heterosis. Hybrid maize, for example, can yield twice as much as the parent plants. The growth rate of some hybrid yeasts exceeds that of parental strains by more than an order of magnitude.

So far heterosis has been used without full knowledge of the underlying genetic or molecular principles. Because the effects of heterosis can be so impressive, such an understanding could greatly advance breeding. Most recent studies of heterosis have focused on detecting quantitative trait loci (QTL) – sections of DNA that correlate with variation in a trait. QTL are used to explore genetic effects or to search for expression of transcripts or proteins in hybrids in the hope of identifying molecular mechanisms for heterosis in particular traits.

However, descriptive approaches like this cannot provide a general and biologically realistic model accounting for the pervasiveness of heterosis. This is where a systemic approach based on metabolic network modelling is proving useful.

Systems and network biology
Heterosis has inspired many genetic, genomic and molecular studies, but has less often been investigated from the perspective of systems biology, Prof Dominique de Vienne’s focus. Systems biologists model complex biological systems, such as molecules and their interactions within a living cell, rather than looking at isolated parts.

Related to this is network biology enabling the representation and analysis of biological systems with tools derived from graph theory, which uses mathematical structures to model multiple relations between objects, and topology, which considers the arrangement of the elements of a network.

Network analysis works with the complexity of the network to extract meaningful information that you would not have if individual components were examined separately. The data explosion from the ‘omics’ era of biological research has led to more systemic approaches to data analysis and a move away from single gene/protein studies.

Adding the ending ‘omics’ to a molecular term implies a comprehensive assessment of a set of molecules. Genomics, the first omics approach, focused on entire genomes as opposed to genetics which looks at individual variants or single genes. Quantitative proteomics provides expression data for hundreds of proteins, including enzymes, while metabolomics techniques can access thousands of metabolites.

Heterosis has inspired genetic, genomic and molecular studies, but has less often been investigated from the perspective of systems biology.

Complex information like this can be represented by networks to model the biological system of interest. Some of the most common types of biological networks are protein–protein interaction networks, metabolic networks, genetic interaction networks, gene/transcriptional regulatory networks and cell signalling networks: heterosis could emerge from all these networks.

Studying genotype–phenotype relationships
The genetic makeup of an individual, its ‘genotype’, determines its characteristics or ‘phenotype’ in a given environment. The genotype–phenotype relationship is of fundamental interest to breeders as it describes how genetic polymorphism causes phenotypic variation. Genetic polymorphism due to mutations in the genotype produces the variety of forms seen in populations.

Heterosis in action. The middle plant is the offspring of the two plants on either side: its increased vigor is clear. Photo Credit: Julie B. Fiévet

If the genotype–phenotype relationships were linear (proportionality between genotype and phenotype values), offspring would have intermediate trait values compared to their parents, not better ones. Actually, the cellular processes involved in biological functions and structures are complex, and the relationship between measurable parameters at genotype and phenotype levels is often found to be non-linear. Network models in systems biology are typically highly non-linear and can be used effectively to study phenotype responses to genotype variation.

Dominique de Vienne and colleagues suggest that heterosis is an emergent property of living systems resulting from non-linear relationships between genotypic variables and phenotypes or between different phenotypic levels, from the molecular to the individual. They use a systemic approach to show that the key to understanding heterosis may lie in the ‘law of diminishing returns’.

This ‘law’ states that in all productive processes, adding more of one factor while holding all others constant, will eventually yield lower incremental returns. In biological terms, when the concentration or activity of a cellular component increases gradually, the effect on the phenotype is at first high but then begins to fade away.

Mathematic modelling of physiological dominance suggested that heterosis is an intrinsic property of non-linear relationships between traits.

For example, if the concentration of an enzyme in a metabolic network increases, the metabolic flux (rate of synthesis of molecules catalysed by enzymes) through this network initially grows rapidly, then slows down as the enzyme concentration goes up. Thus the kinetics (or rates) of biochemical and molecular reactions are intrinsically non-linearly related to enzyme concentrations.

Non-linear genotype–phenotype relationship is the key of heterosis
Non-linearity has been demonstrated at different levels of organisation, from genetic transcription/translation to fitness-related characteristics. When considering one locus, it appears to explain the dominance of the most active allele over the least active, as proposed as early as 1934 by Sewall Wright, a famous American evolutionary geneticist.

Improvements in technology have advanced crop breeding. LuckyStep/Shutterstock.com

When the trait is controlled by many loci, which is the most common situation, heterosis arises as a consequence of two linked phenomena. First, the slightly deleterious recessive alleles of one parent are complemented by superior dominant alleles of the other parent. The hybrid can therefore have a higher value than both parents, and so hybrid vigour is expected to be stronger when the parents are genetically distant due to better complementarity. This model, likewise, explains inbreeding depression as the accumulation of deleterious recessive alleles at homozygous loci, i.e., loci with identical alleles. Second, the non-linearity results in epistasis, meaning that the effect of substituting one allele for another is dependent on the genotype at other loci. This genetic effect also plays a role in heterosis.

Dominique de Vienne and colleagues have mathematically formalised and validated the dominance/epistasis model of heterosis experimentally using in vitro and in silico (computer simulated) genetics. They have worked with the glycolytic pathway in yeast to look at metabolic flux prediction and optimisation in relation to heterosis.

They first reconstituted in vitro the four-enzyme upstream segment of the glycolysis pathway, simulating genetic variability by varying enzyme concentrations in test tubes. “Hybrids” were obtained by mixing the content of “parental” tubes, and their fluxes were measured. They found that usually the phenotypic value of a hybrid is higher than the average of its parents, and in some cases higher than that of the best parent.

Then they used mathematical modelling. Modelling metabolic networks relies on mathematical tools and specialised computer programs. But identifying and estimating the many enzyme parameters for biochemical processes is difficult. So, modelling efforts based on conceptual shortcuts are essential to simulate complex cellular behaviours from a smaller amount of biological data.

A simplified formalism based on metabolic control analysis was used to derive global parameters that accounted for the kinetic behaviour of four enzymes from the upstream part of glycolysis. According to the structure of the pathway and the position of the enzyme in the pathway, just one or two parameters per enzyme were sufficient.

Genetic variability was created by varying in silico enzyme concentrations. The virtual parents were crossed to get hybrids, the flux of which was computed. Again the curvature of the relationship describing the genotype–phenotype relationship resulted in heterosis. This result is robust, as it was confirmed by explicit modelling of the whole glycolysis and a similar in silico genetics approach.

This mechanism for heterosis is valid beyond the metabolic systems. In another recent work, Dominique de Vienne, co-author François Vasseur and colleagues successfully predicted the amplitude of heterosis for two fitness-related traits – growth rate and fruit number – in series of hybrids among accessions of Arabidopsis thaliana, a valuable model plant for studies of growth and development and the first plant genome to be fully sequenced.

The traits of interest were non-linearly related to individual biomass, in the same way that metabolic fluxes are non-linearly related to enzyme concentrations. This non-linearity forces hybrids to deviate from the average value of their parents, which leads to their better vigour. Mathematical modelling made it possible to predict up to 75% of the amplitude of heterosis while the genetic distance between parents explained at best 7% of heterosis.

Both mathematical and experimental results suggested that the appearance of heterosis in hybrids is a systemic property emerging from biological complexity. These findings were consistent with various observations in quantitative and evolutionary genetics, and provide a model unifying the genetic effects underlying heterosis. The geometric view of genotype–phenotype relationship in crop plants has potential for predicting heterosis in traits affecting yield and environmental stability.

استجابة شخصية

How has the field of plant genetics changed since you began working in it?

Since I began working in plant genetics, there has been spectacular evolution of techniques available for the biologist. Robots for high-throughput genotyping and phenotyping, mass spectrometers for proteomics and metabolomics, increasingly powerful computers, etc., make it possible to accumulate and analyse huge amounts of data in a relatively short time. It is now possible to map finely and identify QTL for traits at all levels of biological organisation, from transcript/protein/metabolite abundances to fitness components, and to better understand the genomic bases of phenotypic trait variation. For the breeder, marker-assisted or genomic selection allows more efficient selection methods to be implemented.


شاهد الفيديو: 16. Protein Interaction Networks (قد 2022).


تعليقات:

  1. Azaria

    في رأيي ، أنت تعترف بالخطأ. أدخل سنناقش.

  2. Glaleanna

    لا تقل أنه أكثر.

  3. Sahir

    بالتاكيد. وركضت في هذا. يمكننا التواصل حول هذا الموضوع. هنا أو في PM.

  4. Terg

    الجمال

  5. Tillman

    أشاركها تمامًا وجهة نظرها. في هذا لا شيء هناك وأعتقد أن هذه فكرة جيدة للغاية. أنا أتفق معك.

  6. Jeoffroi

    أعتقد أنها الطريقة الخاطئة وعليك أن تتجعد منه.



اكتب رسالة