معلومة

هل بروتينات MHC هي البروتينات البشرية الأكثر تعدد الأشكال المعروفة؟

هل بروتينات MHC هي البروتينات البشرية الأكثر تعدد الأشكال المعروفة؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

هناك فقرة بعنوان "بروتينات MHC هي البروتينات البشرية الأكثر تعدد الأشكال المعروفة" في "البيولوجيا الجزيئية للخلية" بقلم ألبرتس وآخرون. الطبعة السادسة. 2014.

لكن أخبرني أحدهم مؤخرًا أنه ليس من الصحيح تقديم مثال لمجموعة من الجينات التي تساعد في التعرف على الأشخاص في الطب الشرعي. (لم أتذكر الجينات.) هل هذا صحيح؟

هل بروتينات معقد التوافق النسيجي الكبير هي أكثر البروتينات البشرية تعدد الأشكال المعروفة؟


نعم فعلا. هناك العديد من جينات MHC (يسمى MHC في البشر HLA). المواقع الكلاسيكية - الفئة الأولى أ ، ب ، ج ، الفئة الثانية DP و DQ و DR - هي الأكثر تعددًا في الأشكال.

هذا جدول من مقال عام 2002 يظهر بوضوح عدد تعدد الأشكال. إنها ليست مسابقة.

يجدر بي أن أشير إلى أن هذه الأرقام قديمة إلى حد بعيد. يمكن أن يوفر IPD-IMGT / HLA قوائم كاملة بأليلات HLA المعروفة ، ولكن الأرقام الدقيقة موجودة في عشرات الآلاف:


ربما كان الشخص الذي تحدثت معه يشير إلى تسلسلات تسمى السواتل المكروية. هذه مناطق صغيرة متعددة الأشكال ومتغيرة تمامًا بين الأفراد ، ويمكن أن يكون استخدام عدد منها معًا مفيدًا لبصمات الأصابع الجينية ، لكن كل ساتل دقيق فردي لن يكون متعدد الأشكال مثل HLA class I A ، على سبيل المثال.


الحدود في علم المناعة

انتماءات المحرر والمراجعين هي الأحدث التي يتم توفيرها في ملفات تعريف بحث Loop وقد لا تعكس موقفهم في وقت المراجعة.


  • تحميل المادة
    • تحميل PDF
    • ReadCube
    • EPUB
    • XML (NLM)
    • تكميلي
      مادة
    • ملاحظة ختامية
    • مدير المراجع
    • ملف TEXT بسيط
    • BibTex


    مشاركه فى

    هل بروتينات MHC هي البروتينات البشرية الأكثر تعدد الأشكال المعروفة؟ - مادة الاحياء

    (= معقد التوافق النسيجي الرئيسي (MHC))
    العودة إلى صفحة البحث
    إذا كنت تعرف أي مصطلحات تم حذفها من هذا المسرد وترى أنه من المفيد تضمينها ، فيرجى إرسال التفاصيل إلى مكتب التحرير في GenScript.

    MHC
    اختصار معقد التوافق النسيجي الرئيسي.
    ميكروب
    [حارس مرمى. ميكروس ، صغيرة + السير ، الحياة].

    MHC تشكل بروتينات الصنف الأول مستقبلًا وظيفيًا في معظم خلايا الجسم ذات النواة.
    هناك 3 وظائف رئيسية و 3 ثانوية MHC جينات الفئة الأولى في HLA:
    HLA-A
    HLA-B
    HLA-C
    الجينات الثانوية هي HLA-E و HLA-F و HLA-G
    يرتبط β2-microglobulin بالوحدات الجينية الرئيسية والثانوية لإنتاج مغاير مغاير.

    انظر معقد التوافق النسيجي الرئيسي.
    تتراكم الجسيمات الدهنية مع طبقة سطحية من الأملاح الصفراوية. مرحلة في هضم الدهون في الأمعاء الدقيقة.

    المستقبلات الموجودة على متبرع غير متوافق تعتبر "غير ذاتية" ويرفضها جهاز المناعة.
    إذا اختلط دم الأم والجنين ، فإن خلايا الذاكرة التي تتعرف على مستضد Rh يمكن أن تتشكل في وقت متأخر من الحمل الأول.

    الجزيئات ، الموجودة في جميع خلايا الجسم تقريبًا ، تربط الببتيدات المشتقة من المستضدات الأجنبية التي تم تصنيعها داخل الخلية.

    المستضدات ، لقاحات مرحلة الدم المحتملة يمكن أن تستهدف مستضدات سطحية معينة مصابة بالعدوى الحلقية (RESA) التي يتم التعبير عنها على سطح كريات الدم الحمراء المصابة.

    مجمع H-2: معقد التوافق النسيجي الرئيسي (

    اكتشف في عام 1937 من قبل بيتر جورر.
    حلقة دبوس الشعر: حلقة من الحمض النووي تتكون من تشكيل مزدوج داخل خيط واحد (يسمى أيضًا حلقة جذعية). إذا حدث في جهاز PCR التمهيدي ، فلن يعمل.

    المناعة التكيفية: مصطلح جماعي للاستجابة المحددة طويلة الأمد للخلايا الليمفاوية تجاه المستضدات. يتطلب

    ، مستقبلات الخلايا التائية (TCR) والغلوبولين المناعي (Ig) وكذلك الإنزيمات ذات نشاط recombinase (لإعادة الترتيب في TCR و Ig gene loci).

    -مركب المستضد ، خلايا TC تطلق بروتين البيرفورين ، الذي يشكل مسامًا في غشاء البلازما للخلية المستهدفة ، مما يؤدي إلى تدفق الأيونات والماء إلى الخلية المستهدفة ، مما يجعلها تتوسع وتتلاشى في النهاية.

    معالجة مستضد الصنف الثاني في تطوير الخلايا البائية ". المراجعات الدولية لعلم المناعة. 19 (2-3): 139-55. دوى: 10.3109 / 08830180009088502. PMID 10763706.
    ^ كيري ، إم آر ، هودجكين ، بي دي (1994). "تنشيط الخلايا البائية بواسطة أغشية الخلايا التائية المساعدة". مراجعات نقدية في علم المناعة. 14 (3-4): 221-38. دوى: 10.

    إذا كانت العدوى الفيروسية جارية ، فإن البلاعم والخلايا المناعية الأخرى سوف تتلامس مع الفيروس وتعرض مستضدات فيروسية على سطح الخلية مع

    2 جزيئات تسمى الخلايا العارضة للمستضد.

    تنتج جميع خلايا الجسم بروتينات سطحية تسمى الفئة الأولى

    بروتين. ستتعرف خلية T C مع المستقبل المطابق على الخلية غير الطبيعية.

    تحدث حالة واحدة من هذه الظاهرة في الموقع في مجمع التوافق النسيجي الرئيسي (

    ) حيث ترتبط بعض الأليلات البشرية ارتباطًا وثيقًا ببعض أليلات الشمبانزي أكثر من ارتباطها بالأليلات البشرية الأخرى (الشكل 7).

    الفئة الثانية هي مواضع جينية متعددة الأشكال بدرجة كبيرة ، مما يعني أن احتمال مشاركة أي شخصين في نفس مجموعة مواضع MHCII منخفض. لذلك فهي طريقة مفيدة لتمييز مدى قرب ارتباط شخصين.

    الأول هو الاختيار الإيجابي الذي يتحقق مما إذا كانت الخلية التائية تحتوي على مستقبلات قادرة على التعرف عليها

    الجزيئات التي ستقدم المستضدات. والثاني هو الاختيار السلبي ، والذي يزيل الخلايا التائية التي تهاجم أنسجة الجسم والنباتات المقيمة لأنها تستجيب لمولدات المضادات من هذه الخلايا.

    جينات HLA البشرية (ما يعادل

    الجينات في الفئران) لديها العديد من الأليلات ، ولا يوجد فردان لهما أليلات متطابقة في جميع مواقع الجينات. أي مما يلي هو عواقب هذا التنوع الجيني؟
    أ.
    يزيد من أنواع مسببات الأمراض التي يمكن التعرف عليها والقضاء عليها من خلال الاستجابة المناعية داخل السكان.

    مجمع رئيسية في أنسجة الجسم (

    هو جزء من مركب المناعة الرئيسي.

    مجمع رئيسية في أنسجة الجسم (

    تحفز الواسمات استجابات الخلايا التائية التي قد تؤدي إلى رفض الأنسجة والأعضاء المزروعة.
    نبيب Malpighian.

    عندما تأكل البلاعم البكتيريا ، يتم تقسيم البروتينات (المستضدات) من البكتيريا إلى سلاسل ببتيد قصيرة ثم يتم "عرض" هذه الببتيدات على سطح البلاعم المرتبطة بجزيئات خاصة تسمى

    II (لمجمع التوافق النسيجي الرئيسي من الدرجة الثانية).

    الغلوبولين المناعي السطحي (التعرف على Ag)
    مستقبلات الغلوبولين المناعي Fc
    مجمع التوافق النسيجي الرئيسي من الدرجة الثانية (

    مجمع H-2. مجمع التوافق النسيجي الرئيسي (

    ) من الفأر الموجود على الكروموسوم 17.
    هابلويد. خلية أو كائن حي يحتوي على مجموعة الكروموسومات الموجودة عادة في الأمشاج.

    بدأ العلماء في كلية الطب بجامعة هارفارد بالتحقيق في العوامل التي تؤثر على نشاط المركب الجيني القوي المعروف باسم مستضد الكريات البيض البشرية (HLA). لقد كان معروفًا لبعض الوقت أن هناك متغيرات معينة من جينات HLA في البشر ومجمعات التوافق النسيجي الرئيسية (

    تم وصف هذا الجين لأول مرة لسلالات الخلايا التائية والخلايا البائية (Behrens et al ، 1994). يشفر الجين بروتينًا مرتبطًا بالشبكة الإندوبلازمية ، ويشارك في توصيل الببتيدات إلى

    جزيئات الفئة الأولى (سنايدر وآخرون ، 1997). تدعم IHC بيانات RNAseq ، وتعرض إيجابية ER في الخلايا الليمفاوية.

    التوافق النسيجي المتعلق بحالة وراثية يمكن فيها زرع خلايا من حيوانين دون رفض مناعي. عكس هيستوينتوافق. يتم التحكم في التوافق النسيجي في الغالب بواسطة الجينات الموجودة في مجمع التوافق النسيجي الرئيسي أو


    تضيء الببتيدات ذاتية الإبلاغ أخدود معقد التوافق النسيجي الكبير

    تتيح oligopeptides الاصطناعية المعدلة كيميائيًا باستخدام مركبات الفلور الحساسة بيئيًا تصورًا في الوقت الفعلي لربط الببتيد بجزيئات معقد التوافق النسيجي الكبير. ستعمل هذه التقنية على توسيع فهمنا لعرض المستضد وتمكين تصور ارتباط الببتيد الفلوري بمجموعة واسعة من المستقبلات في الخلايا الحية.

    تقدم جزيئات معقد التوافق النسيجي الرئيسية (MHC) مستضدات ببتيد قليلة الببتيدات من البروتينات المناعية لتنشيط استجابات الخلايا التائية. يتمثل أحد الجوانب المهمة لعرض المستضد في ارتباط الببتيد بجزيئات معقد التوافق النسيجي الكبير. فقط ∼ 1٪ من الببتيدات ذات الطول الكافي قادرة على الارتباط بأي منتج جيني معين من معقد التوافق النسيجي الكبير من الفئة الأولى أو الفئة الثانية. على الرغم من وجود العديد من الطرق لتقدير ارتباط الببتيد بجزيئات معقد التوافق النسيجي الكبير ، لا أحد يكتشف الارتباط في الوقت الفعلي - حتى الآن ، هذا هو الحال. في هذا العدد من بيولوجيا الطبيعة الكيميائيةفينكاترامان وآخرون. تقرير 1 أنه عند الارتباط بجزيء MHC من الدرجة الثانية البشري DR1 ، تُظهر الببتيدات المعدلة باستخدام الفلوروفورز الحساس بيئيًا زيادات كبيرة في التألق ، وزيادة في الانبعاث في ستوكس ، وزيادة عمر التألق ، وكل ذلك يمكن استغلاله لمراقبة الارتباط بالببتيد في الواقع. زمن.


    22 مارس 2021

    من بين العديد من الأسئلة المحيرة المحيطة بـ SARS CoV-2 ، وهو مُمْرِض جديد غامض أودى بحياة ما يقدر بنحو 2.6 مليون شخص في جميع أنحاء العالم ، ربما يكون أكثر الأسئلة إلحاحًا هو: لماذا يبدو أن المرض يضرب بهذه الطريقة العشوائية ، وأحيانًا يدخر 100 عام الجدة العجوز ، بينما تقتل الشبان والشابات الأصحاء في مقتبل العمر؟

    قد تقدم دراسة جديدة أجرتها Karen Anderson و Abhishek Singharoy وزملاؤهم في معهد Biodesign في جامعة ولاية أريزونا بعض القرائن المؤقتة. يستكشف بحثهم MHC-I ، وهو مكون بروتيني مهم لجهاز المناعة البشري التكيفي.

    يقترح البحث أن بعض الأشكال المختلفة من MHC-I يمكن أن تساعد في حماية الجسم ، عن طريق تحفيز استجابة مناعية قوية ، في حين أن البعض الآخر قد يترك الفرد عرضة للاعتداء الفيروسي ، والمرض الشديد ، وربما الموت.

    يقول أندرسون: "إن النتائج التي توصلنا إليها هي أن القدرة على تكوين استجابة قوية ومتنوعة للخلايا التائية لـ SARS-CoV-2 قد تكون مهمة للحد من شدة المرض". "مفتاح هذا العمل هو استخدام بنية البروتين للتنبؤ بقدرة ربط الببتيد MHC-I الفردية."

    الشرطة الخلوية

    يحمل البشر ، مثل جميع الفقاريات ، جزيئات MHC-I في جميع الخلايا ذات النواة. يتمثل الدور المركزي لـ MHC-I في مساعدة الجسم على إزالة العدوى من الفيروسات ومسببات الأمراض الأخرى. يقوم بذلك عن طريق جمع أجزاء من الفيروس ، ونقلها إلى سطح الخلية وتقديمها إلى عوامل مناعية تعرف باسم خلايا CD8 + T ، والتي تقوم بدوريات في الجسم بلا توقف.

    ومع ذلك ، فإن MHC-I هو جزيء متعدد الأشكال ، مما يعني أنه يحدث في مجموعة متنوعة من الأشكال ، والتي تختلف بشكل ملحوظ في قدرتها على ربط الأجزاء الفيروسية وتقديمها للاستجواب بواسطة الخلايا التائية. اعتمادًا على متغيرات MHC-I أو الأليلات الموجودة ، قد يصنع الجسم استجابة مناعية ناجحة لـ SARS CoV-2 ، أو قد يفشل في القيام بذلك ، مما يجعل الجسم عرضة للخطر.

    في بحث جديد ظهر في مجلة Cell Reports Medicine ، وصف أندرسون وسينغهارى وزملاؤهم خوارزمية معقدة تُعرف باسم EnsembleMHC ، مصممة للتنبؤ بأي أليلات MHC-I الأفضل في ربط الأجزاء الفيروسية وتقديمها إلى الخلايا التائية. كما قاموا بتحديد 108 ببتيدات فيروسية مشتقة من البروتينات الهيكلية لـ SARS CoV-2 ، والتي يُعتقد أنها محفزات قوية للاستجابة المناعية.

    يقول Singharoy: "هذا هو أحد الأمثلة الأولى لعلم الأوبئة الجزيئي مع ارتفاع SARS-CoV2. التحجيم من الخصائص الجزيئية إلى خصائص السكان ، الذي طوره (المؤلف الأول) إريك ويلسون هو أمر جديد تمامًا."

    ويلسون باحث في معهد Biodesign وكلية العلوم الجزيئية بجامعة ولاية أريزونا.

    مجموعة من التأثيرات

    يفحص البحث 52 أليلات MHC-I شائعة ويكتشف عن تباينات كبيرة في قدرتها على ربط الأجزاء الفيروسية المشتقة من جينوم SARS CoV-2 الكامل وكذلك الأجزاء المشتقة من مجموعة فرعية رئيسية من المكونات الهيكلية التي يُعتقد أنها أهم البروتينات الفيروسية لـ توليد استجابات مناعية قوية. تساعد هذه البروتينات الأساسية الفيروس في تجميع 4 هياكل حرجة وتعرف باسم بروتينات S (Spike) و N (Nucleocapsid) و M (Membrane) و E (Envelope).

    خلايا CD8 + T قادرة على التعرف على مناطق الالتحام على هذه البروتينات الهيكلية ، والمعروفة باسم الحواتم. عندما تواجه هذه الخلايا المناعية الدورية بروتينات S و N و M و E ، فإنها عادة ما تستهدف الخلية المصابة للتدمير.

    عندما قارن الباحثون أرقام COVID-19 من 23 دولة ، وجدوا أن معدلات الوفيات من المرض مرتبطة ارتباطًا وثيقًا بتوزيع متغيرات MHC-I. على وجه التحديد ، أظهرت المجموعات السكانية الغنية بأليلات MHC-I التي تم تصنيفها على أنها روابط قوية لشظايا ببتيد SARS CoV-2 انخفاض معدلات الوفاة من COVID-19 ، مما يشير إلى أن أليلات MHC-I المواتية تولد استجابة مناعية قوية عندما تواجه فيروس كورونا الجديد.

    يحتوي العمل على آثار مهمة لمراقبة قابلية التأثر بـ COVID-19 في كل من الأفراد والسكان ويمكن أن يساعد الباحثين أيضًا على اكتشاف الأجزاء السارية لمسببات السارس CoV-2 التي تحفز الاستجابة المناعية بشكل أفضل ، وهو عنصر حاسم في اللقاحات المستقبلية.

    تدابير دفاعية

    يتم إنشاء جزيئات MHC-I بواسطة جين معقد التوافق النسيجي الكبير ، وهو الجزء الأكثر تعددًا للأشكال في الجينوم البشري بأكمله. من المعروف أن MHC يقوم بترميز أكثر من 160 بروتينًا ذات وظائف متنوعة ، نصفها يشارك بشكل مباشر في الاستجابات المناعية. يوفر التنوع الهائل لبروتينات MHC-I للجسم نظامًا دفاعيًا هائلاً للإنذار المبكر ، قادرًا على ربط مجموعة واسعة من شظايا العوامل الممرضة وضبط الاستجابة المناعية. كما أن التنوع الغني لجزيئات معقد التوافق النسيجي الكبير (MHC-I) يجعل من الصعب على غاز أجنبي مثل الفيروس أن يتفوق خلسة على كل جزيئات الارتباط المحتملة.

    تتمتع خلايا CD8 + T التي تجري مراقبتها بقدرة خارقة على تمييز الذات من غير الذات. إذا كانت الخلايا التائية لا تحب ما تراه ، فعندما تعرض جزيئات MHC-I العارضة للمستضد الأجزاء التي اكتسبتها ، فإن خلايا CD8 + T ستنهي الخلية المصابة.

    أظهرت الأبحاث السابقة أنه حتى الاختلافات الطفيفة في الأحماض الأمينية في تركيبة MHC-I يمكن أن يكون لها تأثيرات عميقة. فمن ناحية ، قد تعزز بعض أشكال MHC-I الأمراض الالتهابية وأمراض المناعة الذاتية ، مثل مرض جريفز ، أو الصدفية ، أو التهاب المفاصل الروماتويدي ، أو التصلب المتعدد ، حيث يتم التعرف على الأنسجة السليمة على أنها غريبة. من ناحية أخرى ، قد تكون متغيرات MHC-I غير مجهزة من الناحية الهيكلية لربط الأجزاء المناسبة من فيروس أو مسببات الأمراض الأخرى وتفشل في تكوين استجابة مناعية. لهذا السبب ، يعتبر النمط الجيني معقد التوافق النسيجي الكبير محددًا حاسمًا لنتائج المرضى بعد مجموعة من الالتهابات الفيروسية.

    يلعب MHC-I أيضًا دورًا مهمًا في حالات زرع الأنسجة ، كما يوحي اسمه الكامل - معقد التوافق النسيجي الرئيسي. إذا كان النسيج المتبرع به غير متوافق مع المتلقي ، فإن جزيئات MHC-I تقدم شظايا من نسيج المتبرع ، والتي يتم التعرف عليها على أنها غريبة وتهاجمها الخلايا التائية ، وهي ظاهرة تُعرف باسم رفض الكسب غير المشروع ، وهو شكل آخر من أشكال المناعة الذاتية.

    متابعة درب الحماية

    في الدراسة الحالية ، فحص الباحثون 52 أليلاً شائعًا لبروتين MHC-I ، باستخدام خوارزمية مصممة خصيصًا تُعرف باسم EnsembleMHC للتنبؤ بأوجه الارتباط المرتبطة بشظايا بروتين SARS CoV-2. تم تجميع مجموعتين من البيانات ، الأولى ، تقيس ألفة ربط كل أليل لمجموعة كاملة من البروتينات في جينوم SARS CoV-2. تفحص مجموعة البيانات الثانية الصلات الملزمة لكل أليل لمرشح الببتيد الفيروسي الهيكلي S و N و M و E فقط.

    قام الباحثون بعد ذلك بالتنقيب عن بنك بيانات ضخم من أليلات البروتين ، مطابقة لانتشار 52 أليلات في الدراسة مع 23 مقاطعة. حصلت كل دولة على درجة على مستوى السكان ، والتي تجمع بين قدرة ربط MHC-I مع ترددات أليل MHC-I.

    تم العثور على ارتباط مقنع بين البلدان ذات معدلات الوفيات المنخفضة خلال فترة الدراسة من يناير إلى أبريل 2020 والنسب المئوية العالية على مستوى السكان من الأليلات التي حددها EnsembleMHC كجزيئات ربط قوية لبروتينات SARS CoV-2.

    علاوة على ذلك ، عندما تمت مقارنة الأليلات التي تظهر تقاربًا عاليًا للارتباط لبروتينات S و N و M و E ، كان الارتباط بين معدل وفيات COVID-19 المنخفض وهذه المجموعة من أليلات MHC-I المواتية أقوى ، مما يشير مرة أخرى إلى أن التركيب الهيكلي للفيروس البروتينات هي الأكثر فعالية في إنتاج استجابة مناعية.

    تشير النتائج إلى أن المرضى الذين لديهم أليلات MHC-I قادرة على التعامل مع الببتيدات البروتينية الهيكلية SARS-CoV-2 قد تحفز استجابة خلايا CD8 + T المحسنة ، مع نتائج محسنة بعد الإصابة ومعدل وفيات أقل.

    تكشف التقنية القوية الموصوفة في الدراسة الجديدة عن العلاقة الدقيقة بين أليلات MHC-I والاستجابة المناعية وستساعد الباحثين على تحديد أهم الأجزاء الفيروسية المناعية من SARS CoV-2 ، مما يساعد في تطوير اللقاح في المستقبل. قد يساعد دمج هذه المعلومات مع البيانات السريرية للمريض والملفات الجينية في تحديد الأشخاص الأكثر تعرضًا لخطر الإصابة بهذا المرض الذي لا يزال بعيد المنال.


    أساليب

    ثقافة الخلية وكتابة HLA

    تمت الموافقة على هذه الدراسة من قبل Comité d’Éthique de la Recherche de l’Hôpital Maisonneuve-Rosemont وجميع الأشخاص قدموا موافقة خطية مستنيرة. نظرًا لأن عينات الدم الجديدة كانت مطلوبة لفحوصات السمية الخلوية ، فقد اخترنا إنشاء B-LCLs جديدة من المتبرعين المتاحين ، بدلاً من دراسة B-LCLs عالية الجودة من مركز D'Etude du Polymorphisme Humain. تم عزل PBMCs من عينات الدم لاثنين من الأخوة القوقازيين غير التوأمين المتطابقين HLA (54 و 56 سنة). تم اشتقاق B-LCLs من PBMCs مع Ficoll-Paque Plus (Amersham) متبوعًا بعدوى EBV كما هو موصوف 58. تم تحضين عشرة ملايين PBMCs في 2.5 مل وسط RPMI-10 كامل مع تعليق 1 مل EBV (سلالة B95-8) كما تم الحصول عليه من المورد (ATCC VR-1492) لمدة ساعتين في حمام مائي 37 درجة مئوية. تمت إضافة RPMI-10 الكامل الذي يحتوي على 1 ميكرولتر من السيكلوسبورين A (Sigma-Aldrich) إلى معلق الخلية بحجم إجمالي يبلغ 10 مل) وحضنت لمدة 3-5 أسابيع في 37 درجة مئوية مرطب ، 5 ٪ CO2 حاضنة. تم إجراء التنميط الجيني HLA عالي الدقة في مستشفى Maisonneuve-Rosemont. الشقيقان هما HLA-A * 03:01 ، * 29: 02 B * 08:01 ، * 44: 03 C * 07:01 ، * 16:01 DRB1 * 03:01 ، * 07:01.

    استخراج الحمض النووي الريبي وإعداد مكتبات النسخ

    تم عزل Total RNA من 5 ملايين B-LCLs باستخدام مجموعة RNeasy المصغرة بما في ذلك علاج DNase I (Qiagen) وفقًا لتعليمات الشركة المصنعة. تم قياس إجمالي الحمض النووي الريبي باستخدام NanoDrop 2000 (Thermo Scientific) وتم تقييم جودة RNA باستخدام محلل بيولوجي 2100 (Agilent Technologies). تم إنشاء مكتبات النسخ من 1 ميكروغرام من إجمالي الحمض النووي الريبي باستخدام TruSeq RNA Sample Preparation Kit v2 (Illumina) باتباع بروتوكول الشركة المصنعة. باختصار ، تمت تنقية poly-A messenger RNA باستخدام حبات مغناطيسية متصلة بـ poly-T oligo باستخدام جولتين من التنقية. أثناء الشطف الثاني لـ poly-A RNA ، تم تجزئة الحمض النووي الريبي واستعداده لتخليق (كدنا). تم إجراء النسخ العكسي للخيط الأول باستخدام الاشعال العشوائي و SuperScript II (Invitrogen). تم إجراء جولة ثانية من النسخ العكسي لتوليد cDNA مزدوج الشريطة ، والذي تمت تنقيته بعد ذلك باستخدام نظام تنقية Agencourt AMpure XP PCR (Beckman Coulter). تم الانتهاء من إصلاح نهاية (كدنا) المجزأة ، وتضخم النهايات 3 وربط المحولات باتباع بروتوكول الشركة المصنعة. تم إثراء شظايا الحمض النووي التي تحتوي على جزيئات محول على كلا الطرفين باستخدام 15 دورة من تضخيم PCR ومزيج Illumina PCR وكوكتيل الاشعال.

    استخراج الحمض النووي والتقاط الإكسوم

    تم استخراج الحمض النووي الجينومي من 5 ملايين B-LCLs باستخدام مجموعة PureLink Genomic DNA Mini Kit (Invitrogen) وفقًا لتعليمات الشركة المصنعة. تم تحديد كمية الحمض النووي وتقييم الجودة باستخدام NanoDrop 2000 (Thermo Scientific). تم إنشاء مكتبات الجينوم من 1 ميكروغرام من الحمض النووي الجيني باستخدام TruSeq DNA Sample Preparation Kit (v2) (Illumina) باتباع بروتوكول الشركة المصنعة. استخدمنا 500 نانوغرام من مكتبات DNA-Seq لإثراء exome القائم على الاختيار المختلط مع مجموعة إثراء TruSeq exome (Illumina) وفقًا لتعليمات الشركة المصنعة.

    التسلسل ورسم الخرائط للنسخة الكاملة والإكسوم

    تم إجراء التسلسل المزدوج (2 × 100 نقطة أساس) باستخدام آلة Illumina HiSeq2000 التي تشغل كيمياء TruSeq v3. تم تسلسل اثنين من RNA-Seq أو أربع مكتبات خارجية لكل حارة (ثمانية ممرات لكل شريحة). تم استهداف كثافة الكتلة في حوالي 600-800 ك عناقيد ملم -1 (المرجع 2). تم استخدام مرشح جودة العفة من Illumina لإزالة القراءات منخفضة الجودة. عفة النداء الأساسي هي نسبة شدة أكبر إشارة مقسومة على مجموع أكبر إشارتين. اجتازت القراءات هذا المرشح إذا لم يكن هناك أكثر من مكالمة أساسية واحدة في أول 25 دورة لها عفة & lt0.6. اجتاز أكثر من 96 ٪ من القراءات هذا المرشح (البيانات التكميلية 1). تم تعيين بيانات التسلسل إلى الجينوم المرجعي البشري (hg19) باستخدام برامج رسم الخرائط Casava 1.8.1 و Eland v2e (Illumina). أولاً ، تم تحويل ملفات * .bcl إلى ملفات FASTQ مضغوطة ، متبوعة بإزالة تعدد إرسال تسلسل متعدد الإرسال منفصل يتم تشغيله بواسطة الفهرس. تمت محاذاة القراءات الفردية مع الجينوم المرجعي البشري باستخدام طريقة المحاذاة متعددة البذور. تعمل محاذاة البذور المتعددة عن طريق محاذاة البذرة الأولى المكونة من 32 قاعدة والبذور المتتالية بشكل منفصل. تعمل المحاذاة الفراغية على توسيع كل محاذاة مرشح إلى الطول الكامل للقراءة وتسمح بفجوات تصل إلى 10 قواعد. تم تطبيق المعايير التالية: (1) تحتوي القراءة على بذرة واحدة على الأقل تتطابق مع اثنين على الأكثر من عدم التطابق بدون فجوات و (2) تم السماح بالفجوات للقراءة بأكملها ، طالما أنها تصحح خمسة حالات عدم تطابق على الأقل في اتجاه مجرى النهر. لكل محاذاة مرشح ، تم حساب درجة الاحتمالية ، التي تستند إلى قيم الجودة الأساسية المتسلسلة ومواضع عدم التطابق. تم حساب درجة المحاذاة للقراءة ، والتي يتم التعبير عنها على مقياس Phred ، من درجات الاحتمالية لمحاذاة المرشح. تتوافق أفضل محاذاة لقراءة معينة مع محاذاة المرشح بأعلى درجة احتمالية ويتم الاحتفاظ بها إذا تجاوزت درجة المحاذاة الحد الأدنى. تمت تصفية محاذاة القراءة بشكل أكبر إذا كانت تحتوي على أحداث إدراج / حذف مجاورة أو في حالة وجود حالات شذوذ في النهاية المزدوجة. لم يتم تضمين القراءات التي تم تعيينها في موقعين أو أكثر في مزيد من التحليلات. بالنسبة لمكتبات exome المقترنة بالنهاية ، تم حساب أفضل محاذاة الدرجات لكل نصف الزوج ومقارنتها للعثور على أفضل محاذاة القراءة المزدوجة وفقًا لتوزيع حجم الإدخال المقدر. في حالة مكتبات RNA-seq ، تم إجراء محاذاة إضافية ضد الوصلات الملصقة والملوثات (الحمض النووي الريبي الميتوكوندريا والريبوزومي). تم التخلص من تعيين التسلسلات إلى الملوثات ، في حين تم الاحتفاظ بالقراءات التي ترسم الخرائط الفريدة لتقاطعات الوصلات وتحويلها مرة أخرى إلى إحداثيات الجينوم.

    التحديد الكمي لتعبير النص

    استخدمنا طريقتين لتقدير ومقارنة التعبير النصي بين الموضوعات. في الطريقة الأولى ، تم استخدام برنامج Casava 1.8.1 (Illumina) لتقدير مستويات التعبير الجيني أو exon (RNA-seq) التي تم قياسها حسب القراءة لكل كيلو قاعدة لنموذج exon لكل مليون قراءة معينة باستخدام الصيغة التالية: الجين أو exon RPKM = 10 9 × Cb / Nb × إل، حيث Cb هو عدد القواعد التي تقع على الميزة ، Nb هو العدد الإجمالي للقواعد المعينة و إل هو طول السمة في أزواج القاعدة. استخدمنا أيضًا حزمة DESeq 59 ، والتي تستند إلى الأعداد الأولية ، لمقارنة تعبير النص. لم يتم اعتبار مستوى تعبير النص في استدعاء SNP.

    تحديد النيوكلوتايد وقراءة العد

    تم إجراء استدعاء متغير وكشف indel وقراءة العد باستخدام برنامج Casava 1.8.1 (Illumina). تمت إعادة محاذاة القراءات حول indels المرشحة لتحسين جودة المكالمات المتنوعة وملخصات تغطية الموقع. تمت تصفية المكالمات الأساسية الفردية بناءً على كثافة عدم التطابق أو الغموض ، واستخدمت المكالمات الأساسية المتبقية للتنبؤ بالأنماط الجينية للموقع. تم استخدام Casava أيضًا لاسترداد جميع SNPs التي لوحظت بين الجينوم المرجعي (GRCh37.p2 ، NCBI) ونسخة وإكسوم المتسلسل لموضوعاتنا. تمت إزالة مكالمات SNPs و indel بالقرب من المراكز المركزية وداخل مناطق عدد النسخ العالية. لكل نوع يسمى SNP ، يحسب Casava التركيب الجيني الأكثر احتمالا (max_gt) و a س- القيمة التي تعبر عن احتمالية النمط الجيني الأكثر احتمالا (Qmax_gt). ال س-القيمة هي درجة جودة تقيس احتمال استدعاء قاعدة بشكل غير صحيح واستخدامها لتصفية تعدد الأشكال منخفض الجودة (راجع "في السيليكو-إنشاء البروتينات وقواعد البيانات الشخصية). تم الحفاظ على تعدد الأشكال المتسلسلة بتغطية 5 × على الأقل. تم تحميل هذه المعلومات (ملفات .txt) في وحدة Python الداخلية ، pyGeno 19 ، لمزيد من المعالجة.

    في السيليكو-ولدت البروتينات وقواعد البيانات الشخصية

    استخدمنا العديد من البرامج النصية الداخلية التي تعتمد على pyGeno لاسترجاع البيانات وتحليلها ومعالجتها. قمنا بدمج بيانات تسلسل exome في بيانات تسلسل النسخ. لكل SNP تم العثور عليه من خلال تسلسل النسخ ، احتفظنا بالنمط الجيني الأكثر احتمالية إذا كان س-قيمة (Qmax_gt) كانت 20 ، وهو ما يتوافق مع معدل خطأ بنسبة 1٪ (تشير نقاط الجودة الأعلى إلى احتمال حدوث خطأ أقل). إذا تمت تغطية SNP أيضًا من خلال تسلسل exome ، فقد قمنا بتضمين ليس فقط النمط الجيني الأكثر احتمالًا الذي وجده RNA-seq ولكن أيضًا جميع القواعد المشتركة مع تسلسل exome. قمنا أيضًا بتضمين الأنماط الجينية لـ SNPs التي تم العثور عليها فقط من خلال تسلسل exome وكان لها س-قيمة ≥20. أخيرًا ، قمنا بتضمين جميع قواعد SNPs التي دعاها كل من تسلسل النسخ والإكسوم بغض النظر عن س-القيمة. تم بعد ذلك دمج الأنماط الجينية المحتجزة لجميع SNPs في الجينوم المرجعي (GRCh37.p2 ، ملف fasta) في موضعها الصحيح لإنشاء "جينوم شخصي" لكل موضوع. تم استخدام هذه الجينومات الشخصية لاستخراج جميع النصوص المبلغ عنها في مجموعة الجينات Ensembl (GRCh37.65 ، ملف gtf) لجميع الكروموسومات باستثناء كروموسوم Y والحمض النووي للميتوكوندريا. ثم كانت هذه النصوص في السيليكو تُرجمت إلى بروتينات باستخدام إطار القراءة المحدد في مجموعة الجينات Ensembl. بالنظر إلى أن الغالبية العظمى من MIPs لها حد أقصى يبلغ 11 من الأحماض الأمينية ، فقد أنشأنا نافذة من 21 من الأحماض الأمينية تتركز في كل ns-SNP متغاير الزيجوت. عندما احتوت النافذة على أكثر من SNP ، قمنا بالترجمة في السيليكو جميع التركيبات الممكنة وأدرجتها في قواعد البيانات الشخصية (الشكل 1 ب). أخيرًا ، قمنا بتجميع جميع منتجات الترجمة في قاعدتي بيانات ملف fasta (واحدة لكل موضوع) تم استخدامهما لتحديد MIPs (انظر قسم "تسلسل MS / MS وتجميع الببتيد"). كان لكل من قاعدتي البيانات الناتج حجم مماثل ، من حيث عدد المخلفات (36،007،210 في الموضوع 1 و 36،010،026 في الموضوع 2) وعدد الإدخالات (95،806 في الموضوع 1 و 95،687 في الموضوع 2). علاوة على ذلك ، فإن حجمها يمكن مقارنته بحجم قاعدة بيانات UniProt البشرية المرجعية المستخدمة (43.384.120 وحدة بنائية و 75.530 إدخالاً).

    تسلسل MS / MS وتكتل الببتيد

    على أساس دراساتنا السابقة حول استنساخ بيانات MS عبر التكرارات التقنية والبيولوجية 8 ، قمنا بإعداد أربع مكررات بيولوجية من 5 × 10 8 تنمو بشكل كبير B-LCLs من كل موضوع. تم إطلاق MIPs عن طريق المعالجة الحمضية الخفيفة ، وتحلية الملح على خرطوشة HLB 30 سم مكعب ، وتم ترشيحها بغشاء قطع 3000-Da وفصلها إلى سبعة كسور بواسطة كروماتوجرافيا التبادل الكاتيوني باستخدام نظام LC ثنائي غير متصل بسلسلة 1100 (تقنيات Agilent) كما هو موصوف سابقًا 8،9. تم تعليق الكسور التي تحتوي على MIPs في 0.2٪ حمض الفورميك وتحليلها بواسطة LC-MS / MS باستخدام نظام Eksigent LC مقترنًا بمقياس الطيف الكتلي LTQ-Orbitrap ELITE (Thermo Electron). تم فصل الببتيدات على حرف C مخصص18 عمود الطور المعكوس (150 ميكرومتر معرف × 100 مم ، جوبيتر بروتيو 4 ميكرومتر ، فينومينكس) باستخدام معدل تدفق 600 نانليتر دقيقة -1 وتدرج خطي من 3 إلى 60٪ ACN مائي (0.2٪ حمض الفورميك) في 120 دقيقة. تم الحصول على أطياف الكتلة الكاملة باستخدام محلل Orbitrap الذي يعمل بقوة حل تبلغ 30000 (عند م/ض 400). استخدمت المعايرة الجماعية كتلة قفل داخلية (بروتونية (Si (CH3)2س))6 م / ض 445.120029) وكانت دقة الكتلة لقياسات الببتيد في غضون 5 مساءً. تم الحصول على أطياف MS / MS عند تفكك اصطدام طاقة أعلى مع طاقة تصادم طبيعية بنسبة 35 ٪. تم تجميع ما يصل إلى ستة أيونات سليفة إلى قيمة مستهدفة قدرها 50000 مع وقت حقن أقصى يبلغ 300 مللي ثانية وتم نقل أيونات الشظايا إلى محلل Orbitrap الذي يعمل بدقة 15000 في م / ض 400.

    تم تحليل أطياف الكتلة باستخدام برنامج Xcalibur وتم إنشاء قوائم الذروة باستخدام Mascot distiller الإصدار 2.3.2 (http://www.matrixscience.com). تم إجراء عمليات بحث في قاعدة البيانات مقابل قاعدة بيانات UniProt Human (43،384،120 وحدة بنائية ، تم إصدارها في 2 أبريل 2013) ، وقواعد البيانات الخاصة بالموضوعين 1 و 2 (34،976،580 و 34،990،381 وحدة بنائية ، على التوالي ، انظر "في السيليكو-تم إنشاء قسم قواعد البيانات البروتينية والشخصية) وقاعدة بيانات EBV_B95.8 (40946 من الوحدات البنائية) ، باستخدام التميمة (الإصدار 2.3.2 ، Matrix Science). لحساب FDR ، أجرينا بحث Mascot مقابل قاعدة بيانات هدف / شرك متسلسلة باستخدام UniProt البشرية أو قواعد البيانات الخاصة بالموضوع. الهدف يمثل التسلسلات الأمامية والشرك النظائر العكسية. تم ضبط التفاوتات الجماعية لأيونات السلائف والشظايا على 5 مساءً. و 0.02 دا على التوالي. تم إجراء عمليات البحث دون خصوصية الإنزيم مع تعديلات متغيرة لكل من cysteinylation ، phosphorylation (Ser ، Thr and Tyr) ، الأكسدة (Met) والتخفيض (Asn ، Gln). تم تحويل ملفات البيانات الخام إلى خرائط ببتيدية م / ض القيم وحالة الشحن ووقت الاستبقاء والشدة لجميع الأيونات المكتشفة فوق عتبة 8000 حساب باستخدام البرامج الداخلية (Proteoprofile) 9. تمت محاذاة خرائط الببتيد المقابلة لجميع أيونات الببتيد المحددة معًا لربط وفرتها عبر مجموعات العينات والتكرارات. تم التحقق يدويًا من أطياف MS / MS الخاصة بـ MIPs المكتشفة حصريًا في موضوع واحد.

    تحديد MIPs

    استند تحديد MIP إلى أربعة معايير: (1) طول MIP الأساسي من 8-11 من الأحماض الأمينية ، (2) تقارب ربط MHC المتوقع الذي قدمته خوارزمية NetMHCcons 43 ، (3) درجة التميمة ، والتي تعكس جودة تخصيص الببتيد ، و (4) FDR ، الذي يشير إلى نسبة شرك (كاذب) مقابل تحديد الهدف (صحيح). أولاً ، قمنا بتقييم العلاقة بين هذه المعلمات. وجدنا علاقة قوية (0.88) بين قيم FDR & lt60٪ وقيم تقارب ربط MHC ≤1750 نانومتر لجميع 8-11 مترًا (الشكل التكميلي 1). في الواقع ، تزداد نسبة الببتيدات ذات التقارب المرتبط بـ MHC ≤1750 نانومتر مع انخفاض FDR (الشكل التكميلي 2 أ). كان هذا الارتباط خاصًا بـ MIPs ، حيث لم يتم العثور على ارتباط للببتيدات العشوائية (الشكلان التكميليان 1 و 2 ب). تظهر هذه النتائج أن قيم FDR المنخفضة تسمح بإثراء الببتيدات عالية التقارب (تقارب ربط MHC ≤1750 نانومتر) وبالتالي MIPs. ومع ذلك ، فإن عيب استخدام FDR منخفض صارم كمرشح رئيسي هو أن العدد الإجمالي للتعريفات ينخفض ​​بشكل كبير (الشكل التكميلي 2 أ) وكذلك نسبة الببتيدات الصغيرة (8-9 مرات) المحددة (الشكل التكميلي 2 ج) ). وفقًا لذلك ، انخفضت النسبة النسبية من الببتيدات الموجودة في الهدف مقابل الطعم مع زيادة طول الببتيد 60 ، وفقًا للفكرة القائلة بأن الببتيدات القصيرة مثل MIPs تتطلب عمومًا درجات تعويذة أعلى لتحقيق FDR منخفض. علاوة على ذلك ، فإن أيونات شظايا MS الترادفية لـ MIPs أقل قابلية للتنبؤ بها وموزعة بالتساوي من تلك الموجودة في الببتيدات التريبتية التي تزيد من تعقيد تعيينها بواسطة محركات بحث قواعد البيانات مثل Mascot. لتعيين عتبة درجة Mascot أكثر ملاءمة لاكتشاف MIP عالي الإنتاجية ، قمنا بتقييم العلاقة بين درجة Mascot وتقارب الارتباط المتوقع لجميع الببتيدات 8-11 مير المحددة بـ FDR≤5 ٪ (الشكل 1 ج). Then, we calculated the number of MIPs identified with all combinations of Mascot score and predicted binding affinity. We found that the highest number of MIP identifications was obtained by combining a Mascot score ≥21 and an MHC-binding affinity ≤1,250 nM at a 5% FDR (Fig. 1c).

    MS/MS validation of a subset of MIPs

    Polymorphic and non-polymorphic MIPs exclusively detected in one of the two subjects (Table 1 and Supplementary Data 3) were synthesized by Bio Basic Inc. and JPT peptide technologies. Subsequently, 500 fmols of each peptide were injected in the LTQ-Orbitrap ELITE mass spectrometer using the same parameters as those used to analyse the biological samples.

    Ns-SNPs found in MIP-coding regions in the population

    For each MIP, we retrieved the coordinates of the peptide-coding DNA region. These coordinates were then used to extract both the corresponding reference sequence and all non-synonymous validated SNPs reported by dbSNP (Build 137) for that region. For MIPs deriving from multiple source regions, the number of ns-SNPs reported corresponds to that of the MIP source region possessing the maximal number of ns-SNPs.

    Random peptide sampling

    We constructed a genome-wide index. To do so, we indexed every coding sequences reported in the Ensembl gene set (GRCh37.65), except for those located in the Y chromosome or the mitochondrial DNA, into a segment tree. Next, we kept only the first layer of the tree and removed the gaps between the indexed regions, effectively transforming the tree into a coding DNA sequence list, which was used for the random peptide sampling. For each of the 4,468 identified peptides, a random peptide of the same length and that fell entirely into a single coding DNA sequence, was chosen. Next, for each randomly selected peptide, we counted the number of ns-SNPs reported in dbSNP137 (validated and missense). The distribution was obtained after repeating the sampling of 4,468 random peptides 10,000 times.

    PCR and Sanger sequencing

    PCR amplification of the MiHA-encoding DNA and cDNA regions was performed with the Phusion High-Fidelity PCR kit (New England BioLabs). For each candidate, 1–2 pairs of sequencing primers were designed manually and with the PrimerQuest software (Integrated DNA Technologies, Supplementary Table 1), and were synthesized by Sigma. PCR products were purified with the PureLink Quick Gel Extraction Kit (Invitrogen). Sanger sequencing was performed on candidate DNA and cDNA at the IRIC’s Genomics Platform. Sequencing results were visualized with the Sequencher software v4.7 (Gene Codes Corporation).

    Cytotoxicity assays

    DCs were generated from frozen PBMCs, as previously described 61 . To generate cytotoxic T cells, autologous DCs were irradiated (4,000 cGy), loaded with 2 μM of peptide and cultured for 7 days with freshly thawed autologous PBMCs at a DC:T-cell ratio of 1:10. From day 7, responder T cells were restimulated for seven additional days with irradiated autologous B-LCLs pulsed with the same peptide (B-LCL:T-cell ratio 1:5). Expanding T cells were cultured in RPMI 1,640 (Invitrogen) containing 10% human serum (Sigma-Aldrich) and L -glutamine. IL-2 (50 U ml −1 ) was added for the last 5 days of the culture. Cytotoxicity assays were performed as described 9 , with minor modifications. In brief, B-LCLs were labelled with carboxyfluorescein succinimidyl ester (CFSE Invitrogen), extensively washed, irradiated (4,000 cGy) and then used as targets in cytotoxicity assays. Target cells were plated in 96-well U-bottom plates at 5,000 cells per well. Effector cells were added at different effector-to-target ratios in a final volume of 200 μl per well. Plates were centrifuged and incubated for 18–20 h at 37 °C. Flow cytometry analysis was performed using a LSRII cytometer with a high-throughput sampler device (BD Biosciences). The percentage of specific lysis was calculated as follows: [(number of CFSE + cells remaining after incubation with unpulsed target cells−number of CFSE + cells remaining after incubation with peptide-pulsed target cells)/number of CFSE + cells remaining after incubation with unpulsed target cells] × 100.

    Statistical analysis and data visualization

    The two-tailed Student’s ر-test was used to identify differentially expressed MIPs and MiHAs that induced cytotoxicity. The two-tailed Mann–Whitney test was used to compare the MHC-binding affinity of MIPs detected exclusively in one subject. Differentially expressed transcripts were identified with the DESeq package that uses a model based on the negative binomial distribution 59 . The Spearman correlation was used to evaluate the relationship between differences in MIP abundance and differences in MIP-coding gene or exon expression. The genomic location of identified MIPs including MiHAs and the RNA-seq and exome sequencing coverage were visualized with the Circos software 62 . The Integrative Genomics Viewer v2.0 (ref. 63) was used to visualize and inspect regions coding MIPs including MiHAs.


    Structural and dynamic features of MHCII molecules during peptide exchange

    MHCII proteins reach the endosomal compartment preloaded with the class-II associated invariant chain peptide (CLIP) where HLA-DM catalyzes the exchange of CLIP for higher affinity antigens. DM-catalyzed peptide exchange determines the fate of immunogenicity of a number of antigens, however, the underlying molecular principles of peptide exchange are not well understood. We could show by a combination of NMR experiments and molecular simulations/Markov state modeling (with the group of Frank Noé, Freie Universität Berlin) how low populated pMHCII conformations dictate the catalyzed and non-catalyzed peptide exchange reactions and we are further interested in the role of how natural polymorphisms and particular antigens affect the proposed mechanistic model. With respect to this, the interference of small molecules, such as known drugs on MHC-peptide presentation and CD4+ T cell response represents an additional MHCII-related research field in our group.


    What is HLA

    The HLA (human leukocyte antigen) is a form of MHC gene complex present in humans. It consists of around 200 genes located close together on chromosome 6. These genes are expressed on all nucleated cells. The main function of the HLA molecules is to present antigens produced inside the cell on the cell surface in order to be recognized by T cells. Therefore, T cells can recognize foreign antigens upon self-antigens, initiating an acquired immune response. On the other hand, the recognition of antigens by T cells as self allows determining histocompatibility. But, the recognition of self-antigens as non-self by the immune system leads to autoimmune diseases.

    Figure 1: Human Chromosome 6

    However, HLA complex is the most polymorphic loci of the human genome. The two main classes of HLA complex are Class I, which contains HLA-A, HLA-B, and HLA-C genes, and Class II, which contains HLA-D genes. The most polymorphic HLA gene is the HLA-B, which has 425 alleles recognized up to date. Likewise, the HLA-DRB1 gene has 289 recognized alleles, and HLA-A gene has 214 recognized genes. The IPD-IMGT/HLA database contains all the reported and named sequences of HLA alleles up to date. According to the basic genetic principles, children inherit HLA alleles from parents.

    Figure 2: MHC Complex Function

    Furthermore, for successful organ transplantation, the HLA alleles of the donor and the recipient have to be matched to each other. The organs with unmatching or non-self HLA alleles will be rejected from the body by the immune system. Therefore, scientists have developed a number of techniques to type HLA alleles in individuals for various purposes, including organ transplantation, paternity tests to determine the percentage of a child, and to identify carriers of certain hereditary diseases such as cancer, diabetes, lupus, etc.


    مناقشة

    MHC proteins are among the most polymorphic in the human genome, with the International Immunogenetics HLA database currently listing the sequences of more than 1,000 HLA-A and 1,500 HLA-B proteins (34). Experimental binding data, however, are lagging far behind and binding peptides have been reported for fewer than 150 proteins (6). As a result, significant computational efforts have been devoted in recent years to the development of peptide binding prediction methods (see refs. 6 and 7 for recent reviews) but their accuracy still depends, to a great extent, on the availability of a fairly large number of experimental measurements, ideally of unrelated peptides, for either the protein itself (6) or some “closely related” proteins (27). Notably, the most accurate predictors rely on convoluted machine-learning algorithms, thus, on the one hand, attesting to the complex nature of MHC-peptide binding, and, on the other hand, presenting no readily interpretable information to help investigate it.

    Here, we have used special purpose molecular modeling simulations to predict, for a given MHC protein, the sequence of thousands of binding peptides, to each of which is associated an atomically detailed structural model and a predicted intermolecular binding energy. We have demonstrated that a rather simple binding model—a PFM—inferred from these simulations agrees well with available experimental binding data. In addition, the accompanying structural models suggest plausible—and testable—mechanistic explanations for the observed binding preferences, and for divergences in binding specificity between closely related proteins. Predictions can be made for proteins without three-dimensional structures and for proteins with little or no experimental binding data. As a result, these predictions are insensitive to heterogeneities in the available peptide binding datasets, making them well-suited to comparisons of peptide binding between different proteins and across the MHC family.

    Our structure-based approach to binding specificity prediction also has significant limitations. The molecular modeling, although state-of-the-art, is still quite crude: The MHC backbone is held fixed throughout the simulations (the side chains near the peptide can rearrange) the force fields were parameterized for monomeric protein structure prediction and design, and likely could be substantially improved for modeling protein–peptide interactions modeling simulations focused exclusively on binding of 9-mer peptides. As a result of these and other limitations, the specificity predictions and related inferences from these modeling simulations are sometimes inaccurate: Anchor-position preferences are mispredicted in some of the homology-model-based binding profiles, and these mispredictions can have a disastrous effect on binding predictions. The fact that self-template binding predictions for these targets are significantly more accurate illustrates the sensitivity of our binding landscapes to the backbone of the template MHC molecule, and suggests that incorporation of MHC backbone flexibility may lead to substantial improvements in accuracy.

    Notwithstanding these significant limitations, we are optimistic that, given the large community of researchers working to improve molecular modeling force fields and sampling methods, the quality of simulation-derived inferences will continually improve. Indeed, an advantage of a large-scale modeling study such as this one, focused on a family of proteins with extensive experimental structural and binding data, is the ability to highlight current limitations in modeling methods and suggest avenues for improvement. As an example, analysis of an initial underprediction of beta-branched amino acids at the second anchor position (ص9) revealed a systematic error in our modeling of rotamer preferences at C-terminal positions fixing this error substantially improved binding prediction for MHC proteins with aliphatic preferences at this position. Understanding the apparent bias toward histidine in many of the structure-based PFMs (Fig. S2) may also reveal specific force field deficiencies, whose correction could further improve performance.

    Our structure-based approach is highly complementary to traditional sequence-based predictors. Although the peptide binding prediction accuracies are on the whole lower, particularly for well-characterized proteins, the atomically detailed models allow the investigation of new aspects of MHC-peptide interactions. We have used these models to investigate the extent and mechanistic basis of pairwise correlations between peptide positions, and are currently examining the role of the peptide backbone conformation in determining specificity profiles. Structural modeling may also shed light on T-cell receptor (TCR) recognition of peptide-MHC complexes, given that the peptide’s structure, as well as its sequence, is being recognized doing so could lead to an improved understanding of T-cell alloreactivity and its role in transplant outcome. By explicitly modeling the TCR-peptide-MHC ternary complex, it may be possible to rationalize and perhaps predict patterns of TCR cross-reactivity to different peptide-MHC complexes. Finally, a physicochemical approach is well suited to modeling MHC interactions with peptides that contain nonnatural or posttranslationally modified amino acids, for which limited binding data currently exists. MHC molecules have been shown to specifically recognize and prefer phosphorylated variants of certain peptides, suggesting a mechanism for immune surveillance of cells with deregulated phosphorylation, a hallmark of malignant transformation (35). As molecular modeling methods continue to improve, we expect that structure-based predictions will play an increasingly important role in the investigation of MHC-peptide interactions.


    المواد والأساليب

    MHC Loci and Alleles Included in Analyses

    Five key classical human MHC genes (HLA-A, , , -DRB1، و -DQB1) were analyzed in this study. Alleles at each locus were defined at second field (four-digit) resolution and only alleles annotated as “مشترك” in the CWD catalogue ( Mack et al. 2013) were included in the analyses. The allele annotation “مشترك” in the CWD catalogue does not specifically indicate a high population frequency but more the extent and quality of documentation available for the given allele. This category indicates that there is universal agreement about the identity of this allele because it has been observed in multiple populations and there is sufficient data for robust frequency estimation ( Mack et al. 2013). These criteria resulted in the analysis of 63 alleles for HLA-A, 123 for HLA-B, 40 for HLA-C, 73 for HLA-DRB1, and 21 for HLA-DQB1 ( supplementary table S1 , Supplementary Material online).

    Pathogen Proteins

    Binding prediction analyses were performed on a data set of representative human pathogen proteins. Pathogens were selected from the Gideon database ( Berger 2005) based on the following criteria: a global distribution, a potential for high mortality and/or morbidity, and a significant impact over the course of human history ( Wolfe et al. 2007). The rational for these criteria was that such pathogens are likely to have contributed significantly to human evolution in general and to the evolution of MHC genes in particular. Wolfe et al. (2007) provided a comprehensive list of infectious diseases with the greatest evolutionary and historical significance. From that list, we have taken the majority of pathogens in our data set. However, to assess mortality and morbidity, epidemiological data were also collected from two published reports: the Annual report of the European Centre for Disease Prevention and Control ( European Centre for Disease Prevention and Control 2013) and the WHO Global Health Estimates ( World Health Organization 2016). First, pathogens with the highest current mortality were included. However, not just mortality, but also nonfatal morbidity can be historically and evolutionarily significant. Indeed, morbid pathogens can reduce the fitness of their host in different ways (e.g., by increasing the sterility), thus pathogens considered morbid were also included. Finally, eradicated pathogens known to be important in human history were taken into account. Here, we used protein sequences of present day pathogens to explore signatures of historical selection, even though ancient pathogen strains might have differed slightly in their antigen repertoires. While we do not expect an effect on the general patterns observed here, it might be interesting to explore subtle differences in future work. We further aimed for a balanced representation of different groups of pathogens (i.e., viruses, bacteria, parasites). Based on these criteria, we identified 27 pathogens (10 viruses, 10 bacteria, 7 macroparasites) that were classified into three groups: extracellular, intracellular, and intra-extracellular, based on their primary environment in the human body ( supplementary table S2 , Supplementary Material online). Then, for the selected pathogens, amino acid sequences of 232 pathogen proteins (8.5 ± 5.8 per pathogen) known to be antigenic ( Vita et al. 2015) and/or likely exposed to the host immune system (mostly secreted and surface proteins) ( Rana et al. 2016) were obtained from GenBank (for accession numbers see supplementary table S2 , Supplementary Material online).

    Peptide Binding Prediction Algorithms

    Computational antigen-binding prediction algorithms for MHC molecules were used to determine pathogen peptides potentially bound by the MHC alleles under investigation. Binding prediction was computed for all alleles at each of the five human MHC genes. Furthermore, as prediction analysis are likely to be more accurate for the core of the binding groove, which is known to be nine residues long and contributes the most to the recognition of the antigens, binding prediction was performed considering all possible 9mer pathogen-derived peptides. The data set of 232 representative human pathogen proteins described above resulted in a total of 118,097 unique pathogen-derived 9mer peptides that were analyzed using two different algorithms: NetMHCpan (v2.8) ( Hoof et al. 2009) for the alleles at class I loci (HLA-A, , ) and NetMHCIIpan (v3.0) ( Karosiene et al. 2013) for the alleles at class II loci (HLA-DRB1, -DQB1). For alleles at the two class II loci (HLA-DRB1 و HLA-DQB1), we repeated the binding prediction analysis considering all possible 15mer pathogen-derived peptides. The predicted binding affinity between pathogen peptides and MHC molecule variants (defined in nanomolar IC50, i.e., half maximal inhibitory concentration) are ranked by the respective software, based on comparison with a large pool of naturally occurring peptides, and a rank percentage score (%rank) is assigned to each peptide. To define “bound” peptides, we used the default %rank threshold of 2, which includes weak and strong binders. All analysis were also repeated using another established binding threshold (%rank of 0.5) which includes only strong binders. الأليل HLA-A*30:04 was predicted to bind about four times as many peptides as the other 62 HLA-A alleles ( supplementary fig. S2 , Supplementary Material online) and was thus excluded as an outlier from subsequent analysis in order to prevent distortion of results. The binding prediction analyses were performed first on the complete data set of pathogen proteins (ن = 232), and then considering proteins within three groups separately: extracellular (ن = 58), intracellular (ن = 100), and intra-extracellular (ن = 75).

    Sequence Divergence

    Allele divergence was computed on the same set of alleles used in the binding prediction analysis reported in supplementary table S1 , Supplementary Material online. Protein sequences of HLA alleles were obtained from IMGT/HLA database ( Robinson et al. 2015). Exons forming the variable region in the peptide binding groove (i.e., exon 2 and 3 for class I alleles and exon 2 for class II alleles) were selected following the annotation obtained from Ensemble database ( Aken et al. 2016). Amino-acid sequence alignments were performed using MUSCLE ( Edgar 2004), and sites containing alignment gaps at the beginning or the end of sequences were removed. Genetic distances between alleles for all possible allele pairs at each locus were determined removing missing sites in pairwise comparisons and using five different pairwise parameters of allele divergence: p-distance ( Henikoff 1996), DayHoff ( Dayhoff et al. 1978), JTT ( Jones et al. 1992), Grantham ( Grantham 1974), and Sandberg ( Sandberg et al. 1998). Pairwise amino acid p-distance, DayHoff and JTT distances were calculated in MEGA 7 ( Kumar et al. 2016). Grantham and Sandberg sequence distances were calculated using a custom Perl script that required two input files: a FASTA file with aligned HLA alleles and a specific amino acid distance matrix. Grantham amino acid distance matrix was constructed from Grantham (1974). Sandberg amino acid distance matrix was calculated based on Euclidian distances between all 20 amino acids, using the Euclidian distance method in R version 3.4.1 ( R Development Core Team 2017) according to the five physicochemical z-descriptors described in Sandberg et al. (1998): z1 (hydorphobicity), z2 (steric bulk), z3 (polarity), z4, and z5 (electronic effects). Our perl script (together with the Grantham amino acid similarity matrix) is freely available for download from SourceForge (https://granthamdist.sourceforge.io/). It can be used for calculation of pairwise Grantham divergence for any set of aligned MHC alleles of any species.

    Allele Frequencies

    Information about HLA allele frequencies in different human populations where obtained from the Allele Frequency Net Database (AFND) ( Gonzalez-Galarza et al. 2015). We considered only populations of European ancestry with large sample sizes and for which frequencies of alleles at second field resolution were available: USA NMDP European Caucasian (ن = 1,242,890), German (ن= 39,689), and Polish (ن= 20,653) populations. Furthermore, as with the analyses above, we focused on alleles defined as “مشترك” in the CWD catalogue, which led to exclusion of some alleles with a frequency <1%. For each population, we first determined the most common alleles (allele frequency >= 5%) and for all the alleles under investigation in a given population, we calculated the average Grantham pairwise divergence to the most common alleles, considering all possible heterozygote genotypes.

    تحاليل احصائية

    Correlation Tests

    The Shapiro–Francia test was performed for all the parameters under investigation (i.e., measures of genetic distance, combined number of bound peptides and average Grantham pairwise amino acid divergence to the most common alleles) to explore samples’ distribution. As parameters were not normally distributed and tied ranks could be detected within our data, the nonparametric Kendall correlation was used to test for associations between parameters. When testing the association between sequence divergence and functional divergence, all ص values were adjusted for multiple testing using a sequential Bonferroni correction across the number of alleles tested at each locus as well as across the number of different loci tested. When testing the association between the allele’s average divergence and its population frequency, ص values were corrected across the number of populations tested. Correlations were performed in R version 3.4.1 ( R Development Core Team 2017).

    Permutation Tests

    To test for significant differences in the strength of correlation between allele divergence and the binding to pathogen group-specific peptides, we performed permutation tests. For this analysis, the set of 232 representative human pathogen proteins were randomly shuffled among the three groups of pathogens, maintaining the same number of proteins as observed in the original data (extracellular ن = 57, intracellular ن = 100 and intra-extracellular ن = 75). For each group of pathogens, permuted proteins were used to perform binding prediction analyses and compute correlation values between genetic distances and combined number of bound peptides counted for all possible allele pairs for the five HLA genes (analogous to original analysis). Each permutation was run 1,000 times, and the difference between correlation coefficients for intracellular and extracellular proteins for the five HLA genes was recorded. If there was no significant bias for intracellular or extracellular pathogens, on average this difference should be zero. The distribution of permuted differences was then used to infer the significance of our initial observations using a one-tailed test with a 0.05 cut-off.

    Artificial Proteins

    Four sets of artificial proteins were created and analyzed to test for potential differentiation of the amino acid composition (AAC) among the three groups of pathogens. The first set of artificial proteins was created by randomly shuffling amino acids within each pathogen protein by using the Shuffle Protein program ( Stothard 2000), thus maintaining the AAC of each protein intact. Three more sets of artificial proteins were created in R version 3.4.1 ( R Development Core Team 2017) by assembling random amino acids while maintaining several features as they occurred within each of the three pathogen groups used in the initial test (i.e., the number of proteins, the average length of sequences, the SD of the length and the minimum and maximum length). The second set of artificial proteins was created from random amino acids but maintaining the AAC as it occurred within each group of pathogen proteins. The third set of artificial proteins was created from random amino acids, while maintaining amino acid frequencies as they occur in the whole data set of pathogen proteins. Finally, amino acid composition computed from UniProtKB/Swiss-Prot data bank ( Gasteiger et al. 2005 Boutet et al. 2016) was used to create the fourth set of artificial proteins.

    Multivariate Analysis of Variance

    Multidimensional scaling is a multivariate statistical technique that can be used to display and summarize a high-dimensional data set in 2D graphical form. The technique was here applied to explore associations between subsets of pathogen proteins and amino acids. A nonparametric, permutational multivariate analysis of variance (PerMANOVA) was used to test for differences in the amino acid composition between pathogen groups. The PerMANOVA, based on a Bray–Curtis dissimilarity distance matrix, was run with 999 permutations to tests for statistical significance. Both procedures are implemented in the vegan package ( Oksanen et al. 2012) in R version 3.4.1 ( R Development Core Team 2017).

    Comparison of Average Amino Acid Compositions

    Comparison of mean amino acid compositions between the two groups of pathogen proteins (extracellular and intracellular) were performed using one-way analysis of variance all ص values were adjusted for multiple testing using Bonferroni correction across the number of amino acids tested.


    شاهد الفيديو: MHC Presentation (يونيو 2022).