معلومة

النيوكلوتايد في مواقع علامات DNase شديدة الحساسية والهيستون

النيوكلوتايد في مواقع علامات DNase شديدة الحساسية والهيستون


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أقوم بالتحقيق في دور تعدد الأشكال في المواقع شديدة الحساسية لـ DNase وفي مناطق الحمض النووي لعلامات هيستون ولدي بعض الأسئلة حول هذا الموضوع.

SNPs في مواقع DNase شديدة الحساسية قد يعني أن تلك الأشكال المتعددة الأشكال في مناطق مُحسِنة وقد تؤثر على تقارب ربط TF الذي يمكن أن يؤثر على المخرجات النصية. هل هذا صحيح؟

النيوكلوتايد في مواقع علامات هيستون لدي عدد SNPs التي تقع في القمم (تسلسل الشريحة) لتعديلات هيستون التالية للمرضى الأصحاء: H3K27ac ، H3K4me1 ، H3K4me3 (تمثل الكروموسوم النشط) H3K27me3 ، H3K9me3 (تمثل الكروموسوم المكبوت)

تمثل تعديلات هيستون ما إذا كان الكروموسوم نشطًا أم مكبوتًا. قد يغير SNP ألفة ربط هيستون. هذا يعني أنه إذا كان لدي SNP في البيانات الخاصة بالكروموسوم النشط (H3K27ac ، H3K4me1 ، H3K4me3) ، فقد يغير حالة الكروموسوم ، أي تحويله إلى كروموسوم مكبوت أو قد يدفع الهيستون إلى عدم الارتباط على الإطلاق (هو يعني أن هذه المنطقة لا تزال نشطة ، أليس كذلك؟) هل هذا صحيح؟ لست متأكدًا من فهمي للتأثيرات المحتملة لمواقع علامات هيستون SNP.


أولاً ، دعنا نحدد بعض المفاهيم.

  • المناطق شديدة الحساسية لـ DNAse هي مناطق DNA تكون في شكل كروماتين مفتوح (أي كروماتين حقيقي). هذا يعني أن هذه المناطق أكثر نشاطًا على المستوى الجينومي (أي التعبير الجيني الأعلى ، وتنظيم الجينات ، وربط TF أعلى) وتكون أقل عرضة لتكوين الجينات.

  • مواقع علامة هيستون هي مناطق DNA معروفة بربطها بنوع معين من الهيستونات وبالتالي تؤثر أيضًا على تشكيل الكروماتين مما يؤدي إلى نفس التأثيرات الموصوفة سابقًا. النقطة الحاسمة هي أن الهستونات التي تقوم بإدراجها لا تربط بشكل أساسي تسلسل DNA معين (كما هو موصوف بواسطةmdperry) ولكن بالأحرى تسلسل الحمض النووي المميز بالتعديلات اللاجينية مثل المثيلة والأستلة.

الآن بالنسبة لأسئلتك الأولى ، قد تؤثر SNPs في المناطق شديدة الحساسية لـ DNAse على حالة الكروماتين ، وبالتالي قد تؤثر نعم على التعبير الجيني وتنظيم الجينات. هل ستؤثر هذه النيوكلوتايد أيضًا على ارتباط TF؟ حسنًا ، قد يكونون بشكل غير مباشر عبر تعديلات الكروماتين. لن تعمل بشكل مباشر على ربط TF إذا لم تكن موجودة في تسلسل معروف بربط TFBS (TFBS). فرط حساسية الدنا ليس مرادفًا لمناطق / تسلسلات ربط عامل النسخ.

بالنسبة إلى سؤالك الثاني ، يصعب تفسير تعدد الأشكال في مواقع علامة هيستون قليلاً. قد تؤدي ، أو لا ، إلى إحداث تغييرات في الكروماتين من خلال التأثير على ارتباط الهيستونات ولكن ليس بطريقة مباشرة. جزر CpG ، على سبيل المثال ، مناطق الحمض النووي المعروف أنها تخضع إلى حد كبير لتأثير العلامات اللاجينية ، وبالتالي فإن الطفرات في تلك المناطق المحددة (على سبيل المثال طفرة C -> T) قد تؤثر على حالة المثيلة / الأستلة النسبية وبالتالي ارتباط الهيستونات. لذلك قد تؤثر SNPs على التعبير الجيني عبر تغييرات الكروماتين التي تؤدي إلى ارتباط TF أعلى / أقل ولكن مرة أخرى ليس بطريقة مباشرة. هنا مرة أخرى ، قد يؤثر SNP على ارتباط TF مباشرة فقط إذا كانت الطفرة موجودة في TFBS.

كما ترى ، فإن إجابتي مليئة بـ "القوة" والسبب هو أنه من الصعب للغاية ، في ظل أحدث التقنيات ، تحديد التأثير الدقيق لـ SNP على التشكل ثلاثي الأبعاد للكروماتين ، وبالتالي توقع التأثير على تعبيرات جينية محددة.

قد تكون النصيحة هي محاولة ترجمة تعدد الأشكال الخاص بك بشكل مشترك مع TFBS المعروف سواء كان متوقعًا في السيليكو أو تم القياس من خلال تجارب CHiP-SEQ ودمج ذلك مع المعلومات حول فرط نشاط DNAse وعلامات هيستون التي جمعتها بالفعل. على سبيل المثال ، من المحتمل جدًا أن يكون لـ SNP في TFBS في منطقة فرط نشاط DNAse تأثير أكبر من SNP في TFBS في منطقة غير نشطة.

أنا آسف لأنني لا أستطيع أن أكون أكثر تحديدًا ولكن هذا مجال بحث نشط للغاية في علم الوراثة ولا يزال هناك الكثير لفهمه ، خاصة بالنسبة للتفاعلات بين جميع اللاعبين الذين يؤثرون على تشكيل الكروماتين.


ضع في اعتبارك أنه ليس هيستونات فردية هي التي ترتبط ببعضها البعض ، فهناك 8 بروتينات هيستون تشكل جسيمًا مضغوطًا من النوكليوزيد ، والجسيم يحتوي على 146 نقطة أساس من الحمض النووي ملفوفًا بإحكام حوله. نظرًا لأن التفاعل بين الهيستونات والحمض النووي ليس خاصًا بالتسلسل ، فمن غير المحتمل أن يكون لتعدد أشكال النوكليوتيدات الفردي تأثير قابل للقياس على شغل الجسيم النووي في هذا الموقع.


السمات اللاجينية الفريدة لـ Pack-MULEs وتأثيرها على تكوين قاعدة الكروموسومات وطيف التعبير

يعد اكتساب وإعادة ترتيب جينات المضيف بواسطة العناصر القابلة للنقل (TEs) آلية مهمة لزيادة تنوع الجينات كما يتضح من ∼3000 Pack-Mutator-like TEs في جينوم الأرز الذي اكتسب تسلسلات جينية (Pack-MULEs) ، ومع ذلك لا يزال غامضًا . لتحديد توقيعات Pack-MULEs العاملة وتطور Pack-MULE ، أنشأنا مجموعات بيانات النسخ والترجمة والإبيجينوم وقارننا حزم Pack-MULE بالجينات وعائلات TE الأخرى. تم نسخ ما يقرب من 40 ٪ من Pack-MULEs مع وجود 9 ٪ من أدلة الترجمة ، مما يميزها بوضوح عن TEs الأخرى. عرضت Pack-MULEs ملف تعريف تعبير فريد مرتبط بالخصوصية في الأنسجة التناسلية التي قد تترافق مع سمات البذور. تشبه حزم Pack-MULE المعبر عنها جينات ترميز البروتين العادية كما هو موضح بمستوى منخفض من مثيلة الحمض النووي ، والارتباط بعلامات هيستون النشطة ومواقع DNase I شديدة الحساسية ، وغياب علامات هيستون القمعية ، مما يشير إلى احتمال وجود جزء كبير من Pack-MULEs وظيفية في الجسم الحي. ومن المثير للاهتمام ، أن القدرة التعبيرية لـ Pack-MULEs مستقلة عن البيئة الجينومية المحلية ، وقد يكون إدخال وتعبير Pack-MULEs قد غيّر نمط التعبير الكروموسومي المحلي بالإضافة إلى مواجهة تأثير إعادة التركيب على تكوين قاعدة الكروموسومات ، والذي كان له تأثير عميق. العواقب على تطور بنية الكروموسوم.

الأرقام

العناصر القابلة للتحويل (TEs) وترميز البروتين ...

العناصر القابلة للتحويل (TEs) وجينات ترميز البروتين المستخدمة في هذه الدراسة. ( أ )…

ملفات تعريف النسخ والترجمة لـ ...

ملفات تعريف النسخ والترجمة لـ Pack-MULEs ، وجينات TE الأخرى ، والجينات الأبوية ، وغيرها ...

كثافة مواقع DNase I شديدة الحساسية لـ TEs و Pack-MULEs وجينات ترميز البروتين و ...

مثيلة الحمض النووي في الأرز الشباب ...

مثيلة الحمض النووي في عناقيد الأرز الصغيرة. (أ - ج). نسبة مثيلة الحمض النووي للمناطق الداخلية ...

جزء من TEs و Pack-MULEs و ...

جزء من جينات TEs و Pack-MULEs وجينات ترميز البروتين مع تعديلات هيستون في الأرز اليافع ...

العلاقة بين معدل إعادة التركيب ...

العلاقة بين معدل إعادة التركيب وتوزيع Pack-MULEs وجينات ترميز البروتين. (...


مقدمة

تعتمد العمليات البيولوجية المعقدة مثل تمايز الخلايا والاستجابة للإشارات البيئية على التحكم الدقيق الزماني والمكاني في نسخ الجينات ، والذي تحكمه التفاعلات بين عوامل النسخ (TFs) و رابطة الدول المستقلة-العناصر التنظيمية (CREs) [1،2،3]. يعد فك رموز الكائنات الحية الدقيقة في الجينوم أمرًا ضروريًا لفهم شبكة تنظيم النسخ التي تظهر تعقيد الأنسجة وتعدد الأشكال الظاهري. يمكن الوصول إلى المناطق الجينومية التي تحتوي على الكائنات الحية الدقيقة النشطة للبروتينات المنظمة عن طريق طرد أو تفكيك النيوكليوسومات في الكروماتين المحلي [4 ، 5]. يمكن تقييم إمكانية الوصول ، التي تتعلق بتشكيل الكروماتين "المفتوح" أو "المغلق" ، من خلال العديد من التقنيات بما في ذلك DNase-seq و ATAC-seq [6،7،8،9]. في هذه الطرق ، يتم معالجة الكروماتين بجرعة صغيرة من نوكلياز داخلي DNase I أو ترانسبوزيز Tn5. يتم مهاجمة الكروماتين المفتوح الذي يفتقر إلى حماية النيوكليوسومات بشكل تفضيلي من قبل هذه الإنزيمات ، مما أدى إلى أجزاء صغيرة من الحمض النووي مرتبطة بالبروتينات المنظمة. يمكن التعرف على شظايا الحمض النووي من خلال التسلسل عالي الإنتاجية. تم استخدام DNase-seq و ATAC-seq على نطاق واسع لتحديد الـ CREs المرتبطة بأنواع الخلايا المختلفة والأنسجة ومراحل النمو في كل من الحيوانات [10 ، 11] وأنواع النباتات [12 ، 13 ، 14 ، 15 ، 16 ، 17 ، 18].

يُولِّد نوكلياز البؤرة الدقيقة (MNase) فواصل مزدوجة في الدنا غير المحمي و "يقضم" الحمض النووي المكشوف حتى يواجه عائقًا ، مثل الجسيم النووي [19 ، 20]. نظرًا لأن الحمض النووي للرابط يتعرض للهجوم بشكل تفضيلي بواسطة MNase ، فإن الكروماتين المعالج بـ MNase سيتم هضمه في سلم نووي وينتج عنه في النهاية نوى نيوكليوزوم محمية بواسطة

147 زوج قاعدي DNA [19 ، 21]. بالنظر إلى هذه الخاصية الفريدة ، تم استخدام MNase بشكل أساسي للتحقيق في إشغال الجينوم وتحديد المواقع على نطاق الجينوم ، حيث يتم تحليل شظايا الحمض النووي من 150 إلى 200 نقطة أساس ، والتي تمثل آثار أقدام النواة. إلى جانب آثار الأقدام النووية ، تم الإبلاغ عن شظايا أقصر (& lt 80 bp) مرتبطة ببروتينات أخرى مرتبطة بالحمض النووي ، مثل TFs ، في الكروماتين المعالج بالـ MNase [20 ، 22]. في الواقع ، أدى اقتران هضم MNase مع الترسيب المناعي للكروماتين (ChIP) باستخدام الأجسام المضادة ضد TFs إلى تحديد مواقع ربط TF مع زيادة الخصوصية والحساسية من البروتوكولات التقليدية [23 ، 24]. تشير هذه الدراسات إلى قدرة MNase على فك رموز المشهد التنظيمي لجينومات حقيقية النواة.

قمنا بتطوير تقنية ، تسمى تسلسل فرط الحساسية MNase (MH-seq) ، لتحديد المناطق الجينومية المرتبطة بالكروماتين المفتوح في نبات الأرابيدوبسيس thaliana. باختصار ، فإن A. thaliana تم إصلاح الكروماتين وهضمه بشكل خفيف بواسطة MNase. تم جمع شظايا الحمض النووي الصغيرة الناتجة (20 إلى 100 نقطة أساس) وتسلسلها باستخدام منصة Illumina. يشار إلى المناطق الجينومية المخصبة بقراءات MH-seq على أنها مواقع MNase شديدة الحساسية (MHSs). وجدنا أن MHSs تغطي غالبية (87-92٪) من الكروماتين المفتوح الذي تم تحديده مسبقًا بواسطة DNase-seq و ATAC-seq. والمثير للدهشة أن نسبة كبيرة (22٪) من MHS لم يتم تغطيتها بواسطة DNase-seq أو ATAC-seq ، والتي يشار إليها فيما بعد بـ "MHSs محددة" (sMHSs). نوضح أن sMHSs مخصب لـ H3K27me3 ومثيل الحمض النووي وتمثل فئات متميزة من مجالات الكروماتين المفتوحة التي قد لا يمكن الوصول إليها من قبل DNase I أو Tn5. أظهرت sMHSs عددًا من الخصائص المميزة مقارنةً بـ MHSs التي تغطيها قراءات DNase-seq أو ATAC-seq ، بما في ذلك الارتباط مع مثبطات النسخ. وبالتالي ، يوفر MH-seq أداة جديدة لتحديد وفهرسة جميع فئات الكروماتين المفتوح في حقيقيات النوى الأعلى.


نتائج

التقاط أهداف الجينات الجديدة التي تم تحديدها Hi-C في مواقع الإصابة بالصدفية

لقد أنشأنا بيانات التسلسل لتجارب منطقة CHi-C في نسختين في ثلاثة شروط: (1) HaCaT غير محفز ، (2) تم تحفيز HaCaT باستخدام IFN-لتمثيل البيئة الصدفية الالتهابية و (3) خلايا My-La. استهدف تصميمنا الشامل المناطق الجينية المرتبطة بالعديد من الأمراض المناعية بما في ذلك الصدفية SNPs من GWAS متعددة (انظر "الطرق" والملف الإضافي 1 ، الجدول S1). لقد استهدفنا 10000 وحصلنا على متوسط ​​8580 شظية Hi-C معينة (علامات ثنائية) لكل جزء من الطعم بمتوسط ​​كفاءة التقاط بنسبة 71 ٪ (ملف إضافي 1 ، الجدول S2). تم استخدام تحليل الالتقاط Hi-C لمنظمة الجينوم (CHiCAGO) لتحديد التفاعلات المهمة لكل نوع خلية. تم تقييم قابلية الاستنساخ أولاً من خلال ملاحظة عدد التفاعلات المشتركة بين التكرارات وثانيًا من خلال HiCRep [25] (ملف إضافي 2 ، الشكل S1). أظهر معامل الارتباط المعدل للطبقة (SCC) الذي أنتجته HiCRep أن جميع عينات HaCaT كانت متشابهة للغاية وكانت أكثر ارتباطًا بشكل طفيف بالتكرار بدلاً من الحالة. كانت عينات My-La مرتبطة أيضًا ارتباطًا وثيقًا ببعضها البعض ، وأقل ارتباطًا بخلايا HaCaT (ملف إضافي 2 ، الشكل S1B).

من خلال دمج بيانات ChIP-seq المنشورة ، وجدنا أن الأجزاء الطرفية الأخرى التي تتفاعل مع شظايا الطعم GWAS قد تم إثرائها في H3K27ac و H3K4me3 في أنواع الخلايا ذات الصلة NHEK و CD8 + الخلايا التائية الساذجة (ملف إضافي 3 ، الشكل S2) ، مما يشير إلى أن تتفاعل مواقع GWAS بشكل تفضيلي مع المناطق النشطة مثل المعززات والمروجين. تم أيضًا إثراء الأجزاء الطرفية الأخرى في خلايا HaCaT للمنظم الهيكلي للكروماتين CTCF ، بناءً على ChIP-seq في NHEK (ملف إضافي 3 ، الشكل S2).

بالنسبة لخط الخلية My-La ، لاحظنا عددًا كبيرًا من العناصر المهمة عبر-التفاعلات (درجة CHiCAGO ≥ 5) التي تغطي كروموسومات مختلفة (3392/42،928 تفاعلًا إجماليًا من جميع مواقع الأمراض المناعية التي تم التقاطها) ، ومعظم هذه (

59٪) تم تعيينهم للتفاعلات بين اثنين من المواقع المنقولة المعروفة في خلايا My-La [26]. في ضوء ذلك ، تمت تصفية التفاعلات لتشمل تفاعلات الكروموسوم نفسه فقط. قمنا بعد ذلك بتصفية تفاعلات CHi-C لتشمل فقط تلك التي تنطوي على الصدفية مواقع GWAS التي استهدفناها بنجاح 104 GWAS SNPs في نطاق الجينوم على نطاق واسع و SNPs الوكيل المرتبط بها في ص 2 & gt 0.8 ، المقابلة لـ 907 شظايا طُعم هندي III. عبر تجارب الالتقاط الثلاث ، حصلنا على متوسط ​​6593 تفاعلًا (درجة CHiCAGO ≥ 5) نشأت من شظايا الصدفية المستهدفة (ملف إضافي 1 ، الجدول S2). تم إثراء البيانات للتفاعلات طويلة المدى ، مع أكثر من 75٪ من التفاعلات الهامة في مواقع الصدفية الممتدة و 100 كيلو بايت (ملف إضافي 4 ، الشكل S3). كانت مسافات التفاعل المتوسطة 227 كيلو بايت (HaCaT غير محفز) ، 234 كيلو بايت (محفز HaCaT) و 259 كيلو بايت (My-La). تم العثور على مسافات التفاعل في مواقع الصدفية لتكون أكبر بشكل ملحوظ في خلايا My-La عنها في خلايا HaCaT (Kruskal-Wallis مع اختبار المقارنات المتعددة لـ Dunn ص & lt 0.0001 و ص = 0.0011 لـ HaCaT غير محفز ومحفز ، على التوالي) ، مما يشير إلى بنية الكروماتين الخاصة بالخلية.

للتحقق من صحة بيانات CHi-C الخاصة بنا ، قمنا بتراكب التفاعلات مع مجموعة بيانات موقع المسار الكمي للتعبير المنشور (eQTL) ، حيث تم ربط SNP الصدفية الرئيسي مع eQTL SNP الرئيسي في خلايا CD4 + T والخلايا الأحادية [27]. افترضنا أن اقتران محفز الجينات eQTL لمسافات طويلة غالبًا ما ينطوي على حلقات الكروماتين. أبلغت الدراسة عن 15 نايو SNPs من GWAS مع 26 SNPs وكيل eQTL المقابل ، منها 16 وكيلًا ، تمثل 9 GWAS SNPs ، شظايا متداخلة في دراستنا. تم التقاط ثمانية من هذه الوكلاء داخل جزء HindIII يحتوي على جين eQTL نفسه أو كان على بعد 20 كيلو بايت منه. كان هناك سبعة وكلاء آخرين داخل ، أو بجوار ، شظايا أظهرت دليلًا على التفاعل مع جين eQTL البعيد في بيانات خط الخلية CHi-C (درجة CHiCAGO ≥ 5) (ملف إضافي 5 ، الجدول S3). فقط الوكيل الأبعد ، rs8060857 ، لم يُظهر أي دليل على التفاعل مع جين eQTL (ZNF750، 720 كيلو بايت). لذلك ، يعد هذا دليلًا قويًا على أن بيانات CHi-C الخاصة بنا يمكن أن تُظهر روابط بين GWAS الوظيفية البعيدة SNPs والجين المستهدف ، حتى عبر أنواع الخلايا غير المتطابقة.

في جميع خطوط الخلايا ، حدث ما يقرب من 30 ٪ من التفاعلات بين جزء طُعم الصدفية وموقع بدء النسخ (Ensembl 75). كان العدد الإجمالي لأهداف الجينات المتفاعلة 442 في خلايا HaCaT غير المحفزة (الملف الإضافي 5 ، الجدول S4) ، و 461 في خلايا HaCaT المحفزة (الملف الإضافي 5 ، الجدول S5) و 650 في خلايا My-La (ملف إضافي 5 ، الجدول S6) ، تضم مجموعة من 839 جينًا. من بين هذه الأهداف ، تمت مشاركة 288 هدفًا جينيًا (34.3٪) بين جميع أنواع الخلايا ، في حين كان 58 و 64 و 291 هدفًا فريدًا في خلايا HaCaT غير المحفزة و IFN-γ و My-La على التوالي. تشارك خلايا HaCaT غير المحفزة والمحفزة نسبة كبيرة من أهدافها الجينية (355 هدفًا 77-80٪). تميل شظايا الطُعم التي تتفاعل مع الجينات إلى التفاعل مع شظايا متعددة تحتوي على محفز تتوافق مع جينات مختلفة ، بمتوسط ​​شظيتين في خلايا HaCaT (غير محفزة أو محفزة) و 3 شظايا في خلايا My-La ، مما يشير إلى تورط 2 و 3 جينات (إضافية ملف 6 ، الشكل S4) ، والذي يتماشى مع النتائج التي تم الإبلاغ عنها مسبقًا [20 ، 22 ، 28].

لقد استنتجنا أن أهداف الجينات ذات التعبير القابل للاكتشاف في نفس نوع الخلية ستكون أكثر صلة بيولوجيًا من تلك التي لم يتم التعبير عنها ، لذلك أجرينا RNA-seq (الملف الإضافي 7 ، الجدول S7) وحددنا التعبير النسبي للجينات التي تتفاعل مع الصدفية GWAS SNPs في كل نوع خلية (ملف إضافي 5 ، الجداول S4-S6) أو أجزاء طعم GWAS متداخلة (ملف إضافي 7 ، الجدول S8). تضمنت الجينات المعبر عنها التي تتفاعل مع شظايا GWAS مرشحات مقنعة لمرض الصدفية مثل IL23A, PTGER4, STAT3 و NFKBIZ. الأهم من ذلك ، وجدنا أنه تم إثراء الأجزاء الطرفية الأخرى من تفاعلات CHi-C بشكل كبير لمواقع بدء النسخ للجينات المعبر عنها في نوع الخلية المقابل (ملف إضافي 3 ، الشكل S2). لقد بحثنا عن أشكال ربط عامل النسخ التي تتقاطع مع الصدفية التي تتفاعل مع محفزات الجينات النشطة باستخدام الأداة SNP2TFBS [29] واكتشفنا العديد من العوامل المخصبة بشكل كبير ، مع أكبر إثراء تم العثور عليه لـ REL ، والذي هو بحد ذاته جين مرشح في موضع 2p16.1 [30] (ملف إضافي 7 ، الجدول S9).

تسبب تحفيز خلايا HaCaT باستخدام IFN-في التعبير التفاضلي لـ 535 جينًا (معدل ص & lt 0.10): 88 خاضعًا للتنظيم و 447 منظمًا (ملف إضافي 7 ، الجدول S10). بينما لم يتم إثراء الجينات الخاضعة للتنظيم لأي مسارات بيولوجية ، فقد تم إثراء الجينات المنتظمة لـ 196 عملية بيولوجية تضمنت مصطلحات GO ذات الصلة بالصدفية مثل "GO: 0045087 الاستجابة المناعية الفطرية" (ص = 9.39 × 10 −20) ، "GO: 0034097 استجابة لتحفيز السيتوكين" (ص = 7.32 × 10 −15) و "GO: 0034340 استجابة لنوع I interferon" (ص = 1.08 × 10 −10) (ملف إضافي 7 ، الجدول S11). تداخل اثنا عشر من الجينات المعبر عنها تفاضليًا مع جزء طعم من الصدفية (ملف إضافي 3 ، الجدول S11) وتم تضمينه ERAP1, ERAP2, IFIH1, RNF114, SOCS1 و STAT2. بالإضافة إلى ذلك ، تم إشراك 12 جينًا معبرًا عنها تفاضليًا في تفاعلات مروج الطعم (ملف إضافي 7 ، الجدول S12) وتضمنت مرشحين مثل ICAM1, KLF4 و STAT3. ومع ذلك ، فإن الغالبية العظمى من هذه الجينات المعبر عنها تفاضليًا تفاعلت بالمثل مع الطعوم المرتبطة بالصدفية في كل من الخلايا غير المحفزة والمحفزة (درجة CHiCAGO ≥ 5).

أمثلة على تفاعلات CHi-C التي تورط الجينات المستهدفة لمرض الصدفية

في الموضع الجيني 9q31.2 ، يقع ارتباط الصدفية بين مجموعتين من مجموعات الجينات البعيدة حيث كان المرشح الجيني المقترح هو عامل شبيه كروبل 4 (KLF4) بسبب وظائفه البيولوجية ذات الصلة في التمايز والحصانة الفطرية [30]. أظهرت بيانات CHi-C الخاصة بنا تفاعلات كبيرة (درجة CHiCAGO 5) بين جمعية الصدفية ومحفز KLF4 في كل من خلايا HaCaT غير المحفزة والمحفزة ، على مسافة 560 كيلو بايت تقريبًا (الشكل 1 أ). في كلتا الحالتين ، تم التفاعل مع جزء الطعم chr9: 110810592-110816598 KLF4 (درجة CHiCAGO = 6.75 و 5.29 للخلايا غير المحفزة والمحفزة ، على التوالي) بينما في الخلايا المحفزة وحدها ، تفاعل أيضًا جزء الطعم الثاني (chr9: 110798319-110798738) ، متزامنًا مع زيادة أكثر من خمسة أضعاف في KLF4 التعبير (FC = 5.78 صفة. ص = 4.26 × 10 8). في خلايا My-La ، لوحظ تشابه مماثل ، ومع ذلك ، لم تتزامن التفاعلات مع الجزء الذي يحتوي على الجين نفسه. علاوة على ذلك ، فإن KLF4 لم يتم اكتشاف التعبير بواسطة RNA-seq في خلايا My-La ، مما يشير إلى آلية خاصة بنوع الخلية (ملف إضافي 7 ، الجدول S7). في جميع أنواع الخلايا ، امتدت التفاعلات طويلة المدى أيضًا من موضع الصدفية إلى الجانب التيلومري من صحراء الجينات ، لكنها لم تصل إلى أقرب جين في هذا الجانب (ACTL7B) بحوالي 35 كيلو بايت.

أمثلة على تفاعلات CHi-C التي تنطوي على الجينات الأقرب / المبلغ عنها. تظهر التفاعلات في 9q31.2 (KLF4) مكان (أ) و 5p13.1 (PTGER4) مكان (ب). تتضمن المسارات كتل LD للصدفية (Ps) على النحو المحدد بواسطة SNPs في ص 2 & gt 0.8 مع مؤشر SNP وشظايا HindIII ذات الطعم وجينات RefSeq (NCBI) و H3K27ac و H3K4me3 ص إشارة القيمة في NHEK (ENCODE) و CD8 + الخلايا التائية الساذجة الأولية (Roadmap Epigenomics) ، TADs (تظهر على شكل أشرطة) وتفاعلات CHi-C المهمة في درجة CHiCAGO ≥ 5 (تظهر كأقواس) في ثلاثة شروط: خلايا HaCat غير محفزة (أرجوانية) ، تم تحفيز خلايا HaCaT بخلايا IFN-(حمراء) وخلايا My-La (زرقاء). تشير المنطقة المظللة إلى كتلة LD للصدفية. تم عمل الشكل باستخدام متصفح WashU Epigenome ، GRCh37 / hg19 [31]

في الموضع 5p13.1 ، تكون SNPs للصدفية متوارثة بشكل مشابه [32] ، ولكن أقرب جين PTGER4 ثبت أنه مرشح قوي لأمراض المناعة الذاتية الأخرى في هذا المكان [22]. أظهرت بيانات CHi-C الخاصة بنا تفاعلات (درجة CHiCAGO ≥ 5) بين الأجزاء المتعددة المرتبطة بالصدفية و PTGER4 أكثر من 300 كيلو بايت تقريبًا إلى الطرف الآخر من TAD ، وهو اكتشاف قوي في جميع أنواع الخلايا (الشكل 1 ب). PTGER4 تم الكشف عن التعبير بواسطة RNA-seq في جميع أنواع الخلايا (ملف إضافي 7 ، الجدول S7). في خلايا My-La ، امتدت التفاعلات أيضًا إلى مروجي TTC33، والتي تم التعبير عنها في جميع أنواع الخلايا ، و RPL37، التي لم يتم الكشف عن تعبير لها في أي نوع من الخلايا.

في موضع 2p15 ، تم تعيين ارتباط الصدفية الموسوم بـ rs10865331 في الأصل إلى أقرب جين B3GNT2 ومع ذلك ، تم تخطي تفاعلات CHi-C B3GNT2 (

120 كيلو بايت في المنبع) وبدلاً من ذلك تورط مروج مجال استقلاب النحاس الذي يحتوي على 1 (COMMD1) ، وهو جين متورط في إشارات NFkB ، أكثر من 435 كيلو بايت تقريبًا (الشكل 2 أ) [30 ، 33]. حدث هذا التفاعل في خلايا HaCaT المحفزة وخلايا My-La ، و COMMD1 تم الكشف عن التعبير بواسطة RNA-seq في جميع أنواع الخلايا. B3GNT2 تم اكتشاف التعبير أيضًا في جميع أنواع الخلايا (ملف إضافي 7 ، الجدول S7).

أمثلة على تفاعلات CHi-C في الصحاري الجينية التي تنطوي على جينات بعيدة / جديدة. التفاعلات موضحة في 2p15 (B3GNT2) مكان (أ) و 1p36.23 (RERE, SLC45A1, ERRFI1, TNFRSF9) مكان (ب). تتضمن المسارات كتل LD للصدفية (Ps) على النحو المحدد بواسطة SNPs في ص 2 & gt 0.8 مع مؤشر SNP وشظايا HindIII ذات الطعم وجينات RefSeq (NCBI) و H3K27ac و H3K4me3 ص إشارة القيمة في NHEK (ENCODE) و CD8 + الخلايا التائية الساذجة الأولية (Roadmap Epigenomics) ، TADs (تظهر على شكل أشرطة) وتفاعلات CHi-C المهمة في درجة CHiCAGO ≥ 5 (تظهر كأقواس) في ثلاثة شروط: خلايا HaCat غير محفزة (أرجوانية) ، تم تحفيز خلايا HaCaT بخلايا IFN-(حمراء) وخلايا My-La (زرقاء). تشير المنطقة المميزة إلى كتلة LD للصدفية. تم عمل الشكل باستخدام متصفح WashU Epigenome ، GRCh37 / hg19 [31]

في موضع 1p36.23 ، يكون الارتباط الموسوم بـ rs11121129 هو الأقرب إلى SLC45A1 وتم تخصيصه في الأصل لأهداف جينية متعددة مفترضة [30]. ومع ذلك ، أظهرت بيانات CHi-C تفاعلات (درجة CHiCAGO ≥ 5) بين كتلة LD الصدفية ومحفز لمثبط ردود فعل مستقبلات ERBB 1 (ERRFI1) ، وهو منظم مهم لتكاثر الخلايا الكيراتينية والتمايز ، في كل من خلايا HaCaT غير المحفزة والمحفزة (الشكل 2 ب). لم يلاحظ هذا التفاعل في خلايا My-La ، وعلاوة على ذلك ، ERRFI1 تم الكشف عن التعبير في خلايا HaCaT (غير محفزة ومحفزة) ولكن ليس في خلايا My-La (ملف إضافي 7 ، الجدول S7). تفاعل بين جمعية الصدفية ومحفز SLC45A1 لوحظ أيضًا في خلايا HaCaT المستحثة ، ولكن ليس غير المحفزة (الشكل 2 ب) ، SLC45A1 لم يتم اكتشاف التعبير بواسطة RNA-seq في أي من خطوط الخلايا (ملف إضافي 5 ، الجدول S5).

في موضع 6p22.3 ، تكون إشارة الصدفية الموسومة بـ rs4712528 intronic ل CDKAL1، وكان هناك 11 شظية intronic المرتبطة بالصدفية والتي تفاعلت أيضًا مع CDKAL1 محفز في خلايا My-La (الشكل 3 أ) CDKAL1 تم الكشف عن التعبير في جميع الخلايا. ومع ذلك ، كانت هناك أيضًا تفاعلات طويلة المدى (درجة CHiCAGO ≥ 5) بين الشظايا المرتبطة بالصدفية و SOX4 أكثر من 950 كيلو بايت في جميع أنواع الخلايا (الشكل 3 أ). SOX4 هو مرشح جيني مقنع له دور في إنتاج IL17A والتهاب الجلد لدى الفئران [34] هنا ، SOX4 تم اكتشاف التعبير في خلايا HaCaT ولكن ليس في خلايا My-La (ملف إضافي 7 ، الجدول S7).

أمثلة على تفاعلات CHi-C التي تضيف التعقيد إلى الموقع. تظهر التفاعلات في 6p22.3 (CDKAL1) مكان (أ) و 1q21.3 (LCE3B, LCE3C) مكان (ب). تتضمن المسارات كتل LD للصدفية (Ps) على النحو المحدد بواسطة SNPs في ص 2 & gt 0.8 مع مؤشر SNP وشظايا HindIII ذات الطعم وجينات RefSeq (NCBI) و H3K27ac و H3K4me3 ص إشارة القيمة في NHEK (ENCODE) و CD8 + الخلايا التائية الساذجة الأولية (Roadmap Epigenomics) ، TADs (تظهر على شكل أشرطة) وتفاعلات CHi-C المهمة في درجة CHiCAGO ≥ 5 (تظهر كأقواس) في ثلاثة شروط: خلايا HaCat غير محفزة (أرجوانية) ، يتم تحفيز خلايا HaCaT بخلايا IFN-(حمراء) وخلايا My-La (زرقاء). تشير المنطقة المميزة إلى كتلة LD للصدفية. تم عمل الشكل باستخدام متصفح WashU Epigenome ، GRCh37 / hg19 [31]

في موضع 1q21.3 ، توجد نواتج SNP متعددة المخاطر في مجموعة جينات مغلف حقل الذرة المتأخر (LCE) في مجمع تمايز البشرة (EDC). أحد الارتباطات في هذا المكان هو حذف 32 كيلوبايت يزيل الامتداد LCE3B و LCE3C الجينات [30 ، 35 ، 36]. أظهرت بيانات CHi-C تفاعلات متعددة وقوية بين المناطق المرتبطة بالصدفية في جينات LCE ، بما في ذلك من داخل منطقة LCE3C / B-del سعة 32 كيلو بايت ، والجينات في اتجاه مجرى النهر في EDC التي تضمنت IVL, لور, PRR9 و SPRR الجينات ، على مسافة

600 كيلو بايت (الشكل 3 ب). من هذه الجينات ، IVL تفاعل مع طُعم الصدفية في خلايا HaCaT غير المحفزة ولكن ليس في الخلايا المحفزة ، وانخفض تعبيرها عند التحفيز (FC = 0.40 المجاور. ص = 0.0139). كانت جينات الترميز التي تتفاعل مباشرة مع شظايا ضمن حذف 32 كيلو بايت LCE3A, PRR9, LELP1, SPRR2B و SPRR2C. من هؤلاء ، فقط التعبير عن المنطقة الغنية بالبرولين 9 (PRR9) ، في خلايا HaCaT ولكن ليس في خلايا My-La (ملف إضافي 7 ، الجدول S7). PRR9 سبق أن ثبت أنه يتم تنظيمه في لويحات الصدفية ويحدثه IL17A وبالتالي قد يكون هدفًا مهمًا للجين البعيد في هذا الموضع [37].

يشكل موضع خطر الصدفية 9q31.2 تفاعلات طويلة المدى مع KLF4 ويؤوي متغيرات تنظيمية محتملة

ركزنا انتباهنا على الموضع الجيني الكبير في 9q31.2 ، والذي لم يتم وصفه من قبل في الصدفية ، على حد علمنا. الجين المرشح ، عامل شبيه كروبل 4 (KLF4) ، يشفر عامل النسخ مع مجموعة من الوظائف ذات الصلة بما في ذلك تشكيل حاجز الجلد [38] والإشارات المناعية [39] ولكنه يقع على بعد أكثر من 500 كيلو بايت من الرصاص GWAS SNP rs10979182 [30]. أظهرت تجربة CHi-C تفاعلات طويلة المدى بين SNPs المرتبطة بالصدفية و KLF4 (الشكل 1 أ) [30]. KLF4 تم تنظيم التعبير أيضًا بواسطة IFN-، مما يشير إلى أنه قد يكون لاعبًا مهمًا في بيئة التهابية. أردنا تحديد أولويات المتغيرات التنظيمية في 9q31.2 وتحديد ما إذا كانت هناك أي علاقة معزز وظيفي بين SNPs و KLF4 أو جينات أخرى بعيدة في الموضع.

أولاً ، قمنا بتمييز تعدد الأشكال المرتبط بالصدفية في 9q31.2 عن طريق التنقيب عن مجموعات البيانات والأدوات اللاجينية المتاحة للجمهور. هناك تسعون متغيرًا في LD الضيق (ص 2 & gt 0.8) مع الرصاص GWAS SNP rs10979182 (1KG Phase 3 European) (الشكل 4 أ) يتقاطع العديد منها مع علامات هيستون المعدلة (H3K4me1 و H3K27ac) في عدة أنواع من الخلايا من ENCODE ، بما يتوافق مع أربعة عناصر مُحسِّن مفترضة تتداخل مع H3K4me1 و H3K27ac الإشغال (الشكل 4 ب). في خلايا الخلايا الكيراتينية البشرية الأولية (NHEK) ، كانت علامات هيستون المحسن أكثر بروزًا في المعززات 2-4 (الشكل 4 ج). تتداخل SNPs أيضًا مع مواقع فرط حساسية DNase ومواقع ارتباط عامل النسخ (الشكل 4 ج) التي تتوافق مع عناصر مُحسِّن في NHEK وفقًا لـ ChromHMM [43].

نظرة عامة على SNPs في LD مع rs10979182 تتراكب أربعة عناصر مُحسِنة مفترضة في موضع 9q31.2. أ يوضح الشريط الأرجواني موقع كتلة rs10979182 LD (ص 2 & GT 0.8) في

1 ميجا بايت صحراوي بين مجموعتين من الجينات ، كما هو موضح بواسطة جينات UCSC [40]. ب يتم الإشارة إلى 90 SNPs في LD مع rs10979182 بخطوط أرجوانية و H3K4me1 ، وتظهر مسارات H3K27ac ChIP-seq من ENCODE على شكل قمم في GM12878 (أحمر) ، H1-hESC (أصفر) ، HSMM (أخضر) ، HUVEC (أزرق فاتح) و K562 (أزرق غامق) و NHEK (أرجواني) وخلايا NHLF (وردي) [41]. يظهر مؤشر SNP ، rs10979182 ، كسهم أخضر ، ويظهر SNP ذي الأهمية ، rs6477612 ، كسهم أسود. ج تكبير المحسنات المفترضة 2-4 تُظهر تراكب SNPs علامات ENCODE التنظيمية: H3K4me1 و H3K27ac ChIP-seq (NHEK) ومجموعات DNase ومجموعات ChIP لعامل النسخ عبر 91 نوعًا من الخلايا على شكل أشرطة رمادية / سوداء ، حيث يشير الظلام إلى قوة الإشارة. بالنسبة لمجموعات ChIP ، تشير الخطوط الخضراء إلى أعلى موقع تسجيل لعنصر أساسي محدد من FactorBook للعامل المقابل. تم عمل الرقم باستخدام متصفح الجينوم UCSC ، GRCh37 / hg19 [42]

لم يتم تحديد eQTLs في المجموعة وفقًا لـ Haploreg v4.1. حدد RegulomeDB rs6477612 ، الموجود داخل المُحسِّن المفترض الثالث ، باعتباره SNP مع أعلى إمكانات تنظيمية مفترضة بدرجة 2 أ. rs6477612 في ضيق LD (ص 2 = 0.92 ، 1 كجم يورو) مع rs10979182 وكان موجودًا داخل جزء HindIII الذي وجد أنه يتفاعل مع KLF4 في خلايا HaCaT في بيانات CHi-C الخاصة بنا (chr9: 110810592-110816598 hg19) ، مما يجعلها SNP ذات أولوية ذات أهمية.

اقترحت بيانات HiChIP أن التفاعلات بين KLF4 والصدفية SNPs نشطة في خلايا HaCaT ، ولكن ليس في خلايا My-La

كنهج تكميلي لـ CHi-C ، استخدمنا طريقة HiChIP التي تم تطويرها مؤخرًا لتحديد التفاعلات التي تتم بوساطة H3K27ac في خطوط الخلايا لدينا. في خلايا HaCaT ، كانت هناك ذروة H3K27ac في KLF4 محفز تفاعل مع عدة مناطق عبر صحراء الجينات بما في ذلك المعززات المرتبطة بالصدفية 3 و 4 وفي المنطقة التفاعلية المنشورة سابقًا من دراسة سرطان الثدي في كل من خلايا HaCaT غير المحفزة والمحفزة (الشكل 5) [17]. تتفاعل قمم H3K27ac عند الصدفية أيضًا مع العديد من المحسّنات المفترضة الأخرى داخل صحراء الجينات ، لكنها لم تتفاعل مع أهداف جينية أخرى ، مما يعكس بنية CHi-C (الشكل 5). في المقابل ، كان هناك نقص في قمم H3K27ac في خلايا My-La في 9q31.2 ، وبالتالي لا توجد تفاعلات HiChIP مهمة. يشير هذا النقص في إشغال H3K27ac إلى حالة تنشيط تفاضلية في هذه المنطقة بين خلايا HaCaT و My-La.

تفاعلات HiChIP (H3K27ac) مع KLF4 مروج في موضع 9q31.2. تشمل المسارات كتلة LD للصدفية كما هو محدد بواسطة SNPs في ص 2 & gt 0.8 مع rs10979182 ، جينات RefSeq ، TADs (كما هو موضح على شكل أشرطة) ، إشغال H3K27ac (كما هو موضح في شكل قمم) وتفاعلات HiChIP كبيرة (تظهر على شكل أقواس) في ثلاث حالات: خلايا HaCaT غير محفزة (أرجوانية) ، خلايا HaCaT محفزة مع IFN-γ (أحمر) وخلايا My-La (أزرق). اقتصرت تفاعلات HiChIP على تلك التي تنشأ إما من الصدفية SNPS أو KLF4 المروجين. تشير المنطقة المظللة باللون الأصفر إلى كتلة LD للصدفية عند rs10979182. تشير المنطقة المميزة باللون الأرجواني إلى ما تم وصفه مسبقًا KLF4منطقة التفاعل في دراسة سرطان الثدي [17]. تمثل المقاييس في تفاعلات HiChIP درجة FitHiChIP. تم عمل الشكل باستخدام متصفح WashU Epigenome ، GRCh37 / hg19 [31]

لاحظنا زيادة في عدد وقوة قمم H3K27ac في 9q31.2 TAD (chr9: 110202281-111602280) في خلايا HaCaT المحفزة مقارنة بخلايا HaCaT غير المحفزة (الشكل 5). زاد عدد القمم من 60 إلى 77 ، وكانت هناك زيادة كبيرة في متوسط ​​إشارة الذروة من

9.5 in shared peaks (ص < 0.0001, Wilcoxon matched-pairs signed-rank test). This also corresponded with an over 5-fold upregulation of gene expression upon IFN-γ stimulation in HaCaT cells (FC = 5.78 adj. ص = 4.26 × 10 −8 ). Combined, this suggests that inflammatory stimulation of HaCaT cells causes upregulation of KLF4 that is mediated, or at least accompanied, by increased enhancer activity in 9q31.2.

3C-qPCR supplemented HiChIP/CHi-C findings in the 9q31.2 locus

We used 3C-qPCR in an effort to confirm the interaction between the psoriasis-associated putative enhancer 3 (rs6477612) and KLF4 and to further prioritise regulatory SNPs. Our 3C experiment utilised both the enhancer and the KLF4 gene as focus anchors, in both HaCaT and My-La cell lines. The enhancer-focused 3C experiment identified interaction peaks with regions approximately 2.5 kb and 8.7 kb downstream of KLF4 in My-La and with the downstream 8.7-kb region alone in HaCaT (Additional file 8, Fig. S5).

ال KLF4-focused 3C experiment showed that KLF4 significantly interacted with several intergenic psoriasis-associated fragments, including the fragment containing the third putative enhancer (rs6477612), in HaCaT cells, but not in My-La cells (Additional file 9, Fig. S6). This corroborates the CHi-C data, which showed a more robust interaction between the enhancer and the KLF4 gene in HaCaT cells (Fig. 1a). A positive control interaction linking a distal breast cancer-associated locus with KLF4 [17, 18] demonstrated the strongest interaction with the KLF4 promoter region in both cell types (Additional file 9, Fig. S6).

Taken together, the 3C results confirm a close spatial proximity between the psoriasis-associated SNPs and KLF4 in 9q31.2. However, there is no clear peak of interaction among the LD block that would implicate some SNPs over others. In addition, stronger interactions were seen between KLF4 and regions further upstream in the gene desert, which correlates with previous CHi-C findings in breast cancer cells [17] and Hi-C findings in NHEK cells [14] (illustrated in Additional file 10, Fig. S7).

ChIP-qPCR confirmed the presence of regulatory histone modifications in 9q31.2 in HaCaT cells

We performed ChIP-qPCR of the histone marks H3K4me1 and H3K27ac to confirm the cell type specificity of enhancer activity within the KLF4-interacting psoriasis loci. Primers were designed to target 150–200-bp regions encompassing predicted peaks of H3K27ac occupancy in the four putative enhancers identified from ENCODE data (NHEK). H3K4me1 and H3K27ac occupancy was detected at all tested loci in HaCaT and My-La cells (Fig. 6a). However, occupancy was significantly increased in HaCaT cells with an enrichment of both H3K4me1 and H3K27ac at enhancer 3 (H3K4me1 ص = 0.0372, H3K27ac ص < 0.0001) and H3K27ac at enhancer 4 (ص < 0.0001) in HaCaT cells in comparison with My-La cells (Fig. 6a). Stimulation of HaCaT cells with IFN-γ had little effect on the occupancy of H3K4me1 or H3K27ac at the regions tested within the enhancers, or at a region tested at the KLF4 promoter (Fig. 6b).

ChIP-qPCR for modified histone marks H3K4me1 and H3K27ac in 9q31.2. أ Enhancer peaks defined by H3K27ac binding in ENCODE NHEK data were targeted in HaCaT cells (blue columns) and My-La cells (red columns). ب Enhancer peaks were targeted in unstimulated (blue) and stimulated (red) HaCaT cells. The graphs show the mean ChIP enrichment of triplicate ChIP libraries ± SD, and samples with no antibody are consistently included for comparison, although they are often too low to be visible. To identify differential ChIP enrichment, 2-way ANOVA tests were performed in GraphPad prism using Sidak’s multiple comparisons test. Asterisks denote adjusted ص & lt 0.05. ج Allele-specific ChIP-qPCR for H3K27ac and H3K4me1 at rs6477612 in NHEK cells. Chromatin from two separate pools of NHEK cells, each comprising cells from three individual donors, was immunoprecipitated with H3K27ac (27 ac), H3K4me1 (me1) or non-specific IgG antibody (IgG), and qPCR was conducted using a TaqMan genotyping assay for rs6477612 detecting C (risk) or T (protective) alleles. Percentage ChIP enrichment was calculated by comparing the signal for each allele in the immunoprecipitated DNA with the signal for each allele in the input DNA for each of the two samples

To determine the potential effects of the risk or protective allele of rs6477612, a SNP of interest within enhancer 3, we performed allele-specific ChIP at rs6477612 for H3K4me1 and H3K27ac in two pools of NHEK cells. However, there was no discernible difference in H3K4me1 or H3K27ac occupancy at the risk (C) or protective (T) allele of rs6477612 (Fig. 6c).

In summary, by combining the HiChIP, CHi-C 3C and ChIP evidence, we could determine that the psoriasis-associated enhancer region interacts with KLF4 in both My-La and HaCaT but is only active in HaCaT cells. Enhancer activity in 9q31.2 is increased after IFN-γ stimulation, correlating with an increase in KLF4 gene expression, although we were unable to detect increases in H3K27ac occupancy at the tested psoriasis-associated enhancer regions.

CRISPR activation suggested that the psoriasis-associated enhancer elements regulate KLF4 expression in 9q31.2

We employed CRISPRa in 9q31.2 to determine whether activating the psoriasis-associated enhancers could impact on gene expression (KLF4 or other, more distal genes), implicating a functional role for the long-range interactions. Pools of single-guide RNA (sgRNA) targeting SNPs within the four psoriasis-associated enhancers were introduced into HaCaT cells stably expressing the CRISPR activator dCas9-P300 (see Additional file 11, Fig. S8 for overview of sgRNA locations). All four pools of sgRNA increased the KLF4 expression in comparison with the control, scrambled sgRNA this increase was statistically significant (after multiple testing correction) at enhancer 3 (ص = 0.0143) and enhancer 4 (ص = 0.0183) (Fig. 7). Pool 3, targeting enhancer 3 containing rs6477612, had the greatest impact with a 2.2-fold increase in the KLF4 التعبير. To a lesser extent, IkappaB kinase complex-associated protein (IKBKAP) to the telomeric end of the gene desert was also subtly but significantly upregulated by approximately 1.2-fold in cell lines containing sgRNA pool 1 in comparison with the scrambled sgRNA (ص = 0.0372). لقد وجدنا أن FAM206A و CTNNAL1 were not significantly affected by CRISPRa (Fig. 7). The remaining two genes, ACTL7A و ACTL7B, were not detectable in any HaCaT cell line, transduced or otherwise (for ACTL7A, all Ct values ≥ 33.4 and for ACTL7B, all Ct values ≥ 34.1).

qPCR results for genes within the 9q31.2 locus in HaCaT cells expressing dCas9-P300. HaCaT cells expressing dCas9-P300 were transduced with pools of plasmids containing sgRNA targeting psoriasis SNPs (pools 1–4), a scrambled sgRNA (Scr) or the same plasmid without a specific guide cloned in (plasmid only (PO)). TaqMan qPCR results are shown for RAD23B, KLF4, IKBKAP, FAM206A و CTNNAL1. Housekeeping genes used were TBP و YWHAZ. For statistical analysis, a Kruskal-Wallis test was performed comparing the fold changes between cells with the scrambled guide or the sgRNA pools, using Dunn’s multiple comparisons test to identify significant differences. Asterisks denote ص & lt 0.05. Graphs show the mean fold change in comparison with the scrambled guide, ± SD of biological triplicate cell lines

To determine the transcriptome-wide effects of activating the psoriasis-associated enhancers in 9q31.2, RNA-seq was performed on the HaCaT dCas9-P300 cells expressing the sgRNA in pool 3 (putative enhancer 3) and compared with cells expressing the scrambled sgRNA (Additional file 12 Table S13). In line with the qPCR experiment, RNA-seq revealed an approximately 3-fold increased expression of KLF4 in the pool 3 cells (FC = 2.92 adj. ص = 0.0546) and an approximately 1.2-fold increase in IKBKAP, CTNNAL1 و FAM206A expression, but these were not significant (IKBKAP FC = 1.26, adj. ص = 0.7331 CTNNAL1 FC = 1.23, adj. ص = 0.68 FAM206A FC = 1.24, adj. ص = 0.82). وبالتالي، KLF4 is the only candidate in this locus with convincing evidence for رابطة الدول المستقلة-regulation by the targeted enhancers.

The RNA-seq analysis showed that there were an additional 236 differentially expressed genes in the CRISPRa experiment (adjusted ص ≤ 0.10), 128 upregulated and 108 downregulated (Additional file 12 Table S13). Importantly, CRISPRa of the psoriasis-implicated enhancer in this keratinocyte cell line not only resulted in an increase in KLF4 expression, but a differential expression of 3 keratin genes (keratin 4, 13 and 15), confirming the importance of this enhancer and the KLF4 gene in skin cell function. Keratin 4 was the most differentially expressed gene in our data with keratin 15 being the 6th most differentially expressed. Previous studies also demonstrated a differential impact of KLF4 on keratin gene regulation [44,45,46].

Confirming the importance of KLF4 in skin cells and validating previous findings of differential gene expression with KLF4 stimulation, differential genes also included EREG (an epidermal growth factor), MMP13 (extracellular matrix protein gene) and CLDN8 (claudin 8 important in epithelium tight junctions). We also demonstrated a

10-fold reduction in the expression of ALPG, from a family of alkaline phosphatases showing the largest fold change in a previous KLF4 over-expression study [44] (Additional file 12 Table S13). The upregulated genes were enriched in several biological pathways according to the GAGE pathway analysis, of which, the most significant related to RNA processing (Additional file 12, Table S14). According to the STRING database, differential genes were enriched in a number of relevant pathways including apoptosis and response to cell stress, emphasising the role that KLF4 plays in cell cycle regulation and supporting previous findings demonstrating that over-expressing KLF4 leads to G1/S cell cycle arrest [47] (Additional file 12, Table S15).

To confirm if the differential genes in the CRISPRa experiment were regulated by KLF4, we used a recently published tool that predicts and ranks transcriptional regulators of gene sets, Lisa [48]. The tool predicted that indeed the gene set was significantly regulated by KLF4 in keratinocytes, breast epithelium and skin fibroblasts. However, KLF4 was ranked number 104 of all the transcriptional regulators (Additional file 12, Table S16). We speculate that the CRISPRa experiment may yield many differentially expressed genes that are not directly regulated by KLF4, but rather are involved in the further downstream cascade of altered gene regulation.

Taken together, the chromatin interaction data coupled with the CRISPRa experiment allow for prioritisation of likely causal variants in 9q31.2 (Additional file 12 Table S17). From the 90 variants in LD with the index SNP, rs10979182, four variants interacted with the likely causal gene KLF4 in both the CHi-C and HiChIP data and overlapped H3K27ac peaks (HaCaT cells): rs60082362, rs55975335, rs6477612 and rs6477613. These variants are all located in the CRISPRa pool 3, which marginally had the greatest impact on the KLF4 التعبير.


The extent to which genetic variation affects an individual's phenotype has been difficult to predict because the majority of variation lies outside the coding regions of genes. Now, three studies examine the extent to which genetic variation affects the chromatin of individuals with diverse ancestry and genetic variation (see the Perspective by Furey and Sethupathy). Kasowski وآخرون. (p. 750, published online 17 October) examined how genetic variation affects differences in chromatin states and their correlation to histone modifications, as well as more general DNA binding factors. Kilpinen وآخرون. (p. 744, published online 17 October) document how genetic variation is linked to allelic specificity in transcription factor binding, histone modifications, and transcription. McVicker وآخرون. (p. 747, published online 17 October) identified how quantitative trait loci affect histone modifications in Yoruban individuals and established which specific transcription factors affect such modifications.

Histone modifications are important markers of function and chromatin state, yet the DNA sequence elements that direct them to specific genomic locations are poorly understood. Here, we identify hundreds of quantitative trait loci, genome-wide, that affect histone modification or RNA polymerase II (Pol II) occupancy in Yoruba lymphoblastoid cell lines (LCLs). In many cases, the same variant is associated with quantitative changes in multiple histone marks and Pol II, as well as in deoxyribonuclease I sensitivity and nucleosome positioning. Transcription factor binding site polymorphisms are correlated overall with differences in local histone modification, and we identify specific transcription factors whose binding leads to histone modification in LCLs. Furthermore, variants that affect chromatin at distal regulatory sites frequently also direct changes in chromatin and gene expression at associated promoters.


Tracks Download and Visualization

Tracks and Metadata

  • Biosample metadata table (xlsx, tsv, html summary)
  • Track download (WUSTL Browser)
  • Average per-group and per-mark tracks (bigWig files)
  • Track visualization on the WUSTL Browser

Track Hubs

We provide track hubs for visualization of all bigWig datasets, both on the UCSC browser and the WUSTL browser. Due to the size of the dataset, we have created track hubs of different sizes and at various levels of resolution.

  • One huge hub for the UCSC Browser and the WUSTL Browser. (These full hubs are very large (17k+ tracks), only use them if you want to load tracks from the full dataset simultaneously.)
  • Average per-group and per-mark tracks hub for the UCSC Browser and the WUSTL Browser
  • Per-sample group trackhubs:
  • Custom track hubs through an interactive website where you can select specific biosamples and assays to export to WUSTL/UCSC.

Chromatin States

We provide chromatin states (ChromHMM) for each of the 833 biosamples. These are calculated using the 18-state Roadmap model from observed and imputed tracks of six histone marks (H3K27ac, H3K4me1, H3K4me3, H3K36me3, H3K9me3, H3K27me3).


خلفية

Over 80% of genetic predisposition, namely risk-loci populated by Single Nucleotide Polymorphisms (SNPs), to human diseases identified by Genome Wide Association Studies (GWAS) map to noncoding DNA [1–3]. In other words, most disease-associated SNPs do not directly alter coding sequences. Over the last decade, the functional annotation of the coding and noncoding genome across a wide collection of cell and tissue types benefited from the integration of maps of transcriptional activity from both coding and noncoding transcripts, such as miRNA and long-noncoding RNAs (lncRNAs) as well as chromatin-protein binding profiles, inclusive of transcription factors and epigenetics modifications, and open chromatin. This functional annotation provides a unique opportunity to delineate the functional basis of genetic predispositions to disease.

Here, we present a computational method, named Variant Set Enrichment (VSE) that computes the enrichment/depletion of the set of genetic predisposition for a disease of interest over functional genomic annotations. We previously used a VSE-based approach to identify the enrichment of Breast Cancer (BCa) genetic predispositions at enhancers bound by FOXA1 and ESR1 in breast cancer cells [1]. VSE relies on the set of genetic predispositions and functional annotations this renders VSE applicable to the study of any genetically inherited disease for which these data are available.

تطبيق

A genetic predisposition (risk-locus) identified by GWAS corresponds to a SNP found on the GWAS array (termed as “tagSNP”) and all SNPs missing from the array but known to be in Linkage Disequilibrium (LD) with the tagSNP (termed as “ldSNP”) [4]. The sum of all genetic predispositions to a particular disease, ie: all the tagSNPs and their ldSNPs constitute the Associated Variant Set (AVS) for that disease.

The identity of risk-loci is user defined, as the cut-off for LD determination is subjected to study preferences. Occasionally, two or more risk-loci for a particular disease can overlap with one another by a common ldSNP. If the common ldSNP overlaps with a functional genomic annotation of interest, the enrichment score calculated by VSE can be inflated because each risk-locus inclusive of this ldSNP would be counted independently. To correct for this possibility, VSE computes a network of all SNPs in which each SNP is represented as a node and the pairwise LD as an edge. Each cluster in the network represents a disjointed locus, as such, a ldSNP is present only in one locus (Additional file 1: Figure S1). VSE then computes the enrichment score of the AVS for each functional genomic annotation of interest in three sequential steps. In the first step, VSE tallies the number of independent risk-loci that overlaps with the functional genomic annotations. Overlapping of a risk-locus is defined as at least one member SNP found within the functional genomic annotation of interest.

This preliminary tallying of AVS may indicate which genomic annotations are functionally related to risk-associated variants, but the overlapping can be affected by size and structure of the AVS. To correct for these biases, VSE, in the second step, computes a null distribution of the overlap tallies that is based on random permutation of AVS. The null AVS is computed by randomly sampling SNPs from a comprehensive pool of tagSNPs present on the GWAS arrays (Illumina Human OmniExpress) and clustering them with their ldSNPs imputed from the 1000 Genome Project Phase III data. When calculating the set of null AVS, VSE makes sure that each set is built in the way that it has identical total number of null loci as the total number of risk-loci in the AVS and each null locus is matched in size to the corresponding query locus. We defined each null AVS as Matched Random Variant Sets (MRVS).

In the third step, VSE tallies the overlapping of MRVS with the functional genomic annotations of interest. This provides the null distribution to calculate for the enrichment/depletion of the AVS across different functional genomic annotations. To make the enrichment analysis comparable across all functional genomic annotations of interest, MRVS tally is centered at the median and scaled to the standard deviations of the null distribution. The enrichment score is then defined as the number of standard deviations that the overlapping tally deviates from the null overlapping tally median. VSE calculates an exact ص-value for significance of the enrichment/depletion by fitting a density function to the null distribution derived from the MRVS. The level of significance is corrected for multiple testing using Bonferroni method. The deviation of the null distribution from the normality is tested using Kolmogorov-Smirnov test and if the distribution deviates, the Box-Cox power transformation is applied on to the null to approach normality.


استنتاج

Ethyl methanesulfonate-induced mutations provide numerous sources for screening individuals with desirable traits in plants. EMS was believed to introduce variations randomly in genome. However, multiple allelic EMS-induced mutants were often identified during mutant screening, indicating a potential bias of EMS mutagenesis. By integrative analysis of the re-sequencing data, gene expression data, and epigenetic modification data, we found a preference of EMS mutagenesis in sequences with a relatively higher GC content in heterochromatin. The chromatin structure and epigenetic modifications on chromatin might also contribute to the EMS mutagenesis bias. These findings not only verify the bias of EMS mutagenesis but also indicate the potential roles of epigenetic modifications and chromatin structure in EMS mutagenesis and DNA repair.


Basic Usage

We describe here how to detect footprints using HINT for ATAC-seq, DNase-seq, and histone modifications data. To perform footprinting, you need at least two files, one with the aligned reads of your chromatin data and another describing the regions to detect footprints. You can use a peak caller, such as MACS2, to define these regions of interest.

Footprinting for ATAC-seq data

Download here the example data for ATAC-seq based on chromosome 1 of the GM12878 cell. Execute the following commands to extract the data from the download file:

and the below command to perform footprinting:

For simplicity, we use only the first 1000 peaks from chromosome 1. The above commands will output a BED file containing the footprints in your current folder مع اثار الاقدام as the prefix. Moreover, You can set the below arguments

to tell HINT your preferred output directory and name. Each footprint, i.e. each line of the BED file, will contain information regarding the tag-count score (number of reads) of each footprint. This score can be used as a footprint quality assessment (the higher values indicates better candidates). In addition, a file including the details of reads and footprints will also be written in the same folder of BED file.

If your data is paired-end, you may want to try another model which is optimized for paired-end sequencing data:

ملحوظة: HINT performs bias correction for ATAC-seq by default, so you يجب download the genomes following these instructions and correctly specify the genome references with the following command before footprinting:

Currently, the default setting is hg19. Find here for more information.

Footprinting for DNase-seq

You can find here example DNase-seq data. Execute the following commands to extract the data from a compressed file:

and the following command to call the footprints:

We recommend you to use cleavage bias correction. This can be done by using the following command:

Don’t forget to define the proper genome references using :

Currently, the default setting is hg19.

Footprinting for histone modification data

Download here the example data for histone modification. Execute the following commands to extract data:

The complete tutorial and more descriptive examples are found in here.


If using annotations from the ENCODE Encyclopedia please cite the publication listed under each annotation along with:


Expanded encyclopaedias of DNA elements in the human and mouse genomes

The ENCODE Project Consortium, Moore JE*, Purcaro MJ,* Pratt HE*, Epstein CB*, Shoresh N*, Adrian J*, Kawli T*, Davis CA*, Dobin A*, Kaul R*, Halow J*, Nostrand EL*, Freese P*, Gorkin DU*, Shen Y*, He Y*, Mackiewicz M*, Pauli-Behn F*, Williams BA, Mortazavi A, Keller CA, Zhang X, Elhajjajy S, Huey J, Dickel DE, Snetkova V, Wei X, Wang X, Rivera-Mulia JC, Rozowsky J, Zhang J, Chhetri SB, Zhang J, Victorsen A, White KP, Visel A, Yeo GW, Burge CB, Lécuyer E, Gilbert DM, Dekker J, Rinn J, Mendenhall EM, Ecker JR, Kellis M, Klein RJ, Noble WS, Kundaje A, Guigó R, Farnham PJ, Cherry JM&dagger, Myers RM&dagger, Ren B&dagger, Graveley BR&dagger, Gerstein MB&dagger, Pennacchio LA&dagger, Snyder MP&dagger, Bernstein BE&dagger, Wold B&dagger, Hardison RC&dagger, Gingeras TR&dagger, Stamatoyannopoulos JA&dagger, Weng Z&dagger

* Authors contributed equally


Data from the Common fund supported Roadmap Epigenomics Mapping Consortium (REMC) were included for building the ENCODE Encyclopedia. Please see the 2015 paper on their analysis of reference human genomes for more information.



تعليقات:

  1. Aman

    في رأيي ، هم مخطئون.

  2. Miktilar

    ماهي الكلمات الصحيحة .. جملة رائعة ورائعة

  3. Nikotaur

    أعتقد أنك ترتكب خطأ. أرسل لي بريدًا إلكترونيًا إلى PM ، سنناقش.

  4. Dracul

    تم العثور على اثنين من الأشخاص الذين يفهمون على الأقل

  5. Loren

    كازاخستان ............. Yyyyyyy



اكتب رسالة