Мапирање целокупног генома у експресији гена у људском префронталном кортексу | молекуларна психијатрија

Мапирање целокупног генома у експресији гена у људском префронталном кортексу | молекуларна психијатрија

Anonim

Субјекти

  • Генетско мапирање
  • Префронтални кортекс

Варијације у експресији гена код појединаца могу имати вишеструке импликације низводно, укључујући ефекат на ризик од болести. 'Генетска геномика' (или експресијска генетика) користи методе повезивања и придруживања за мапирање фенотипа експресије гена, повезујући генетске варијанте са квантитативним локусима експресије (еКТЛ). Представља обећавајући приступ идентификовању нових експресивно-регулаторних елемената у геному. Такође су забележене студије ћелија хуманих лимфобластоида, 1 јетре 2 и мозга 3 . Меиерс ет ал. 3 су проучавала 193 неуропатолошки нормална узорка људског мозга из три кортикалне регије користећи Аффиметрик 500К низ за генотипизацију и Иллумина ХуманРефсек-8 експресијску матрицу за мерење експресије гена. Они су проценили повезаност између 366 140 полуклеорфизама са једним нуклеотидом (СНПс) и експресије 14 078 транскрипата и идентификовали 433 пара СНП-транскрипта (99 транскрипата) који су показали значајну цис- асоцијацију (емпиријски П- вредност емпиријског П -0, 05); али само 25 од њих (који укључују два гена, КИФ1Б и ИПП ) чини се значајним након корекције за све тестиране СНП-ове и фенотипове (транскрипте) (емпиријске П -вредности исправљене мулти-транскриптом 0, 05  0, 05). Сматрали бисмо да су само два гена заиста значајне цис- асоцијације, јер су они преживели исправку за све статистичке тестове.

Миерс и остали су неколико главних ограничења . студија, која укључује хетерогеност узорака (здружени узорци из три различита кортикална региона: фронтална, темпорална и париетална), експресијски подаци збуњени неконтролисаним коваријатима, нарочито вредност пХ мозга и микроарраи ефекти шарже. У сваком случају, било би разумно покушати са репликцијом. Извели смо ново еКТЛ мапирање мозга користећи психијатријске пацијенте и контролне мозгове, фокусирајући се на префронтални кортекс и статистичким поступком оптимизованим за ефекте коваријата и микроарита. Користили смо Суррогате Вариабле Аналисис (СВА) 4 за уклањање коваријатних ефеката и ЦомБат 5 за уклањање ефеката шарже на експресију гена пре тестирања асоцијације СНП-експресије. Ови поступци, надали смо се, ће побољшати моћ откривања асоцијација уклањањем извора негенетских варијација из података.

Добили смо 164 узорка мозга од Станлеи Медицал Ресеарцх Институте (СМРИ). Ових 164 узорака стигло је из две колекције: 6, 7, 8 (1) Неуропатолошки конзорцијум има 60 узорака мозга, а 56 их је добивено од кавкашких појединаца шизофреније, биполарног поремећаја, великих депресивних болесника и здравих контролних група; (2) Збирка СМРИ Арраи садржи још један сет од 105 узорака, од којих су 103 били белци са шизофренијом и биполарним поремећајем, или из здравих контролних група. Дијагнозе узорака направили су два старија психијатра, користећи критеријуме ДСМ-ИВ и засноване на медицинској документацији и, кад је то било могуће, телефонским разговорима са члановима породице. Дијагнозе нетакнутих контрола заснивале су се на структуираним интервјуима вишег психијатра са члановима породице како би се искључила дијагноза Акис-И.

Горња два скупа узорака проучавана су за експресију гена у префронталном кортексу (подручје Броадманна 46, дорсолатерални префронтални кортекс, можда садржи Броадманн подручје 10, фронтални пол) шест истраживача користећи пет различитих платформи микроарраи-а. Подаци су доступни на СМРИ Онлине Геномицс Датабасе (//ввв.станлеигеномицс.орг). Алтар-ова група је једина која је проучавала и узорке конзорцијума и матрице користећи исту микро-платформу (Аффиметрик Хуман Геноме У133А). Ми смо одабрали овај скуп података (Студија 1 и 2 у интернетској бази података) као наше експресијске податке и добили смо ЦЕЛ датотеке необрађених података о експресији гена. Они укључују 87 узорака низа и 40 кавкаских узорака из конзорцијума. Сви ови подаци о изразима су нормализовани робусном методом просечног вишеструког поља помоћу програма Партек (//ввв.партек.цом). Робусне просечне вредности израза са вишеструким пољем израчунате су на основу скалирања до циљаног интензитета од 100, трансформисаног лог 2 (к + 20). Низ Аффиметрик У133А користи, у просеку, 11 сонди пробног скупа за испитивање израза од 3 'једног транскрипта. Сонда је јединица за мерење експресије (фенотип) у овој студији. Укупно је тестирано 22 277 проба у У133А. Одабрали смо 6968 пробесета који су кодирани као „присутни“ алгоритмом позива Аффиметрик Мицроарраи Суите (МАС) у 80% узорака.

Користили смо СВА 4 да идентификујемо познате и непознате коваријате који утичу на податке о експресији гена. Остаци СВА-е су затим коришћени за ЦомБат 5 за уклањање ефеката шарже. Утицај познатих променљивих на податке о експресији гена идентификован је коришћењем линеарне регресије пре и после СВА и ЦомБат. Сви узорци укључују податке о групи за прикупљање података, дијагнози, узрасту, полу, раси, интервалу постмортема, пХ мозга, пушењу, употреби алкохола, статусу самоубистава и психотичним карактеристикама. Користили смо ове променљиве као коваријате у анализи. Употреба дрога и алкохола дихотомизована је у „тешка“ и „није тешка“ (како је дефинисано СМРИ). Подаци о старости, постмортемском интервалу, пХ и доживотни антипсихотици анализирани су као квантитативни коваријати. Остали коваријати су анализирани као бинарни коваријати. Сумарне информације о огледним демографским подацима и коваријатима могу се наћи у Додатној табели СТ1.

Сирови подаци о експресији микрораста показали су снажне ефекте пХ мозга (значајан у 57% сонди) и ефекте шарже (значајан у 48% сонди). Након обраде СВА и ЦомБат и процене значаја коваријата пробијањем унутар серија, пропорције гена који показују значајне ефекте пХ и шарже ( П <0, 05) смањене су на 2 и 5%, што је ближе очекивању шанси (Допуна Табела СТ2).

Заостали 6968 добијени од СВА / ЦомБат коришћени су као фенотипи за анализу асоцијације. Сви остаци су стандардизовани да имају средњу вредност 0 и стандардну девијацију 1.

Геномске ДНК истих појединаца извађене су из смрзнутих ткива церебелума обезбеђених СМРИ. Протокол 9 фенола / хлороформа / изоамил алкохола је модификован и праћен. ДНК су поново суспендовани у 0, 1 м М ЕДТА ТЕ пуферу. Геномска ДНК је процењена помоћу НаноДроп НД-1000 спектрофотометра (НаноДроп Тецхнологиес, ​​Вилмингтон, ДЕ, САД) ради концентрације и коришћењем 1% агарозног гела за валидацију интегритета ДНК. Користили смо ГенеЦхип Маппинг 5.0К Арраи анд Ассаи комплет (Аффиметрик, Санта Цлара, Калифорнија, САД) за генотипизацију према Аффиметрик протоколу. Позвани су генотипови користећи БРЛММ-п алгоритам (Аффиметрик) са свим низовима истовремено. Стопе позива за СНП кретале су се од 97, 3 до 99, 58% (просечно 98, 9%). У 156 кавкаских узорака 238 389 од 443 816 СНП-а имају стопу позива 99%, мању фреквенцију алела 10% и Харди-Веинбергов еквилибријум П- вредност 0, 001. Ових 238 389 СНП коришћено је за тестирање повезаности са експресијом гена.

Програме СТРУКТУРА, 10 ПЛИНК 11 и ЕИГЕНСТРАТ 12 користили смо за верификацију узорка етничке хомогености и ПЛИНК 11 парно израчунавање идентитета по држави и идентитета по паду да бисмо испитали криптичку повезаност. Резултати су потврдили да је 127 одабраних узорака поријеклом из неповезаних бијелаца, а они су кориштени за тестове повезаности генотипа и експресије.

Регулација експресије гена може се грубо поделити на две врсте: регулација која делује на цис помоћу ДНК елемената у транскрипту или у њеној близини и регулација реакције факторима из генских регија удаљеним од транскрипта, укључујући из различитих хромозома. Дефинисали смо СНП-ове у региону ограниченом удаљености од 1 Мб од оба краја сваког израза сонде као кандидата за цис- анализу. Сви остали СНП анализирани су на трансактивне асоцијације сваког гена. Четрдесет сонди за експресију искључено је из цис- анализе јер имају више хомолога у геному. Они су анализирани помоћу других трансанализаних поступака користећи све СНП-ове као транскандидате СНП-а за њих.

Користили смо ПЛИНК 11 за анализу линеарне регресије како бисмо тестирали повезаност експресијских резидуала и генотипа (адитивни генетски модел; број мањих алела у сваком СНП-у). Из ове анализе добијено је асимптотско П- вредновање из Валд-ове статистике. Све пермутације су изведене пермутацијом унутар микрорачуна мРНА и генотипизационим партијским кластерима ради контроле ефеката шарже. Пермутације су изведене заменом скупова фенотипа између појединаца. Овим се чува однос између генотипова (и контрола за неравнотежу везе) и унутар груписаних фенотипа (контролирајући тако било какве корелације између експресијских сонди). Дефинисани су кластери појединаца унутар сваке мРНА микро-матрице и генотипске серије. Пермутације су изведене унутар сваке групе појединаца ради контроле ефеката шарже. Извршене су две групе пермутација. Пермутације за експресију-СНП комбинацију израчунати су адаптивном перм опцијом ПЛИНК, проузрокујући до милијарду реплика (ЕМП_П). Ово исправља могућу не-нормалност дистрибуције фенотипа. Извршене су и корекције пермутација за вишеструко тестирање унутар цис- региона или скенирања целог генома, коришћењем опције мак (Т) пермутације од ПЛИНК (Регионвиде_П за цис ; Геномевиде_П за транс ). За сваки фенотип, резултати су пермутирани 1000 пута, користећи исто семе за одржавање корелације између фенотипа. Најзначајнија статистика по копији сачувана је помоћу опције ПЛИНК мперм-саве. За процену значаја за фенотип, добијена је најзначајнија статистика по копији за све фенотипове ( статистички најбоље ). Фенотипизиране исправљене П- вредности израчунате су као ( Р +1) / ( Н +1), где је Р број пута колико је стат најбоље премашио посматрану статистику, а Н број пермутација (1000).

У цис- анализи, 3951 парова СНП-експресије, које се састоје од 3530 СНП-а и 903 пробесета (од 826 гена), значајно су корелиране са пермутираним П -вредностом широм региона широм региона  0, 05. Открили смо да су 562 асоцијације (која укључују 106 гена) значајне након корекције за експресију фенотипа 6928 који су тестирани на цис- асоцијацију (Пхенотипе-виде_П 0.05). Седамдесет и две експресионе сонде имале су 3–20 различитих СНП-ова из сваког цис- региона, показујући значајне асоцијације на фенотип. То су еКТЛ подржани од стране више СНП-ова у истој регији. Цис асоцијације показују ефекте величине Р2 у распону од 0, 05 до 0, 67. Првих 10 најбољих сигнала Валд П од ових 106 гена приказано је у Табели 1. Комплетна листа цис- регулације може се наћи у Додатној Табели СТ3.

Табела пуне величине

У трансанализи 241 СНП-транскриптивни парови сонди из 239 СНП-а и 160 пробесета (157 гена) имали су асоцијације на пермутацијски кориговани Геномевиде_П 0, 05 (допунска табела СТ4); али ниједна није била значајна након даље корекције фенотипа.

Занимљиво је да су пут и функционална анализа регулисаних гена у цис - и транс- асоцијацијама коришћењем Ингенуити Патхваи Аналисис (ввв.ингенуити.цом) показали да су "деградација протеина и синтеза протеина" најбогатија функционална група. Убиквитација протеина је најбогатији канонски пут (допунска табела СТ5). Ово сугерише да на метаболизам протеина може утицати генетска варијанта, са детектобилним ефектима више него у осталим биолошким системима.

Открили смо један СНП (рс17733118, узводно од ЗФП64 , хомолог протеина цинка) који показује повезаности са два различита гена ВПС8 и ЦТННА1 . ЗФП64 је, дакле, потенцијални дељени регулатор који регулише експресију ВПС8 и ЦТННА1 , мада се до сада ништа не зна о њиховим интеракцијама. Опет вреди приметити да ове транс- асоцијације не достижу ниво значаја за фенотип, дакле уз добру могућност да буду лажно позитивне.

У претходној студији узорака мозга 3 Миерс и сур. идентификовано је 433 парова СНП-транскрипта (99 транскрипата) који показују цис- асоцијацију у целој регији (исправљену за све СНП-ове тестиране у сваком цис- региону), али су идентификовали само два гена који показују значајну цис- асоцијацију фенотипа. Анализирали смо 366 гена, који су у нашој студији показали значајну цис- асоцијацију у 46 узорака подгрупе предњег кортекса из Миерсове студије, користећи нашу СВА-ЦомБат процедуру. Да би се максимизирала снага, недостајући подаци приписани су кориштењем просјечења најближих сусједа прије СВА анализа. Доступне су информације о полу, старости, стопи откривања транскрипта, установи за узимање узорака и датумима шарже (али не и пХ мозга). Учинци ових коваријата анализирани су кориштењем регресије у подацима прије и након СВА + ЦомБат података. У унапред обрађеним подацима, шаржни ефекти, брзина откривања установе и транскрипта били су значајни у 40, 15 и 20% сонди. У накнадно обрађеним подацима и пермутирању унутар серијског кластера, шаржни ефекти, брзина откривања установе и транскрипта показали су се значајним у 5, 6 и 0% сонди. Анализе асоцијације су рађене на исти начин као и СМРИ подаци. Испитивани су само СНП-ови који су били значајни у нашој студији. Према томе, значај који се односи на регион односи се на значај након корекције за број анализираних СНП-а, а не за цис- регион. Од 826 гена који показују асоцијације са Регионвиде_П <0, 05 у СМРИ подацима, само 366 гена може бити тестирано у Миерсовим подацима. Дефинишући репликацију као само повезивање са истим СНП-ом у истом смеру (исти алел повећава или смањује експресију гена), 103 асоцијације које укључују 45 гена реплицирају се на значајном нивоу широм регије. Међу њима 26 асоцијација које укључују седам гена показује значење широм фенотипа у реплицираном узорку (Табела 2 приказује најбољу повезаност за сваки од 45 гена).

Табела пуне величине

Релативно низак ниво репликације није изненађујући и недостатак репликације не поништава ниједан скуп налаза. Величина поновљеног узорка је прилично мала (само 46 узорака). Нормално величина узорка треба бити већа од оне у почетној студији како би била довољна снага за репродукцију налаза из иницијалне студије. Такође постоји разлика између мозга и регије (фронтални кортекс у Миерсовој студији; префронтални кортекс у нашој студији) и разлике у демографским подацима (просечна старост 81 година за Миерс-ове узорке; у овој студији просечна старост је 45 година).

Миерс ет ал. пријавио је повезаност гена РПС26 са СНП рс11171739 као пример реплицирања Цхеунг ет ал. 1 налаз у ћелијама лимфобластоида. Приметили смо и ову асоцијацију. Друга студија јетре такође је идентификовала повезаност РПС26 –рс2292239 као једну од њених најјачих асоцијација 2 . Чини се да је РПС26 један од снажно генетски регулисаних гена у људском геному.

Седам СНП-а у геномском региону од 125 кб показало је цис- асоцијацију са два различита гена, АЛДХ8А1 и ХБС1Л , на нивоу значајности који је широк фенотип (Табела 3). Могу се сматрати корегулираним транскриптима. АЛДХ8А1 и ХБС1Л се преписују у истом правцу, са повећаном експресијом која је повезана са истим алелом СНП-а. Они могу бити изведени из полистистронског транскрипта, мада се до сада ретко извештава или проучава поликистронска транскрипција, осим микроРНА кластера. 13

Табела пуне величине

Пошто су узорци у овој студији од пацијената са психијатријским поремећајем и контролама, заинтересовано нас је занимало да ли композиција узорка утиче на откривене елементе регулације. У коваријантној анализи података о експресији, открили смо да дијагнозе болести доприносе врло мало глобалним варијацијама нивоа експресије гена пре и после СВА / ЦомБат прилагођавања, упоређујући са многим другим факторима, укључујући постмортем интервал, пХ мозга (Додатна табела 2 ). Након регресирања фактора који укључују статус афекције, открили смо да статус афекције има мало утицаја на резултате еКТЛ мапирања у овој студији.

Може се замислити да би генетске варијанте имале јачи и директни утицај на регионалну цис регулацију експресије гена, док би даљња трансрегулација укључивала више фактора и тако показала мање генетских ефеката. Идентификовали смо изузетно велику количину цис асоцијација које могу поднијети строгу статистичку корекцију за вишеструко тестирање. Ниједна транс- асоцијација није била значајна након корекције за број анализираних СНП-а и фенотипа. Остале еКТЛ студије су тврдиле откривање трансрегулација са значењем широм региона и повремено фенотипом, али постоји мала конзистентност између студија. 14, 15, 16, 17 Претходно је уочена потешкоћа у реплицирању транс- еКТЛ. 15 Ми се залажемо за употребу значаја који се односи на фенотип, што би могло помоћи у смањењу лажних позитивних приказа које би било теже поновити.

Приметили смо да се ово истраживање усредсређује на гене који имају опажену, релативно велику варијацију у експресији, и на СНП који имају заједничке мање фреквенције алела, како би имали добро напајане парове СНП-експресије за еКТЛ мапирање. Значајан број значајних гена кандидата за неуропсихијатријску болест, укључујући 5-ХТТ (СЛЦ6А4) , ДРД1 , ДРД2 , ДРД3 , ДРД4 , ДРД5 , ГРИА1 , ГРИА3 , ГРИА4 , ГРИН1 , ГРИН2Б , ГРИН2Ц , ГРИН2Д , ПЕР1 , ЦРИ1 , ЦРИ2 и друге, у овој студији нису процењене јер су њихове експресијске сонде филтриране због ниског нивоа сигнала експресије.

Приступ подацима и биоматеријалима

Датотеке података о генотипу и изразима поменуте у раду су доступне на //ввв.станлеигеномицс.орг/индек.хтмл и на захтев аутора. ДНК и РНА узорци су такође доступни за примену путем СМРИ (//ввв.станлеиресеарцх.орг/днн/БраинРесеарцхЛабораторибрБраинЦоллецтион/табид/83/Дефаулт.аспк).

Додатне информације

ПДФ датотеке

  1. 1.

    Допунска табела СТ 1–5

    Додатне информације прате рад на веб локацији Молекуларна психијатрија (//ввв.натуре.цом/мп)