Хаплотипска структура омогућава одређивање приоритета заједничких маркера и кандидатних гена у поремећају спектра аутизма | транслациона психијатрија

Хаплотипска структура омогућава одређивање приоритета заједничких маркера и кандидатних гена у поремећају спектра аутизма | транслациона психијатрија

Anonim

Субјекти

  • Генетика болести
  • Генетски маркери
  • Хаплотипови

Апстрактан

Поремећај аутизанског спектра (АСД) је неуроразвојно стање које резултира поремећајем у понашању, друштвеној комуникацији и комуникацији. АСД има значајну генетску компоненту, са 88–95% подударања особина међу монозиготским близанцима. Напори на расветљавању узрока АСД открили су стотине локуса и осјетљивих гена. Међутим, због своје полигене природе и клиничке хетерогености, само неколико ових маркера представљају јасне мете за даље анализе. У овом истраживању користили смо структуру везе која је повезана са објављеним генетским маркерима АСД-а како бисмо истовремено побољшали детекцију гена кандидата истовремено осигуравајући начин да одредимо приоритете маркера уобичајене генетске варијације АСД-а. Прво смо минирали литературу за студије повезивања и удруживања полиморфизама са једним нуклеотидом, варијације броја копија и мулти-алелних маркера у породицама Аутисм Генетиц Ресоурце Екцханге (АГРЕ) породице. На основу маркера који су достигли значај за геном, израчунали смо мушке генетске удаљености, у светлу опажене снажне мушке пристраности у АСД. Четири од 67 региона повезаних са аутизмом, 3п26.1, 3п26.3, 3к25-27 и 5п15, обогаћене су различито експримираним генима у крви и мозгу од појединаца са АСД. Од 30 гена различито експримираних кроз више скупова података експресије, 21 се налазио унутар 10 цМ локуса повезаног с аутизмом. Међу њима, ЦНТН4, ЦАДПС2, СУМФ1, СЛЦ9А9, НТРК3 претходно су умешани у аутизам, док су други умешани у неуролошке поремећаје коморбидне са АСД. Овај рад користи богате мултимодалне геномске информације прикупљене о АГРЕ породицама како би представио ефикасну интегративну стратегију за одређивање приоритета код аутизма и побољшање нашег разумевања односа међу огромном колекцијом протеклих генетских студија.

Увод

Поремећај аутизанског спектра (АСД) је неуроразвојно стање које резултира поремећајем у понашању, друштвеној комуникацији и комуникацији. Тренутно се процењује да је свако од 88 деце у Сједињеним Државама оболело од АСД-а, а дечаци пет пута више оболели од девојчица. 1 АСД има значајну генетску компоненту, 2, 3, 4 са 88–95% монозиготским двоструким слагањем и процењеном наследношћу од 60–90%. 5 Недавно истраживање показало је да се велики део варијанце одговорности код монозиготских близанаца може објаснити дељеним факторима животне средине (55% за аутизам и 58% за АСД) поред умерене генетске наследности (37% за аутизам и 38% за АСД). 6 Студије закључују да постоји више генетских фактора који имају улогу у етиологији аутизма. Недавни налази пружили су доказе у прилог улогама за новонастале мутације, 7, 8, 9, 10 уобичајених генетских варијанти, 11 ретких варијанти 12 и промену броја копије. 13, 14, 15 Ипак, генетска основа већине АСД и даље остаје нејасна.

Доприноси сложености, студије везане за АСД откриле су преко 70 лоцирања осетљивости у геному и велики број гена кандидата, 16, 17, али већина ових налаза није успешно поновљена. Једини изузеци од овог тренда били су врхови веза 17, 11–17к21 18, 19, 20, 21 и 7к. 22, 23, 24, 25, 26 Ипак, студије о повезивању и удруживању доминирају у приступима раздвајања генетске етиологије аутизма више од две деценије, остављајући иза себе богато наслеђе резултата истраживања у биомедицинској литератури. Извештаји о значајним врховима повезаности представљају важан траг генетског узрока аутизма који не треба занемарити, чак и ако нема довољно репликације. Осим могућности лажних позитивних резултата, одсуство репликације могло би бити посљедица више фактора као што су недостатак величине узорка, диференцијалне стопе рекомбинације у популацији репликације, мања покривеност узорцима репликације генетским маркерима у везним врховима или шаржни ефекти. Ипак, треба утврдити механичку релевантност маркера. На пример, маркер може означити колекцију гена који су укључени у биолошке процесе или појединачне гене са мутацијама од великог значаја за подложност аутизму. Надаље, ови маркери и њихов значај за етиологију аутизма, кад постигну минимални праг значаја логаритма квота 3, 0 или асоцијације П- вриједности од <0, 05 (исправљено за вишеструко тестирање), обично се третирају подједнако. Стога, упркос чињеници да маркери пружају мапе, прецизност тих карата је недовољна за усмеравање приоритетизованог експерименталног праћења, јер је сваки маркер и сваки ген који је најближи том маркеру подједнако важан. С обзиром да су маркери идентификовани на скоро сваком хромосому, корисност студија повезаности за обезбеђивање специфичних генских трагова и усмеравање даљих експерименталних истраживања је ограничена.

У овој студији усредсредили смо се на максимизирање вредности раније објављених налаза повезаности и удруживања користећи породице из пројекта Аутисм Генетиц Ресоурце Екцханге (АГРЕ) за усмеравање даље генетске анализе аутизма. Конкретно, наш циљ је био да пружимо што бољу резолуцију објављеним студијама веза и повезаности кроз нову аналитичку стратегију усредсређену на генетски дистанцу маркера до гена. Наше истраживање је лагано засновано на претпоставци да су гени у уској вези са локусом осетљивости вероватније повезани са фенотипом који нас занима, односно аутизмом и који је потпомогнут колективним разумевањем да поремећај има значајну мушку предрасуду. Као такав, наш рад се фокусирао на реконструкцију мушко-специфичне структуре поремећаја неравнотеже везе (ЛД) који окружује значајне маркере аутизма у скупове гена у уском, средњем и далеком ЛД-ом с тим маркерима. Испитали смо биолошки сигнал својствен сваком концепту и измерили његову експресију у периферној крви и ткиву мозга код особа са аутизмом у поређењу са контролама. Ова стратегија побољшава разрешавање налаза заснованих на маркерима, указујући на специфичне гене који доприносе сигналима везе и / или асоцијације, вероватније да ће имати улогу у АСД. Велики проценат ових гена претходно није био повезан са аутизмом, али је умешан у бројне друге неуролошке болести, укључујући оне са симптомима преклапања. С обзиром на способност ове стратегије да препозна важан и нов сигнал међу богатом колекцијом истраживачких налаза из различитих студија повезаности и асоцијације у аутизму, очекујемо да ће имати шире примене у истраживању других сложених генетских поремећаја у којима ће се наћи велика колекција узорци су претходно откуцани и нису одмах доступни за модерно секвенцирање.

материјали и методе

Избор маркера за аутизам

Прво смо минирали литературу о аутизму како бисмо идентификовали генетске студије усредсређене на АГРЕ породице. Захваљујући фокусу на породице АГРЕ, све овде укључене верзије процењене су и дијагностиковане истим инструментима и процедурама. Идентификовали смо 67 извештаја о значајним сигналима повезаности аутизма и асоцијацији који обухватају 18 хромозома (Табела 1). Прагови значајности били су резултат логаритма-а-оф-тхе-оут> 3, што је сугестивни доказ повезаности или исправљене асоцијације П- вредности <0, 01 (зависно од броја маркера тестираних у студији). Претрага је била ограничена на студије проведене на АГРЕ породицама јер су исти субјекти коришћени за израчунавање генетске карте око маркера аутизма. Ова стратегија омогућила нам је да ухватимо праве стопе рекомбинације у испитиваној популацији и избегнемо било какву потенцијалну рекомбинацију. Како су студије веза и удруживања засноване на различитим експерименталним дизајновима, развили смо доље описану стратегију како бисмо омогућили њихову метаанализу.

Табела пуне величине

Сваки маркер је прво мапиран у НЦБИ грађу људског генома 36.3. Затим је одсек од 20 Мб који покрива ту геномску координату и једно-нуклеотидни полиморфизми (СНПс) унутар тог региона коришћени за израчунавање генетске мапе користећи генотипове истих субјеката. 11 Најближи СНП-у маркеру за аутизам кориштен је као референца за израчунавање стопа рекомбинације са осталим СНП-овима. Стопе рекомбинације одређене су у односу на референцу. Претпоставили смо да су стопе рекомбинације између маркера и најближег СНП-а занемариве, што нам је омогућило да тај СНП означимо као прокси маркера. Захваљујући хетерогености у методама откривања различитих региона (веза између асоцијације, варијације броја копија у односу на СНП и тако даље), третирали смо сваки регион као једнако значајан. То нам је омогућило да користимо непристран приступ у проналажењу гена и регија обогаћених за случајеве аутизма.

Прорачун ЛД структуре маркера аутизма

Да бисмо успоставили мушку специфичну структуру ЛД између гена и маркера аутизма, направили смо генетске мапе од одсека хромозома од 20 Мб, који обрубљује сваки локус везе. Конкретно, прикупили смо и саставили СНП-ове 10 Мб узводно и 10 Мб низводно од сваког маркера за аутизам користећи СНП податке за АГРЕ пробе. Пошто је аутизам готово пет пута распрострањенији код мушкараца, из филтрирали смо женке из скупа података пре израчунавања генетске мапе. Ови поступци филтрације пратили су се логиком да ће АГРЕ, специфична за податке и генетска мапа која је само за мушкарце, највероватније пружити тачан одраз узорака који доприносе сигналима повезивања и придруживања пријављеним у обједињеним студијама.

Да бисмо створили генетске мапе за сваки маркер аутизма, процијенили смо стопу рекомбинације финих скала користећи софтверски пакет ЛДхат. 27 Овај програм процењује стопе рекомбинације између суседних СНП-а постављањем Баиесовог модела заснованог на теорији коалесценције за анализу образаца ЛД у подацима. Ми смо извршили ову анализу за свих 67 маркера, идентификујући мушки специфичне генетске удаљености између маркера и гена који окружују тај маркер, мерено у цМ. За даље филтрирање смо обрезали генетску мапу на 15 цМ око маркера. Процес процеса стварања ових скупова ЛД структуре приказан је на слици 1.

Image

Интегративни геномски ток рада за давање приоритета генима за даље експериментирање. (И) Богата колекција генетичких студија извршених на породицама аутизма са генетском разменом ресурса (АГРЕ) између 2001. и 2012. године минирана је ради идентификације значајних сигнала за повезивање и придруживање у читавом геному. (ИИ) Маркери су преправљени у тренутну изградњу генома (НЦБИ изградња хуманог генома 36.3) и извучени су бочни делови. (ИИИ) Генотипи полиморфизма са једним нуклеотидом (СНП) сабрањени су код мушкараца проведених у АГРЕ како би се омогућили прорачуни генетских удаљености специфичних за мушкарце код истих субјеката. (ИВ) Регионалне стопе рекомбинације између маркера и СНП-а израчунате су и (В) гени који кодирају протеине унутар 20 мушки специфичних цМ од идентификованих маркера. (ВИ) Експресијски профили ових гена испитивани су у мозгу и крви особа са поремећајем спектра аутизма (АСД) у односу на неуротипске јединке. Гени за које је откривено да се различито експримирају у оба ткива и који се налазе унутар мушке специфичне близине значајног маркера за аутизам сматрају се главним кандидатима за даље истраживање. Од 30 гена који задовољавају ове критеријуме, 19 их је раније било умешано у поремећаје који деле симптоме и обрасце оболевања од АСД.

Слика пуне величине

Обрада података експресије Мессенгер РНА

Омнибус сетови података о експресији гена ГСЕ6575 28 и ГСЕ28521 29 коришћени су за испитивање експресије гена који окружују значајне маркере аутизма код појединаца са АСД. ГСЕ6575 скуп података састоји се од 17 узорака особа са АСД без регресије, 18 појединаца са АСД са регресијом, 9 пацијената са менталном ретардацијом или застојем у развоју и 12 деце која се углавном развијају из опште популације. У овом претходном истраживању, укупна РНА је екстрахована из узорака целе крви користећи ПакГене (Киаген, Германтовн, МД, САД) крвни РНА систем и покренута на Аффиметрик У133плус2.0 (Санта Цлара, ЦА, САД). За потребе наше студије, изабрали смо да користимо 35 особа са аутизмом и 12 контролних узорака из опште популације. Претходна обрада и анализа експресије урађене су помоћу Биоинформатицс Тоолбок-а Верзија 2.6 (за Матлаб Р2007а +, Матхворкс, Натицк, МА, УСА). ГенеЦхип Робуст Мулти-арраи Авераге коришћен је за подешавање позадине, а контролни интензитети сонде коришћени су за процену неспецифичног везивања. 30 Уређивани гени, подаци о експресији гена с празним симболима гена, гени с врло ниским апсолутним вредностима експресије и гени с малом варијанцом уклоњени су из скупа претходно обрађених података.

ГСЕ28521 сет података састојао се од узорака ткива мозга након смрти, из 19 случајева аутизма и 17 контрола из Аутисм Тиссуе Пројецт, помоћу Иллумина (Сан Диего, Калифорнија, САД) ХуманРеф-8 в3.0 експресиони беадцхип панел. Три регије мозга претходно умијешане у аутизам биле су профилиране у сваког појединца: супериорни темпорални гирус (познат и као Бродманново подручје 41/42), префронтални кортекс (БА9) и мозак вербеуса. Сирови подаци су форматирани трансформацијом лог 2 и нормализовани квантилном нормализацијом. Разматрали смо сонде са детекцијом П- вредности <0, 05 за најмање половину узорака за даљу анализу, као што је овде описано. 29 Рав П- вредности су генерисане коришћењем лимма / биоцондуцтор пакета у Р софтверу (//ввв.биоцондуцтор.орг/пацкагес/2.12/биоц/хтмл/лимма.хтмл), а Бењамини и Хоцхберг вишеструка корекција испитивања примењена је да би се прилагодио П -вредности.

Профили гена експресије око уобичајених маркера аутизма

Да бисмо испитали важност гена на различитим раздаљинама цМ и испитали ниво сигнала релевантан за аутизам који окружује сваки маркер аутизма појединачно, третирали смо сваку маркер регију као независну хипотезу. Затим смо испитали диференцијалну регулацију гена унутар ЛДС скупова користећи горе описане профиле експресије мессенгер РНА. Наша хипотеза је да ће гени на блиској генетској удаљености од маркера аутизма бити различито регулисани од гена који нису у ЛД са маркама аутизма.

Наши тестови за значајну диференцијалну експресију одступили су од стандардних анализа података о микрорачуну из примарног разлога што је сваки сет ЛДС одражавао независно, претходно биолошко знање. Као такав, третирали смо сваки ЛДС сет као засебну колекцију хипотеза, при чему је број хипотеза истовремено тестиран, еквивалентан броју гена у скупу. Да бисмо на одговарајући начин обрачунали ово вишеструко тестирање, прилагодили смо номиналне вредности П користећи израчунавање к- вредности, 31 мерење уоквирено у смислу погрешне стопе откривања. 32 Свих 67 ЛДС скупова истражено је на овај начин да би се утврдиле фреквенције значајних, прилагођених П- вредности ( к <0, 05) које окружују сваки маркер аутизма.

Унапређење референци на болести

Ископали смо осам постојећих извора за напомену гена-болести за гене повезане са неуролошким поремећајима за које се сматра да су уско повезани са аутизмом. 33 Болести су укључивале гнојну склерозу, епилепсију, поремећај нападаја и многе друге са утврђеном сличношћу у понашању с АСД. Испитане базе података укључивале су базу података Генетиц Ассоциатион, 34 базе података генских варијанти (//пројецтс.тцаг.ца/вариатион/), дбСНП (//ввв.нцби.нлм.них.гов/пројецтс/СНП/), ХуГЕ Навигатор Навигатор, 35 База података о мутацијама људских гена (//ввв.хгмд.цф.ац.ук/ац/индек.пхп), интернетско насљеђивање мендела у човјеку (//ввв.нцби.нлм.них.гов/омим/), ГенеЦардс ( //ввв.генецардс.орг/) и СНПедиа (//снпедиа.цом/индек.пхп/СНПедиа). Резултати из ових извора интегрисани су да би се направила листа гена и придружене карактеристике гена, која је коришћена за поређење са ЛДС генима са аутизмом.

Резултати

Више од 200 генетских студија проведено је на АГРЕ породицама између 2001. и 2012. Они су вађени како би се идентификовало 67 значајних сигнала за повезаност и придруживање генома за АСД (Табела 1). Уобичајени маркери за аутизам обухватају 18 хромозома, сви са оценом логаритамских квота> 3 или са исправљеном асоцијацијом П- вредности <0, 01. Ове студије биле су засноване на различитим експерименталним дизајновима, углавном користећи породице мултиплекса са погођеним сиб-паровима. Калибрирали смо положаје значајних маркера користећи НЦБИ грађу људског генома 36.3 (НЦБИ), а затим објединили све СНП-ове унутар прозора од 10 МБ са обе стране маркера да бисмо израчунали мушко специфичну структуру ЛД око сваког маркера. Испитивање стопа рекомбинације код истих субјеката омогућава нам да изградимо генетску мапу специфичну за популацију, елиминишући све генетске пристрасности које би могле произаћи из разматрања контрола подударних по етничкој припадности.

Наши прорачуни стопа рекомбинације и ЛД између СНП-а и уобичајених маркера аутизма идентификовали су укупно 1426 гена у року од 25 цМ од маркера. Од тога, 697 гена који кодирају протеине налазили су се унутар 5 цМ, 450 између 5 и 10 цМ и 212 између 10 и 15 цМ из најближег локуса за аутизам (слика 2). И брзина рекомбинације и генска густина увелике су варирале међу маркерима аутизма (28, 1 ± 7, 3 цМ у региону 20-Мб око маркера, обухваћајући 35, 4 ± 10, 4 гена). Дошло је до снажне корелације (рхо = 0, 7) између величине генетске мапе и удела гена на удаљеностима> 10 цМ. Највећа густина гена била је око РФВД2 и ПАППА2 на хромосому 1, у региону придруженом варијацији броја-броја, који кодира 60 гена у року од 24 цМ. Четрдесет осам и 90% гена пало је унутар 5 и 10 цМ, што указује на то да је ЛД добро очувана са повећањем удаљености од локуса аутизма. Супротно томе, подручје око уобичајених варијација броја копија у близини УНК3037 на хромозому 3 садржавало је 73% гена на удаљености већој од> 10 цМ.

Image

Број гена унутар 20 цМ значајних маркера аутизма. Генетске удаљености израчунате су коришћењем само-мукутичких полиморфизама са аутизмом (АГРЕ) са само мушким родом (СНПс). 11 Гени су груписани у канте за удаљеност од три раздаљине што указује на степен рекомбинације са марком аутизма. Слика приказује број гена у уској вези с маркером, а самим тим и опсег рекомбинације око сваког локуса.

Слика пуне величине

Претходни резултати показују да садржај информација варира у зависности од маркера и генетске удаљености, али не показују директно да ли су ове информације релевантне за наше разумевање генетске етиологије аутизма. Да бисмо директно тестирали да ли одређени маркери и / или региони који окружују ове маркере имају већу вјероватноћу да садрже нове обећавајуће генске одводе, испитали смо регулаторне обрасце сваког ЛДС скупа независно у два скупа података експресије добијених из Омнибус гена за експресију: крвни гласник Подаци о експресији РНА код појединаца са аутизмом и контролама (ГСЕ6575) 28 и транскриптомском анализом постмортемске РНА мозга (ГСЕ28521). У скупу података о експресији заснованој на крви, иако велика већина није показала промену у експресији, 27 маркер региона (40%) је садржавало најмање један ген са значајном, вишеструком тест-корекцијом диференцијалне експресије (Табела 2). Више од 50% гена око маркера на 3п26 (дел ЦНТН4, дел УНК3037), 3к (Д3С3045 – Д3С1763), 2к (рс17420138) и 5п (рс10513025) диференцирано је у целој крви од појединаца са АСД. Свеукупно је 79 гена значајно обогаћено за к <0, 05 у свим маркер сетима од којих 31 (39%) и 60 (76%) ген лежи унутар 5 и 10 цМ од најближег маркера аутизма, што додатно подржава идеју. да гени проксимални према маркерима представљају више одрживих водика гена од аутизма него гена даље.

Табела пуне величине

У подацима постмортемских ткива мозга било је обиље сигнала у 64 од 67 скупова ЛДС, који су садржавали најмање један ген на к- вредности 50% гена различито изражених у најмање једној регији мозга између појединаца са АСД и подударним контролама на к - праг вредности 0, 05 Од 383 гена који показују разлике у експресији при к <0, 05, 205 (53%) и 323 (84%) леже унутар 5 и 10 цМ од најближег маркера аутизма, респективно.

Откривено је да су четири маркера смјештена у кварту различито изражених гена и у мозгу и у крви појединаца са АСД-ом. Најмање 50% протеина који кодирају протеине око рс10513025, Д3С3045 – Д3С1763, дел ЦНТН4 и дел УНК3037 су различито експримирани у оба ткива (Табела 2). Три од ових региона, 20 Мб око делта ЦНТН4, дел УНК3037 и рс10513025, показују тешку рекомбинацију и садрже 73%, 68% и 47% гена, при> 10 цМ. Упркос значајној рекомбинацији у региону, гени значајно обогаћени за различиту експресију у оба скупа података били су они који су ближи маркеру аутизма. Од 30 гена за које је откривено да се значајно разликују у крви и мозгу појединаца са АСД-ом, 11 и 20 били су унутар 5 и 10 цМ најближег маркера аутизма, респективно.

Интегришући деценију проучавања повезаности и удруживања у геному, мушка пристрасност АСД-а и диференцијална експресија у мозгу и крви појединаца са АСД-ом идентификовала је скуп од 30 главних кандидата за будуће експериментирање, попут ефикасног циљаног ресекционирања у веома великим кохортама . 36 Од њих су ЦАДПС2, ЦНТН4, НТРК3, СЛЦ9А9 и СУМФ1 претходно укључени у АСД. Остали различито експримирани гени унутар 20 цМ-ова специфичних маркера аутизма умешани су у поремећаје са заједничким симптомима и обрасцима морбидитета, али још увек нису умешани у АСД (Табела 3).

Табела пуне величине

Дискусија

Упркос великој наследности аутизма, напори да се идентификују његови генетски узроци уживали су само ограничен успех. Идентификовани су бројни локуси осетљивости, али је мало њих поновљено, што потврђује тврдњу да генетска сложеност овог поремећаја надмашује део популације са аутизмом који је до сада узоркован. Све док узорковање не покрива на одговарајући начин разноликост генетских система који су у основи АСД-а, морамо развити аналитичке приступе како бисмо оптимално искористили постојеће резултате. У том циљу смо се овде фокусирали на развој једноставне стратегије усмерене на циљање раније објављених маркера аутизма, као и на гене који су генетски проксимални за те маркере и који ће највероватније бити узрочно повезани са АСД. Спајањем структуре ЛД са знањем о биолошком процесу и обрасцима података о експресији гена код појединаца са АСД, успели смо да идентификујемо сет маркера и гена који су блиски тим маркерима који су најинформативнији за генетску основу аутизма. Специфични локуси на неколико хромозома, укључујући три сигнала на хромосому 3 и један на хромосому 5, дали су највећи сигнал, са знатним процентом суседних гена који показују изразито значајну диференцирану експресију у подацима крви и мозга код особа са аутизмом. У прилог њиховој важности за генетику аутизма, многи различито изражени гени уско повезани са маркерима већ су идентификовани као перспективни кандидати за ген за аутизам, као што су ЦНТН4, ЦАДПС2, СУМФ1, НТРК3 и СЛЦ9А9. Поред тога, још већи проценат ових гена повезан је са неуролошким болестима високе коморбидности и сличности у понашању са АСД.

Све у свему, наша стратегија пружа средство за метаанализу претходних студија веза и повезаности како би се приоритетно доделио маркерима и суседним генима за даљу експерименталну анализу. Иако наши резултати потврђују опште правило да су гени блиски локусима идентификованим путем студија веза и повезивања вероватно информативни за испитивану болест, они наглашавају да се ово правило односи само на одређене маркере. С обзиром на успех примене у пољу истраживања о аутизму, очекујемо да би наша аналитичка стратегија могла бити од опште користи у истраживању других сличних сложених генетских болести, попут Алзхеимерове болести и дијабетеса типа 1.