A Bioinformatika 2024 konferenciára itt tud jelentkezni.
Letölthető program pdf formátumban
Helyszín: Természettudományi Kutatóközpont, 1117 Budapest Magyar Tudósok krt 2. Földszint nagyteremA SARS-CoV-2 genomjának folyamatosan növekvő számú mutációja miatt aggályok merültek fel a SARS-CoV-2 diagnosztikájának „arany standardja”, a reverz transzkripciós-polimeráz láncreakciónak (RT-PCR) megbízhatóságával kapcsolatban. Kidolgoztunk egy olyan bioinformatikai vizsgálati módszert, amely a WHO által javasolt vagy a tudományos közösség által publikált, nyilvánosan elérhető PCR-tesztek célrégióival átfedő genomi változásokat tárja fel, kifejezetten a PCR tesztek hatékonyságára gyakorolt hatásuk alapján.
Nemzetközi együttműködésben, a VEO (Versatile emerging infectious disease observatory) projekt keretében több, mint 1,2 millió SARS-CoV-2 szekvenciában vizsgáltuk a célrégiókban előforduló mutációkat. Megközelítésünk különbséget tesz a PCR-hatékonyságot esetlegesen károsan befolyásoló és az ilyen értelemben várhatóan semleges mutációk között. A mintákat a jelen lévő mutációk becsült hatása alapján a "téves besorolásra hajlamos" és a "valószínűleg helyesen detektálható" kategóriákba soroljuk egy adott PCR-primer készlettel.
A téves besorolásra hajlamos minták általában napi 2%-os vagy annál alacsonyabb arányban vannak jelen, bár úgy tűnik, hogy bizonyos primer-készletek az Omicron vírustörzs kimutatásában gyengébb teljesítményt nyújtanak. Mivel a SARS-CoV-2 víruspopulációban világszerte átmenetileg különböző variáns törzsek válhatnak dominánssá, egy adott PCR-primer készlet hatékonysága idővel változhat, ezért a primerek célrégióiban található mutációk folyamatos nyomon követése erősen ajánlott.
Számos tanulmány bizonyította, hogy a COVID-19 kimenetele és a betegségre való fogékonyság statisztikailag összefügg különböző társbetegségekkel, a beteg korával és közvetlenül vagy közvetve a vírus genomjában szereplő mutációkkal.
Munkánk során fejlesztettünk egy mutáció azonosító pipeline-t, valamint gépi tanulás segítségével egy olyan eszközt, ami a betegség kimenetelét képes előre jelezni a genom mintából és a beteg életkorából. A genom mintához — abban eredetileg nem, de a tanulóhalmazban szereplő — mutációkat adva, képesek vagyunk előre jelezni, új potenciális variánsok által okozott betegség kimenetelét.
A GISAID adatbázisából letöltött genom mintákon és a metaadatokon (pl. betegség kimenetele, életkor, ország, mintavétel időpontja) végzett alapos adattisztítás után, 97 ezer mintát dolgoztunk fel, melyekben 1122 gyakori mutációt azonosítottunk.
A végső tanítóhalmaz létrehozásához az adatokat stratifikáltuk a mintavétel időpontjára és országára. A feature halmazban a mutációk mellett a beteg életkora is szerepel. A végső modellt így 2680 enyhe, és 2680 súlyos lefolyású betegséget okozó minta alapján tanítottuk a JADBIO automatikus gépi tanuló eszköz segítségével. A modell előre jelző teljesítménye: ROC AUC 0.855 [0.811, 0.896].
A modell által kiválasztott featureök elemzése során, olyan mutációkat találtunk, melyek összefüggenek a súlyos lefolyással (pl.: NS3a P42L és Q57H, NSP4 A446V, NS8 T11I, NS10 V30L). Ezen mutációkat az omikron variánshoz adva a betegség súlyos lefolyásának predikált értéke 1,6-szorosára nőtt.