Már régóta ismert, hogy az eukarióta transzkripciós faktorok bizonyos szekvencia motívumokhoz kötődnek a DNS-hez. A transzkripciós faktorokhoz aztán más fehérjék, kofaktorok, represszorok, aktivátorok kapcsolódhatnak akár többszörösen is. Az újgenerációs szekvenálással egybekötött kromatin immunoprecipitáció (ChIP-seq) olyan kísérleti eljárás, amivel meg lehet határozni genom szinten, hogy hol kötődnek ezek a fehérjék a DNS-hez. A ChIP-seq adatok elemzése során csúcs (peak) régiókat határozunk meg. Ezeket tulajdonképpen azok a DNS darabok jellemzik, melyekhez a vizsgált fehérje kötődött. Az a pozíció a DNS-en ahol legtöbb ilyen fragmentet határoztunk meg (summit) az általános konszenzus szerint a DNS-hez kötődő, vagy ahhoz nagyon közel lévő fehérjemolekula által lefedett régió közepe.
A CTCF transzkripciós faktor és a hozzá kötődő kohezin fehérjék ChIP-seq eredményeit vizsgálva azt találtuk, hogy ezeknek a csúcspontjai a CTCF kötőhelyhez és egymáshoz képest meghatározott távolságban helyezkednek el. Hipotézisünk szerint ezek a távolságok az egyes fehérjemolekulák DNS-en való elhelyezkedését, topológiáját tükrözik. Ezek alapján egy új úgynevezett „double embrace” modellt állítottunk fel arra, hogy két CTCF-kohezin komplex hogyan alakít ki egy DNS hurkot.
A továbbiakban azt feltételeztük, hogy más transzkripciós faktoroknál, illetve transzkripciós faktor komplexeknél is fontos információkat nyerhetünk a ChIP-seq adatok elemzésével ezeknek a fehérjemolekuláknak a topológiájáról a DNS-en. Kifejlesztettünk egy pipeline-t, amivel 1626 reprezentatív transzkripciós faktor és 494 reprezentatív kofaktor humán ChIP-seq kísérletnél megállapítottuk, hogy az egyes kísérleteknél a csúcspont (summit) hogyan helyezkedik el a transzkripciós faktor kötőhelyekhez képest. Előzetes adataink szerint nem csak a CTCF-kohezin komplex, hanem sok más transzkripciós faktor és kofaktor esetében is ezek a vizsgálatok pontos információt szolgáltathatnak a transzkripciós faktor és kofaktor komplexek topológiájáról a DNS molekulán. Ez pedig lehetőséget ad, hogy jobban megértsük például azt, hogy a komplex kötőhelyeken hogyan működnek együtt a különböző fehérjemolekulák.
A későbbiekben azt tervezzük, hogy ezeket az eredményeinket egy ChIPsummitdb adatbázisba rendezzük és kereshetővé tesszük a weben keresztül. Az elemzéseket pedig kiterjesztjük az összes elérhető humán és egér ChIP-seq kísérletre, ami lehetővé teszi majd az evolúciós összehasonlításokat is.