2022
, Q1
Article
IEEE/ACM Transactions on Computational Biology and Bioinformatics
Zhang Q., Zhang Y., Wang S., Chen Z.H., Gribova V.V., Filaretov V.F., Huang D.S. Predicting in-vitro DNA protein binding with a spatially aligned fusion of sequence and shape // IEEE/ACM Transactions on Computational Biology and Bioinformatics. 2022. Vol. 19, no. 6. Pp. 3144–3153. ISSN 1545-5963. DOI: 10.1109/TCBB.2021.3133869.
Открытие сайтов связывания факторов транскрипции (TFBSS) имеет первостепенное значение для понимания механизма связывания и процесса регуляции генов. Все больше доказательств указывает на то, что помимо первичных последовательностей ДНК, ландшафт формы ДНК оказывает значительное влияние на предпочтительность связывания факторов транскрипции. Чтобы эффективно моделировать совместное влияние элементов последовательности и формы, мы подчеркиваем важность информации о местоположении последовательности и шаблона формы. В этой статье мы предлагаем новую архитектуру, основанную на глубоком обучении, под названием Hybridshape eDeepCNN, для прогнозирования TFBS, которая объединяет информацию о последовательности ДНК и форме в пространственно выровненном виде. Наша модель использует возможности многослойной сверточной нейронной сети и создает независимую подсеть для адаптации к различному распределению данных разнородных объектов. Кроме того, мы исследуем использование векторов непрерывного встраивания в качестве представления последовательностей ДНК. Основываясь на экспериментах с 20 наборами данных in vitro, полученными из универсальных микрочипов, связывающих белки (UPBMS), мы демонстрируем превосходство предложенного нами метода и подтверждаем лежащую в его основе логику проектирования.