ИАПУ ДВО РАН

Chomsky Was (Almost) Right: Ontology-Based Parsing of Texts of a Narrow Domain


2021

Communications in Computer and Information Science, Scopus

Article

Communications in Computer and Information Science

Springer, Cham

Geltser B. et al. (2021) Chomsky Was (Almost) Right: Ontology-Based Parsing of Texts of a Narrow Domain. In: Kravets A.G., Shcherbakov M., Parygin D., Groumpos P.P. (eds) Creativity in Intelligent Technologies and Data Science. CIT&DS 2021. Communications in Computer and Information Science, vol 1448. Springer, Cham. https://doi.org/10.1007/978-3-030-87034-8_7.

Общий подход к анализу естественных текстов подразумевает, что семантический анализ должен следовать за этапом синтаксического анализа. Однако медицинские тексты известны как очень сложные и написанные на очень специфическом языке. Традиционные парсеры демонстрируют здесь относительно небольшую производительность. В этой статье мы демонстрируем противоположный подход: онтологическое влечение слов в сочетании с простыми правилами поверхностного синтаксического анализа. Это позволяет нам увеличить показатели UAS с 0,82 для SpaCy до 0,834 для нашего подхода.

10.1007/978-3-030-87034-8_7

https://doi.org/10.1007/978-3-030-87034-8_7