Труды КНЦ вып.12 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ вып. 5/2021(12))

Результаты первого эксперимента говорят о наличии некоторого положительного эффекта обучения. Модель научилась распознавать в текстах некоторые контексты употребления понятий, характерных для предметной области. Однако этого недостаточно для обнаружения новых понятий, что показывают результаты второго эксперимента. Это также может быть вызвано тем, что исходная гипотеза о том, что имена экземпляров одного класса онтологии будут встречаться в одинаковых контекстах, подтверждается в большей степени для классов, потенциально имеющих большое разнообразие экземпляров в анализируемых текстах. Например, классы “Организация” или “Персона” потенциально могут иметь большое количество экземпляров в новостных текстах общей тематики. В контексте данного исследования это означает, что необходимо не только увеличить объем корпуса анализируемых текстов, но и обеспечить их более точный поиск и/или дополнительную фильтрацию по принадлежности к тематике онтологии. С другой стороны, причиной малых результатов поиска новых понятий может быть небольшое количество экземпляров у классов, что также не позволяет сформировать для обучения модели достаточное разнообразие контекстов для обнаружения новых понятий. Исходя из полученных результатов, в рамках дальнейшего исследования следует обеспечить увеличение объема обучающего набора и повысить разнообразие входящих в него примеров. Предложенная технология может применяться при повторном использовании онтологий для их актуализации и/или приведения их содержания в соответствие с задачами использующих их информационных систем. Высокая автоматизации технологии позволяет при этом снизить трудозатраты экспертов предметной области, обеспечивающих поддержку онтологий, и тем самым удешевить разработку и эксплуатацию информационных систем на основе онтологий. Список литературы 1. Studer R., Benjamins V. R., Fensel D. Knowledge engineering: principles and methods. Data Knowl Eng 25(1-2):161-197 // Data Knowl. Eng. 1998 Т. 25 С. 161­ 197. 2. Gruber T. R. A translation approach to portable ontology specifications // Knowl. Acquis. 1993 Т. 5 № 2 С. 199-220. 3. Somodevilla M., Ayala D., Pineda I. An overview on ontology learning tasks // Comput. Sist. 2018 Т. 22. 4. Chen J. и др. Smart data integration by goal driven ontology learning. 2017 С. 283­ 292. 5. Hwang C. Incompletely and Imprecisely Speaking: Using Dynamic Ontologies for Representing and Retrieving Information // 1999. 6. Navigli R., Velardi P. Semantic interpretation of terminological strings // 2002. 7. Berkhin P. Survey Of Clustering Data Mining Techniques // Surv. Clust. Data Min. Tech. Group. Multidimens. Data Recent Adv. Clust. 2002. Т. 10. 8. Zepeda-Mendoza M. L., Resendis-Antonio O. Hierarchical Agglomerative Clustering // Encyclopedia of Systems Biology / под ред. W. Dubitzky и др. New York, NY: Springer, 2013 С. 886-887. 9. Dhillon I. S., Mallela S., Kumar R. A Divisive Information-Theoretic Feature Clustering Algorithm for Text Classification // J Mach Learn Res. 2003. 169

RkJQdWJsaXNoZXIy MTUzNzYz