Труды КНЦ вып.12 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ вып. 5/2021(12))

3 Institute o f Problems in Mechanical Engineering o f the Russian Academy of Sciences, Saint Petersburg 1 dvdt.slt@gmail.com, https://orcid.org/0000-0003-1404-0372 2 fridman@iimm.ruM, https://orcid.org/0000-0003-2408-6892 3 ba-kulik@yandex.ru, https://orcid.org/0000-0001-6193-5588 Abstract System analysis of the problem of modeling a natural language (NL) made it possible to formulate the root cause of the low efficiency of modern means for accumulating and processing knowledge in such languages. This is the complexity of intellectualization for such tools, which are created on the basis of primitive artificial programming languages that practically represent a subset of flectional analytical languages or artificial constructions based on them. To reduce the severity of the identified problem, it is proposed to build NL modeling systems on the basis of technological tools for verbalization and recognition of sense. These tools consist of semiotic models of NL lexical and grammatical means. This approach seems to be especially promising for agglutinative languages; it is supposed to be implemented on the example of the Tatar language. Keywords: natural language modeling, verbalization and recognition of sense, semiotic model of lexical and grammatical means of a language, n-tuple algebra Funding The article was supported by the federal budget to carry out the state task of the FRC KSC RAS No. 0226-2019-0036. The study was partially supported by RFBR, project number 19-08- 00079-а. For citation: Suleimanov J. Sh., Fridman A. Ya., Gilmullin R. A., Kulik B. A. System analysis of the natural language modeling problem // Transactions of the Kola Science Centre. Information technologies. Series 12. 2021. Vol. 12, no. 5. P. 57-66. http://dx/doi.org/ 10.37614/2307-5252.2021.5.12.005. Введение В исследовании естественных языков можно выделить три аспекта: когнитивный, коммуникативный и технологический [1]. Когнитивный аспект - это характеристика ЕЯ с точки зрения возможностей описания модели мира, представления знаний. Коммуникативный аспект отражает потенциал языка для кодирования, приема и передачи, семиотической обработки информации, организации диалога. Технологический аспект определяет формальный и концептуальный потенциал ЕЯ для реализации средств эффективной обработки, адекватного описания и компактного хранения информации на данном языке, а также для разработки интеллектуального программного инструментария, включая операционные системы. На наш взгляд, современные средства накопления и обработки знаний на естественном языке малоэффективны и практически не справляются с такими задачами, как поиск и отбор информации в распределенных базах данных, извлечение знаний, семантический анализ текстовой информации, прежде всего потому, что они изначально являются неинтеллектуальными, созданы на основе примитивных искусственных языков программирования, представляющих собой подмножество флективно-аналитических языков или искусственных конструкций, созданных на их основе. Еще одна причина сложностей в системах обработки ЕЯ связана с организацией их моделей, строящихся на основе формальных систем, в частности, порождающих грамматик (например, [2]), что создает две принципиальные проблемы: монотонность результатов логического вывода и пассивность инструментов логико-семантического анализа информации. Такая 58

RkJQdWJsaXNoZXIy MTUzNzYz