Труды КНЦ вып. 11 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ) вып. 8/2020 (11)

• Разнообразие и сложность прикладных задач, требующих адекватной информационной поддержки. • Разнообразие категорий пользователей и используемых ими представлений о предметной области. • Более низкие требования к оперативности и точности по сравнению с промышленными системами (действия, в конечном итоге, контролируются человеком). Например, проблематика развития региональной системы образования затрагивает интересы таких категорий пользователей, как менеджмент и иные работники образовательных организаций, представители работодателей, социальные работники и другие. Представители каждой категории имеют отличное от других представление о предметной области. Таким образом, в контексте регионального управления возникает множество разнородных по существу задач информационной поддержки, имеющих, вместе с тем, территориальную привязку и, как следствие, взаимосвязанных по данным. Информационная система, обеспечивающая комплексное решение подобных задач, характеризуется разнородностью пользователей, информационных ресурсов и функциональных возможностей, а также изменчивостью компонентов (информационных баз, функциональных модулей, рабочих мест пользователей) и должна удовлетворять следующим требованиям: • Использовать в качестве информационной основы формализованные (машинно -обрабатываемые) знания. • Обеспечивать аккумуляцию и интеграцию данных для будущего использования. • Быть адаптируемой к изменениям представлений о предметной области и спектра прикладных задач, являющихся предметом информационной поддержки. Информационная база, представленная в виде формализованных знаний об охватываемых системой предметных областях, является ключевым компонентом системы. Поддержание ее в актуальном состоянии в условиях обозначенной выше динамичности является, таким образом, наиболее важной задачей обеспечения работоспособности МПИС. Одним из способов решения данной проблемы является автоматическое извлечение знаний из доступных внешних источников, в частности - текстов на естественном языке. В свою очередь, эффективным подходом к анализу естественно-языковых текстов является использование моделей и методов машинного обучения [1, 2]. В случае применения наиболее универсальных методов обучения с учителем, ключевой задачей при этом является формирование качественных наборов обучающих данных (обучающих выборок). Для ее решения в работах [3, 4] предложен специфический подход - слабо-контролируемое обучение (weak supervision), позволяющий использовать для формирования обучающих выборок неточные, противоречивые и неполные данные. В общем виде, процедура слабо­ контролируемого обучения включает следующие основные этапы: 1. Формирование маркировочных функций (МФ). 2. Разметка с их помощью исходного набора данных 172

RkJQdWJsaXNoZXIy MTUzNzYz