Труды КНЦ (Технические науки) 2/2022(13).
Труды Кольского научного центра РАН. Серия: Технические науки. 2022. Т. 13, № 2. С. 31-45. Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2022. Vol. 13, No. 2. P. 31-45. Рис. 8. Схема извлечения биомедицинских концептов и отношений на основе многозадачного обучения Гибридные методы. Аналогично методам извлечения концептов, гибридные методы извлечения отношений используют различные комбинации других методов для повышения производительности или преодоления каких-либо проблем, в частности, связанных с недостатком языковых ресурсов. Например, в работе [46] представлен гибридный подход, комбинирующий МО и правила, для извлечения отношений между героями рассказов. Предлагаемая авторами система (рис. 9.) начинает работу с предобработки текста (удаление специальных символов, токенезация, разметка частей речи), распознавания именованных сущностей (имен персонажей, организаций и локаций) и разрешения анафоры. Затем система трансформирует обрабатываемый текст в набор предложений и выбирает те, которые содержат определенные пары персонажей (полагаясь на набор распознанных ранее именованных сущностей). Рис. 9. Схема предлагаемого авторами гибридного метода [46] Дальше отобранные предложения классифицируются на заранее определенные авторами классы с помощью байесовского классификатора, обученного на авторском датасете и состоящего из предложений, их классов и рейтингов. Обученный классификатор присваивает каждому предложению в наборе (для выбранных пар персонажей) определенный класс и рейтинг. Если больше половины предложений относятся к одному и тому же классу, то считается, что выбранная пара персонажей находится в отношении соответствующего класса. Если же классифицировать отношение © Пимешков В. К., Шишаев М. Г., 2022 40
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz