Север и рынок. 2023, № 2.
СЕВЕР И РЫНОК: формирование экономического порядка. 2023. № 2. С. 55-73. Sever i rynok: formirovanie ekonomicheskogo poryadka [The North and the Market: Forming the Economic Order], 2023, no. 2, pp. 55-73. РАЗВИТИЕ ПРОМЫШЛЕННЫХ СЕКТОРОВ И РЫНКОВ ПРОДУКЦИИ В РЕГИОНАХ СЕВЕРА И АРКТИКИ инструментов сбора, обработки и анализа данных «Квибрум» и PolyAnalyst использование моделей, построенных на базе статистического анализа; 3) искусственные нейронные сети (автоматическая проверка грамматики, орфографии, работа со словарями); 4) пространственный анализ за счет использования топологической и географической информации в данных; 5) статистический анализ; 6) визуализация аналитических данных (представление результатов анализа в виде пространственных таблиц и графов). Для сбора и обработки больших данных использованы программно-аппаратный комплекс «Крибрум» ( https://kribrum.ru/technology) и российская платформа класса DSML (Data Science & Machine Learning) PolyAnalyst, которая включает «инструменты по сбору и агрегации данных, их анализу, формированию отчетности и интерактивной визуализации результатов на основе технологий BI» [57]. Использование данных технологических платформ, которые выполняют сплошную выборку по заданным критериям поиска в сети Интернет с последующей их обработкой на основе статистических моделей [58], обеспечивает репрезентативность выборки. Е. Ю. Петров и А. Ю. Саркисова подчеркивают, что в сфере социально-экономических исследований платформа PolyAnalyst чаще используется в прикладных проектах, так как для задействования ее в научных исследованиях требуется адаптация методологии под конкретные научные задачи [59], что повышает трудоемкость данного анализа и требует дополнительных компетенций у исследователей. Соответственно, научная новизна нашего исследования заключается в адаптации решений PolyAnalyst к задачам конкретной научной области (анализ рынка оленеводства) и совершенствовании методологии анализа. Процессы сбора, обработки и последующего анализа данных включают этапы, представленные на рис. 1. СБОР МАССИВОВ БОЛЬШИХ ДАННЫХ -Постановка задачи исследования •Выбор методов и инструментов для сбора, обработки и анализа данных •Определение типа и источников данных -Первичное моделирование типовой ситуации (идентификация лингвистических маркеров для поиска) •Автоматизированный сбор и систематизация информации из текстовых данных социальных сетей с помощью программно-аппаратного комплекса «Крибрум» (121 459 сообщений сообществ) ОБРАБОТКА БОЛЬШИХ ДАННЫХ -Анализ неструктурированных текстовых данных с помощью платформы визуальной разработки сценариев анализа данных и текстов “PolyAnalyst” -Повторное моделирование типовой ситуации и фильтрация выборки текстов -Применение методов классификации текстов, пространственного анализа на основе анализа связанности сущностей (географические локации), метода извлечения ключевых слов с последующей визуализацией и построением графов ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ АВТОМАТИЗИРОВАННОГО АНАЛИЗА БОЛЬШИХ ДАННЫХ Рис. 1. Процесс сбора, обработки и анализа массивов больших данных применительно к научной задаче исследования Автоматизированный сбор и систематизация информации из текстовых данных социальных сетей был произведен программно-аппаратным комплексом «Крибрум» (https://kribrum.ru/technology) . Для формирования поискового запроса применен метод моделирования типовой ситуации, построенной с опорой на цели, поставленные на начальном этапе работы, и с учетом заданных слов, являющихся лингвистическими маркерами и отражающих сущностные стороны исследуемых экономических отношений «купля/продажа продукции оленеводства». Моделирование ситуации включало два этапа: первичный (до начала сбора данных) и повторный (после сбора и первичной автоматизированной © Богданова Е. Н., Иванова М. В., Симашко Т. В., 2023 59
Made with FlippingBook
RkJQdWJsaXNoZXIy MTUzNzYz