XVI международная научная конференция студентов и аспирантов «Проблемы арктического региона», Мурманск, 16 мая 2017 года : труды конференции / [ред.: Черняков С. М., Шаповалова Ю. А.]. - Мурманск : Полиграфист, 2017. - 212 с.

3. Осуществить взаимодействие с группой абитуриентов с целью сбора дополнительных данных по анкете. 4. Проанализировать полученные данные для выявления групп абитуриентов. 5. Интерпретировать полученные группы. Методы исследования: общенаучные (анализ и синтез), моделирование, метод главных компонент, метод кластеризации К-средних. В работе сделаны первые шаги в построении собственной профориентационной системы, а именно получен опыт использования современных информационных технологий для извлечения необходимой информации из открытых источников сети Интернет (на примере персональной страницы пользователя в социальной сети Вконтакте), а также автоматизации анкетирования и анализа ответов респондентов. Основная часть На первом этапе исследования для выявления степени готовности абитуриента обучаться по специальности (как уровня интереса к ней) проводилось сопоставление модели специальности и модели абитуриента. В качестве модели специальности выступил словарь специальности - список слов, с которыми она ассоциируется у абитуриента, а моделью абитуриента принята его персональная страница в социальной сети Вконтакте. Словарь специальности насчитывает 30 слов и создавался авторами без привлечения экспертов, так как в данной работе важно формирование технологии анализа данных, применимой для любой специальности, а не исчерпывающее содержание конкретного примера. Текстовый анализ проводился простейшим способом: подсчитывалось количество слов из словаря специальности с учётом повторов, которые встретились на странице абитуриента - чем больше слов, тем больше интерес абитуриента к специальности. Для автоматизации извлечения текста с Web-страницы профиля пользователя Вконтакте и сравнения со словарём был создан скрипт на языке Python в среде Jupyter. Язык Python был выбран по ряду причин: низкий порог вхождения для начинающего программиста и обширное сообщество специалистов, использующих его для извлечения и анализа данных. Ввод и вывод данных осуществлялся в режиме консоли с сохранением в текстовый файл. Первый этап проведённого исследования подтвердил эффективность использования языка Python для получения открытых данных сети Интернет на примере поиска слов в профиле социальной сети конкретного пользователя. На следующем этапе для сбора дополнительных сведений об абитуриенте была создана анкета. В ней респонденту предлагалось выставить ранги от 1 до 10 следующим действиям и интересам: ш М - изучение математики, • П - изучение программирования, ш И —изучение информационных технологий, т Т - техническое творчество, т Р - участие в исследовательских работах, • В - публичные выступления, т Н - интерес к новинкам техники и технологиям, • С - самообразование, ш Д - внимание к деталям, • К - доводить начатое дело до конца. Высокий ранг означает, что соответствующий пункт в большей степени характеризует интересы, знания, умения или навыки респондента. Ранги могут повторяться. На данном этапе исследования анкета была сформирована самостоятельно, как и словарь специальности (по уже упомянутым причинам). Анкета была размещена с использованием технологии GoogleForms, достоинствами которой является простота: как создания форм, так и заполнения. Важно, что эта технология позволяет сохранить результаты опроса в виде файла формата XLS. Целевую группу для Проблемы Арктического региона 7 4

RkJQdWJsaXNoZXIy MTUzNzYz