Abstract and keywords
Abstract (English):
To achieve success in figure skating, hard work and effective interaction with the coach are important. In practice, the coach often fails to monitor the quantity and quality of the elements performed by young athletes in training. As a result, the aim of the work is to develop a neural network "NeuroSkate" designed to analyze the movements of child athletes in figure skating training. The work is being carried out in collaboration with the Orlyonok Olympic Reserve School in Perm, which acted as the main data provider for the study. The dataset includes a video of the performance of six key elements in figure skating by young athletes. The "NeuroSkate" architecture is a cascade of several architectures, each of which performs its own subtask: detection, allocation of key points and action classification. In the pairwise classification of performed elements, the proportion of a correctly defined class in the test sample of "NeuroSkate" is on average 72%.

Keywords:
action recognition, computer vision, artificial intelligence, figure skating, YOLOv8, LSTM
Text

Введение. Фигурное катание сочетает в себе эстетическую привлекательность и техническую сложность. Это помогает развивать физические и психоэмоциональные навыки детей, такие как сила, координация, гибкость, самодисциплина и уверенность в себе. Для достижения успеха в этом виде спорта важны упорный труд и эффективное взаимодействие с тренером.

Однако в групповых тренировках тренер не всегда может уделить внимание каждому ребенку, что влияет на мотивацию и результаты. В качестве решения предлагается использование технологий, в частности, искусственного интеллекта. Разработка нейросети, которая будет отслеживать выполнение элементов фигуристами, поможет тренерам получать точную информацию о качестве выполнения упражнений на тренировке, что позволит улучшить тренировочный процесс и повысить его эффективность.

Объектом исследования является разработка нейросети NeuroSkate, предназначенной для анализа движений детей-спортсменов на тренировках по фигурному катанию. Работа выполняется в сотрудничестве с школой олимпийского резерва «Орленок» в городе Перми, которая выступила основным поставщиком данных для исследования.

Цели и задачи. Цель работы заключается в создании инструмента, который способен автоматически детектировать юных фигуристов и оценивать выполнение базовых элементов тренировочной программы.

В качестве основных задач исследования, были выделены следующие:

         Разработать нейросетевое решение для идентификации конкретного спортсмена в кадре;

         Разработать нейросетевую архитектуру для отслеживания движений юных спортсменов и определения элементов фигурного катания;

         Протестировать полученную нейросеть на видеозаписях реальных тренировок по фигурному катанию.

Методы исследования. Методология включает сбор и разметку видеоданных для эффективного распознавания и классификации движений с использованием современных архитектур нейросетей. В результате работы была создана модель, демонстрирующая высокую точность на видеоданных, собранных во время реальных тренировок. Насколько известно авторам, сбор и анализ данных, акцентированный именно на юных спортсменах, занимающихся фигурным катанием, был произведен впервые.

Авторы сконцентрировались в первую очередь на тех элементах, которые с одной стороны, доступны детям для выполнения, в другой стороны — представляют определенный интерес для анализа с точки зрения их учета в спортивных соревнованиях. В число таких элементов вошли: лутц, риттбергер, флип, бильман, кораблик и вертикальное вращение.

На данный момент разработка ИИ-решений для распознавания действий на видео осложнена тем, что создано критически мало открытых наборов данных для обучения нейросетей, существующие датасеты содержат в основном записи взрослых спортсменов [1, 2], что не подходит для поставленной задачи. Авторами работы был самостоятельно собран датасет, включающий в себя как видео из открытых источников (https://бильман.рф/, https://vk.com/iceclubperm, записи с соревнований на YouTube), так и авторские видеосъемки юных спортсменов во время тренировочного процесса в «Орленке». Итого в собранной выборке оказалось 172 видео, включающих один из шести перечисленных элементов.

Задача детекции решается в один этап с помощью архитектуры YOLOv8[3], задача распознавания движений решается в два этапа. На первом происходит выделение ключевых точек спортсмена с помощью YOLOv8, на втором происходит классификация с помощью архитектуры LSTM[4].

Основные результаты. Качество работы детекции юных фигуристов по метрике mAP составило 0.837, качество обнаружения ключевых точек по метрике mAP составило 0.894, качество попарной бинарной классификации движений в среднем составило 0.72 по метрике доли верно определенного класса. Выбор бинарной классификации связан с небольшим объемом обучающей выборки.

Для улучшения качества работы модели и перехода к мультиклассовой классификации, по мнению авторов, необходима доработка обучающего датасета, с увеличением количества примеров по каждому из классов как минимум в 5 раз. 

 

References

1. Papers with Code. FR-FS Dataset [Electronic resource]. URL: https://paperswithcode.com/dataset/fr-fs (accessed: 10/30/2024).

2. Liu, S. Motion-Centered Figure Skating Dataset [Electronic resource]. URL: https://shenglanliu.github.io/mcfs-dataset / (accessed: 10/30/2024).

3. Joker, G., I, J., Chaurasia, A. Ultralytics YOLO (version 8.0) [Computer Software]. URL: https://github.com/ultralytics/ultralytics (accessed: 10/30/2024).

4. Hochreiter S. Long Short-term Memory //Neural Computing MIT-Press. – 1997.

Login or Create
* Forgot password?