Искусственный интеллект обучили «читать» русскую пропись - Информационный портал

Искусственный интеллект обучили «читать» русскую пропись

21 Июля 2022

Искусственный интеллект обучили «читать» русскую пропись

Российские исследователи искусственного интеллекта разработали новую сверточную нейросеть (CNN), способную распознавать изображения рукописных букв русского алфавита с точностью 99%. Работа выполнена специалистами подведомственных Минобрнауки России Сибирского федерального университета (СФУ) и Санкт-Петербургского государственного электротехнического университета «ЛЭТИ».

Разработка с высокой точностью распознает текст, написанный кириллицей от руки, независимо от почерка, что само по себе трудно даже для человека. Кроме того, приложение, созданное под эту нейросеть, защищено от утечки информации, не требует подключения к Интернету и надежно с точки зрения конфиденциальности и безопасности пользователя.

«С развитием IT-технологий растет важность быстрого и качественного преобразования рукописного текста в цифровую печатную версию, чтобы было удобнее копировать, редактировать или извлекать из него данные. Целью нашего исследования было распознавание рукописного текста на русском языке нейросетью с использованием моделей глубокого обучения (DL). Насколько нам известно, это первая в мире работа такого рода», — отметил соавтор исследования, студент Института информационных и космических технологий СФУ Андрей Левков.

Обучение нейросети проводилось с помощью предварительно обработанных данных хранилища CoMNIST — это известная база данных, содержащая образцы рукописного написания букв на латинице и кириллице. Сначала ученые построили новый набор данных с помеченным изображением для 33 букв российского алфавита. Затем разработали новую архитектуру CNN для обнаружения рукописных букв российского алфавита и сравнили ее с уже существующими мощными моделями CNN. После этого представили полное описание сверточной нейросети и исходного кода, чтобы другие исследователи могли воспроизвести эти данные. Для программирования был выбран язык Python и интерактивная среда разработки Jupyter.

Набор данных для анализа содержал 13299 фотографий, на которых зафиксированы прописные, печатные и написанные курсивом буквы

«Набор данных содержит 13299 фотографий, на которых зафиксированы прописные, печатные и написанные курсивом буквы. Приблизительно на 85% этих снимков нейронная сеть (CNN) училась распознавать буквы русского алфавита, а ещё на 15% шла проверка усвоенных «знаний». Мы сравнили разработанную нашим коллективом модель с наиболее мощными моделями CNN, например, с VGG-16, VGG-19 и другими. Оказалось, что точность нашей модели во время обучения составляла до 99%, всё обучение заняло 3 часа. Точность прогнозирования модели составила до 95,83%», — рассказала руководитель исследования, доцент кафедры систем искусственного интеллекта СФУ Анастасия Сафонова.

В итоге удалось зарегистрировать уникальную программу ЭВМ, правообладателем которой выступает СФУ.

В дальнейшем эксперты планируют обучить модель «читать» целые слова и предложения, а также освоить различные стили письма.
Короткая ссылка на новость: https://www.nstar-spb.ru/~2HCy5


Газета «Санкт-Петербургский вестник высшей школы»

Санкт-Петербургский вестник высшей школы

музыкальный вестник


 

Информационное агентство  Северная Звезда

С 01.12.2021 19:10:00 по 10.12.2022 20:10:00 «Вне истеблишмента»
С 19.05.2022 19:10:00 по 04.10.2022 20:10:00 «Первые биографы Блока. Мария Бекетова» и «Первые биографы Блока. Корней Чуковский»
С 19.05.2022 20:50:00 по 04.09.2022 21:50:00 «Вигилиус Эриксен – портретист императрицы. К 300-летию со дня рождения»
С 27.05.2022 22:50:00 по 23.10.2022 23:50:00 «Люблю тебя, Петра творенье…»
С 08.06.2022 13:30:00 по 25.08.2022 14:30:00 Именем Петра
С 16.06.2022 13:30:00 по 13.09.2022 14:30:00 «Русское лоскутное шитье»
С 16.06.2022 14:50:00 по 13.09.2022 15:50:00 «Русское лоскутное шитье»