Журналистам продемонстрировали уникальную для России технологию. Разработанный в Петербурге программно-аппаратный комплекс позволяет в режиме реального времени готовить субтитры для телевизионных и интернет-трансляций.
В первую очередь, это дает возможность людям с проблемами слуха полноценно воспринимать наиболее оперативную информацию: экстренные новости или, например, спортивные трансляции. Полноценную проверку технология выдержала как раз во время Паралимпиады.
Созданный программно-аппаратный комплекс может распознавать человеческую речь со скоростью 0,16 секунды. Фактически это мгновение. А значит люди с проблемами слуха могут смотреть программы в прямом эфире с субтитрами, которые при этом заранее никто не готовил.
Если в новостях и программах, выходящих в записи, субтитры готовит целый штат редакторов, то прямые трансляции спортивных состязаний, даже самые масштабные, для людей с проблемами слуха — картинка да и только.
Теперь же петербургская технология позволяет прочитать ту, информацию, которую озвучивает комментатор. Позиции спортсменов, накал борьбы и даже некие эмоции становятся доступны.
У Анны — редкая пока что работа. Она — респикер. Синхронно повторяет то, что говорит комментатор, но исключает из речи ошибки, оговорки и всякие междометия. На небольшой клавиатуре респикер также ставит знаки препинания. Программно-аппаратный комплекс распознает речь Анны, переводя ее в письменный текст.
Рядом правильность проверяет редактор Игорь, который если что успеет моментально исправить какое-нибудь слово. При этом даже телеканалы и интернет-вещатели тем более имеют небольшую технологическую задержку. Так что 2 с небольшим секунды, на которые отстают Анна с Игорем от реального комментатора, для зрителя практически незаметны.
Сейчас кто-то разочарованно вздохнул: ну какая же это технология, от человеческого фактора все равно не избавились. Тем не менее, для передач в записи эта методика требует в пять раз меньше людей. Для создания субтитров часовой передачи обычно нужно 10 человеко-часов. Здесь — только два. А о прямом эфире без подготовленных заранее текстов до этого и речи не было.
Кирилл Левин, директор Научно-исследовательского департамента Центра речевых технологий: «Людей, способных со скоростью речи набирать текст, нет. Потому что максимум, что тот же Игорь может выдержать с темпом 600–800 знаков в минуту, это от силы минут пять. Естественно ни о каком практическом использовании речи нет».
Пока технология проходит обкатку на одном из спортивных интернет-каналов. Однако вскоре она получит распространение, ведь научно-исследовательская и опытно-конструкторская разработка была выполнена в том числе и на государственные средства в рамках программы «Доступная среда». Да и зрители Паралимпиады с проблемами слуха оценили возможность видеть комментарии.
Корреспондент НТВ Алексей Чеботарёв — о новом слове в распознавании даже самой быстрой речи.