Мечтаете выучить иностранный язык? Тратите время и деньги на репетиторов? С этой новой технологией это вам ни к чему! Почти…
Все мы уже на нашем сайте сто раз обсуждали удивительные новые технологии и их силу. Что же, давайте поговорим на этот раз о нейросетях, которые заставят говорить вас на любом языке.
Как это работает?
Разработка компании HeyGen взорвала мозг пользователям интернета. Технология позволяет обрабатывать видео таким образом, чтобы спикер говорил на другом языке. Это не просто наложение субтитров или корявый перевод поверх голоса, нет. Нейросеть полностью имитирует ваш голос, темп и интонацию, и даже подстроит движения ваших губ под вашу речь. Более того, речь получается супер натуральной и нет глупых ошибок, как когда ты пытаешься перевести целые предложения в гугл транслейт.
По заявлениям разработчиков, нейросеть может справиться с 8 языками на «выход»: английским, испанским, итальянским, французским, немецким, польским, португальским и хинди. А вот на «вход» возможностей больше — есть еще дополнительно китайский, японский и нидерландский. Хотя с русским языком нейросеть тоже отлично справляется, несмотря на то, что он не представлен в списках.
Как им воспользоваться?
Переходим на сайт, регистрируемся или логинимся через гугл аккаунт. Затем загружаем нужное видео длительностью от 30 секунд до 1 минуты (требования к ролику: размер до 500 Мб, формат MP4, QTFF или WEBM). Выбираем язык, на который нужно перевести ролик. Дожидаемся обработки. Попадаем в виртуальную очередь. Если проценты прогресса обработки не двигаются, надо будет обновить страницу. Скачиваем результат.
Из-за большого спроса данного сервиса, длительность обработки может длиться до нескольких часов. Некоторые и вовсе утверждают, что ожидание у них занимает почти весь день.
Нюансики
Видео с несколькими спикерами — не конек данного сервиса. Когда в кадре появляется больше одного человека, все начинает рассыпаться. Поэтому видео должно быть снято на относительно «чистом» фоне, без посторонних лиц, в том числе и без фотографий или картин с людьми. Также, ничего не должно закрывать лица спикера, а также он должен смотреть прямо в камеру. Иначе у сервиса может сбиться генерация мимики.
Заключение
Нейросеть обалденная, генерация речи практически идеальная, если создать необходимые для технологии условия. Стоит ли при этом отказываться от изучения иностранных языков? Думаем, что нет. Ну, во всяком случае, сейчас об этом пока рано говорить. А вот ставит ли данная технология актеров дубляжа? Вполне вероятно. Если Heygen доработают кое-какие нюансы данной технологии, то возможно, что профессия актера дубляжа канет в лету.
Было бы здорово использовать эту технологию в целях сохранения якутского языка. Перевести популярные фильмы, сериалы и мультики на якутский язык, чтобы привлечь интерес молодого и подрастающего поколения. Как это, например, делают на НВК Саха, переводя мультики для самых маленьких.
Напишите в комментариях свое мнение о данной технологии и давайте обсудим это вместе!
Фото обложки: Alex Marinkovic