При перепечатке материалов просим публиковать ссылку на портал Finversia.ru с указанием гиперссылки.
О прорывном подходе, когда для голосового распознавания начали использовать нейросетевые технологии, в интервью Finversia.ru рассказал генеральный директор компании BSS Георгий Кравченко. По его словам, голосовые технологии развиваются уже больше 20-ти лет, но реальный прорыв произошел около 10 лет назад, когда для голосового распознавания начали использовать нейросетевые технологии. До этого технологии речевой аналитики развивались обособленно, в разных RnD-коллективах, в разных компаниях, этот процесс был чрезвычайно наукоемким, требовались сложные математические решения.
«Первые эксперименты и научные работы, доказывающие или предполагающие возможность более эффективной работы на нейросетях, породили сразу несколько революционных вещей. Выяснилось, что технология на нейросетях работает гораздо эффективнее – резко снизились требования к инфраструктуре и минимум на два порядка увеличился объем словаря – от 100 слов до 10 тысяч. Сейчас голосовые помощники Яндекса и Google в состоянии поддерживать гораздо больший объем, я даже не могу сказать, какой, думаю, значительно больше 100 тысяч слов. А все вместе это позволило использовать онлайн-распознавание для свободной речи», - рассказал Георгий Кравченко.
Согласно экспертной оценке, емкости словаря на нынешнем уровне развития технологий достаточно для поддержания практически любого разговора.
«В России, на мой взгляд, драйвером развития речевых технологий стали крупные банки, давно оценившие пользу цифровых технологий», - отметил гендиректор BSS.
обсуждение