Apple в своем блоге Machine Learning Journal опубликовано новая статья, в которой рассказывается о нескольких интересных вещах о распознавании голоса и использовании Siri на динамике HomePod. В основном речь идет о том, как HomePod способен улавливать голосовые команды пользователя даже в нарушенных условиях эксплуатации, таких как очень громкое воспроизведение музыки, высокий уровень окружающего шума или большое расстояние пользователя от динамика.
В силу своей природы и направленности колонка HomePod должна иметь возможность работать в различных условиях. Некоторые пользователи ставят ее на тумбочку рядом с кроватью, другие «убирают» в углу гостиной или ставят колонку под громко играющий телевизор. Сценариев и возможностей действительно много, и инженерам Apple пришлось продумать их все при разработке технологии, которая позволяет HomePod «слышать» практически в любой ситуации.
Для того, чтобы HomePod мог регистрировать голосовые команды в не очень благоприятной среде, он имеет очень сложную систему приема и обработки звуковых сигналов. Процесс анализа входного сигнала состоит из нескольких уровней и механизма, работающего на основе алгоритмов самообучения, способного в достаточной степени фильтровать и анализировать входящий звуковой сигнал, чтобы HomePod получал только то, что ему нужно.
Отдельные уровни обработки таким образом, например, удаляют из принимаемого звука эхо, которое появляется в принимаемом сигнале из-за производства HomePod как такового. Другие позаботятся о шуме, которого в домашних условиях слишком много – включено. микроволновая печь, пылесос или, например, играющий телевизор. И последнее — об эхе, вызванном расположением помещения и положением, из которого пользователь произносит отдельные команды.
Apple подробно обсуждает вышеупомянутое в оригинальной статье. В ходе разработки HomePod тестировался в самых разных условиях и ситуациях, чтобы инженеры могли смоделировать как можно больше сценариев, в которых будет использоваться динамик. Кроме того, за многоканальную систему обработки звука отвечает сравнительно мощный процессор А8, который постоянно включен и постоянно «слушает» и ждет команды. Благодаря относительно сложным вычислениям и относительно приличной вычислительной мощности HomePod может работать практически в любых условиях. К сожалению, очень жаль, что высокопроизводительное оборудование сдерживается относительно несовершенным программным обеспечением (где бы мы ни слышали это раньше...), потому что помощник Siri год от года отстает от своих крупнейших конкурентов.