Корпоративный блог

Встроенная видеоаналитика: ближайшие перспективы


Дата публикации: 10.03.2010 16:08
Что специалисты называют встроенной видеоаналитикой? Каковы ее преимущества и недостатки по сравнению с традиционным видеоанализом на стороне сервера? Почему именно сейчас встроенные алгоритмы становятся особенно актуальными? Какова структура рынка? На что следует обратить внимание при выборе аналитики и как ее можно протестировать?

Архитектуры видеоаналитических систем

Встроенной видеоаналитикой (системой видеоанализа) будем называть программное обеспечение, которое распознает поточное видео непосредственно в камере или энкодере в составе системы охранного наблюдения. По сравнению с серверной реализацией (рис. 1) встроенная аналитика анализирует сигнал без искажений до его компрессии и передачи по цифровым каналам связи (рис. 2). При этом повышается точность распознавания за счет обработки видео на более высоком разрешении и с большей частотой кадров.

Архитектура системы на базе серверной видеоаналитики. Значительный поток данных передается от камеры к серверу, где происходит декомпрессия и видеоанализ. Конечные вычислительные ресурсы сервера ограничивают масштабируемость системы

Рис. 1 Архитектура системы на базе серверной видеоаналитики. Значительный поток данных передается от камеры к серверу, где происходит декомпрессия и видеоанализ. Конечные вычислительные ресурсы сервера ограничивают масштабируемость системы.

Архитектура системы на базе встроенной видеоаналитики. Видеоанализ реализован

Рис. 2 Архитектура системы на базе встроенной видеоаналитики. Видеоанализ реализован «на борту» камеры. Камера одновременно транслирует медиаданные (видео и аудио) и метаданные.

Результатом работы алгоритмов видеоанализа является поток метаданных, то есть структурированное описание того, что происходит в зоне наблюдения. Метаданные включают информацию о подвижных объектах, их траекторию и скорость, признаки для автоматической классификации на сервере, информацию о качестве видеосигнала и повреждениях камеры (статус сервисных детекторов).

Таким образом, интеллектуальная камера одновременно транслирует в реальном масштабе времени медиаданные (сжатые видео и аудио) и метаданные (результат видеоанализа). Видеоаналитическое устройство (IP-камера или энкодер) может работать автономно и вести запись в локальную память или буферизированную передачу.

Недостатками встроенной аналитики по сравнению с серверной являются более высокая сложность разработки и меньшая гибкость ПО на автономном устройстве. Однако, несмотря на существенные капитальные затраты, общая стоимость владения системы на базе встроенной аналитики часто оказывается ниже, чем стоимость системы на базе серверной аналитики.

Причины увеличения спроса

Рассмотрим основные тенденции отрасли, ведущие к росту интереса конечных пользователей ко встроенной видеоаналитике.

Распространение IP-видеонаблюдения. Очевидно, что переход от аналоговых камер к сетевым требует радикального пересмотра архитектуры всей системы видеонаблюдения. Централизованный видеоанализ становится практически невозможным из-за значительного увеличения вычислительной нагрузки на сервер, где необходимо производить декомпрессию сжатого IP-видео по всем каналам на высоком разрешении. Более неприятная проблема состоит в том, что точность и дальность действия серверной аналитики существенно снижается от артефактов компрессии H.264 или MJPEG. Неприемлемое снижение чувствительности серверной аналитики происходит во время метерологических осадков, т. к. кодек, ограничивая видеопоток до установленного битрейта, отбрасывает значительную часть «полезной видео информации».

Открытые стандарты ONVIF и PSIA. Одним из основных препятствий широкого распространения встроенной видеоалитики является проблема плохой совместимости IP-устройств, таких как камеры и энкодеры с одной стороны и системы управления видео и цифровые регистраторы с другой стороны. Активная работа производителей по адаптации своих продуктов к открытым международным стандартам сегодня позволяет надеяться на преодоление этого препятствия в ближайшем будущем. Новые стандарты, особенно ONVIF 2.0, покрывают различные аспекты взаимодействия сетевых устройств: обнаружение доступных сервисов видеоаналитики, конфигурирование параметров, передача метаданных, подписка на получение событийных сообщений. Это сделает возможным подключение видеоаналитического устройства в режиме plug and play.

Мегапиксельное разрешение. Повышение разрешающей способности системы видеонаблюдения до режимов высокой четкости (HD 720p, 1080p) сопровождается многократным (в 4-8 раз) увеличением вычислительной нагрузки на подсистемы сжатия и видеоанализа. Таким образом, чтобы избежать перегрузки каналов связи и сервера, функции сжатия и видеоанализа должны быть реализованы непосредственно в HD-камере или HD видеосервере.

Каналы с низкой пропускной способностью. Сеть видеонаблюдения часто приходится разворачивать поверх телекоммуникационной инфраструктуры с относительной низкой пропускной способностью, например, на базе беспроводных сетей 3G/4G (WI-MAX), кабельной сети банкоматов или телеметрии в нефтегазовой отрасли. В этих условиях сложно обеспечить трансляцию видео адекватного качества в реальном масштабе времени от нескольких или даже  одной камеры. С другой стороны, встроенные алгоритмы позволяют анализировать видео в максимальном качестве «на месте», формировать тревожные сигналы и вести буферизированную трансляцию по событиям или по запросу даже по крайне медленным каналам связи. Другими словами, видеоаналитика обеспечивает автономную работу камер и определяет приоритеты для избирательной передачи видео по каналу с низкой пропускной способностью.

Управляемое видео как сервис (MVaS) является одним из самых горячих трендов отрасли на западе, но еще не пришло в Россию. Согласно модели MVaS, инфраструктура управления и хранения видео располагается на Интернет-серверах, а услуга видеонаблюдения предоставляется как сервис с абонентской платой. Объем передаваемого видео от абонента на сервер лимитирован пропускной способностью исходящего канала, который обычно существенно меньше, чем у входящего. Так же ограничены дисковые ресурсы на центральном сервере, обслуживающем большое числа абонентов. Как уже было рассмотрено выше, встроенная аналитика играет ключевую роль в системах с ограниченными ресурсами.

Структура и размер рынка

Рынок встроенной аналитики находится на ранней стадии своего развития. Немалое количество поставщиков предлагает видеоаналитическое программное обеспечение, которое плохо дифференцировано и плохо интегрируется со сторонними разработками. Часто технические возможности видеоаналитики и технические требования заказчика плохо формализованы и не позволяют сделать формальный сравнительный анализ.

В области охраны периметра ведущими разработчиками встроенной видеоаналитики являются компании IOImage (Израиль), AgentVi (Израиль), ObjectVideo (США), Bosch (Германия/США) и Синезис (РФ/РБ). Компания Axis, шведский поставщик сетевых камер, недавно анонсировала базовую видеоаналику в камерах своей старшей продуктовой линейки. В России оборудование со встроенной периметральной аналитикой производят компании БайтЭрг и Агрегатор (устройство MagicBox).

Первопроходцем в области встроенного распознавания номерных знаков транспортных средств является компания CRS (Великобритания). Компания Texas Instruments (США) предлагает алгоритмы детектирования и распознавания лиц, встроенные в процессоры семейства DaVinci. Для более сложных приложений, таких как антитеррористическая безопасность в транспорте или маркетинг розничных продаж, адекватных реализаций встроенной аналитики пока не существует.

Со стороны производителей систем видеонаблюдения лидеры рынка компании iTV/Axxon, Genetec и Milestone в настоящий момент уже поддерживают оборудование со встроенной аналитикой.

Согласно исследованиям агентства IMS Research, около 50 тысяч каналов встроенной аналитики было развернуто по всему миру в 2009 году, но годовой объем продаж должен значительно вырасти до 400 тысяч каналов к 2013 году. Для сравнения, объемы реализации серверной аналитики должны расти меньшими темпами с 38 тысяч в 2009 году до 100 тысяч каналов в 2013 году. В начале рассматриваемого периода около 50% сбыта приходилось на государственные и транспортные сектора.

Цена видеоаналитики значительно варьируется в диапазоне от $10 до $10,000 за канал, при этом большая часть добавочной стоимости создается на этапе аппаратно-программной интеграции всей системы видеонаблюдения. В этой цене сложно выделить себестоимость самой «математики». Так, агентство IMS Research в 2008 году предположило, что объем рынка видеоаналитики к 2010 году составит 3.4 млрд. долл. Очевидно, что речь здесь идет в первую очередь о выручке производителей камер и систем управления со встроенной аналитикой, а не о лицензионных отчислениях правообладателям видеоаналитических алгоритмов.

Как выбрать встроенную аналитику?

По результатам опроса аналитического портала IPVideoMarket, специализирующегося в области сетевого видео, наиболее актуальными направлениями совершенствования систем видеоанализа являются: повышение точности распознавания (55% опрошенных), упрощение инсталляции/настройки (26%), другие доработки (5%). Только 2% опрошенных посчитали, что видеоаналитическая технология не нуждается в дальнейшем совершенствовании. Рассмотрим более подробно эти и другие критерии.

Точность распознавания. Главный критерий выбора видеоаналитики – показатели точности – является самым сложным с точки зрения проведения испытаний и сравнительного анализа. Необходима большая база видеосюжетов, которая покрывает многообразие состояний внешней среды и моделей поведения противника, а также система автоматического тестирования устройств. В ряде случаев нетривиально обеспечить подачу тестового видео непосредственно в видеоаналитическое устройство, где нужный интерфейс ввода видео обычно не предусматривается.

Тестовая база размечается экспертами по безопасности, которые определяют истинные типы событий и моменты времени их возникновения. Рассчитываются показатели точности: чувствительность  img03 и специфичность img04, где a - число истинноположительных срабатываний (нет ошибки), b - число ложноположительны[ срабатываний (ошибка I рода) и c - число ложноотрицательных срабатываний  (ошибка II рода). В качестве интегральной метрики можно использовать взвешенное среднее img05, где α – весовой параметр, определяющий соотношение значимостей ошибок I и II рода. Повторные срабатывания детектора движения на одной и той же цели считаются ошибкой I рода. Например, для сценария «охрана периметра» при оценке точности формирования оперативных тревог α=0.65, а при оценке точности записи событий для индексирования видео α=75.00. Хорошим уровнем точности является F1=0.99. Для тестирования рекомендуется набор видеосюжетов, содержащий не менее 500 истинных нарушений и столько же ситуаций с проявлениями помех и потенциальных источников ошибок (движения теней, тряска камеры, появление животных, птиц, насекомых).

Поддержка открытых стандартов. Как было отмечено выше, одним из основных препятствий распространения встроенной аналитики является проблема ее совместимости с аппаратными платформами и системами управления видео. Согласно нашим исследованиям, стандарт ONVIF обеспечивает наиболее широкие возможности по централизованной настройке аналитики и передаче метаданных (см. статью).  Поддержка этого стандарта со стороны ip-камер и энкодеров, систем управления, видеорегистраторов обеспечивает максимальную защиту инвестиций конечного пользователя, у которого появляется свобода выбора каждой компоненты всего решения.

Дистанционное обновление ПО. Регулярное обновление встроенной аналитики, по аналогии с антивирусными средствами, является необходимым условием для поддержания системы безопасности на высоком уровне эффективности. При выборе поставщика встроенной видеоаналитики необходимо обратить внимание на надежность функции дистанционного обновления прошивки по сети и регулярность обновления программного обеспечения, включая «математику».

Прочие факторы. Дополнительными характеристиками встроенной и серверной видеоаналитики являются возможность работы на изменчивом фоне, устойчивость к дрожанию камеры, наличие дневного и ночного режимов, время распознавания цели (типовой диапазон 1-10 секунд), дальность действия (10-50 метров), допустимые углы установки камеры, типы детектируемого движения человека (например, ходьба, бег, кувырок).

Роль серверного ПО

Наращивание функциональных возможностей встроенной аналитики должно сопровождаться соответствующим развитием «интеллекта» системы управления видео на стороне сервера или на стороне цифрового регистратора. Отметим наиболее важные функции серверного ПО.

Хеширование метаданных для быстрого поиска. Полный поиск по всем метаданным, генерируемых множеством камер, является ресурсоемкой операцией. Реализация функции мгновенного поиска по архиву требует построения специальных индексов, аналогично тем, которые используются в поисковых системах Интернета или на рабочей станции.

Статистический анализ и повышение точности распознавания. Серверное ПО может анализировать метаданные на более высоком уровне и выявлять нештатные ситуации с более высокой точностью, чем встроенное ПО, за счет статистики, накопленной в базе сервера, и применения более сложных алгоритмов. Серверные статистические алгоритмы позволяют выявить закономерности в поведении наблюдаемых объектов и сделать количественные оценки.

Многокамерное сопровождение и управление PTZ-камерой. Сопровождение объекта от камеры к камере предполагает централизованную обработку данных на сервере. Абсолютные трехмерные координаты объекта позволяют автоматически нацеливать камеру PTZ или автоматически переключать каналы на дисплее.

Динамическое управление битрейтом. Важной задачей сервера является адаптивное управление потоком видео и аудио данных от камеры. Возникновение событий, загруженность каналов связи, приоритет зоны наблюдения, присутствие оператора представляют собой неполный список факторов, влияющих на оптимальный режим передачи медиаданных.

В ряде случаев значительно дешевле дифференцировать ПО сервера, чем камеры или энкодера. Процесс разработки на платформе x86 существенно быстрее и гибче. Это позволяет экономично строить специализированные решения вокруг унифицированной встроенной аналитики.

Заключение

Мы рассмотрели вопросы проектирования систем безопасности на базе встроенной видеоаналитики. По сравнению с серверной реализацией встроенные алгоритмы обеспечивают лучшую масштабируемость за счет децентрализованной обработки медиаданных. Реальная польза встроенного видеоанализа для конечного пользователя увеличивается по мере распространения IP-видео, мегапиксельных камер, стандартов ONVIF и PSIA. Одновременно расширяется пространство возможной дифференциации систем управления видео за счет интеллектуальной обработки видеоаналитических метаданных на стороне сервера. При выборе видеоаналитики пользовать должен обратить внимание на формальные показатели точности, условия испытаний, совместимость со стандартами и наличие функции удаленного обновления прошивки.