Описание и пример сцен.

"Нейросетевой детектор людей и объектов", в большинстве случаев, работает "из коробки" и для анализа сцен, удовлетворяющих всем рекомендациям, настройка детектора сводится к минимуму.

Но бывают ситуации, когда камера уже смонтирована, а людей\объекты нужно распознавать далеко. Так же есть ситуации когда камеру физически невозможно повесить ближе или сама сцена является большой:

Как видно из скриншота - люди на сцене имеют малый размер по отношению ко всему кадру.  В таких случаях могут быть ложные срабатывания или отсутствие детектирования людей.

Что такое "Zoom-zones".

Это зона, которая "вырезается" из кадра и подаётся в детектор для обработки и анализа. По умолчанию установлена одна зона на весь кадр, что для ~95% сцен подходит. В случаях же, где люди (объекты) являются мелкими по отношению ко всему кадру - можно создать еще одну зону (Зум-зона), которая будет отдельно подаваться детектору. Если привести аналог, то это ROI в кадре. То есть отдельная зона будет отправляться в детектор, как отдельная картинка, с отдельной камеры.

Стоит учитывать, что при этом, пропорционально количеству созданных зон, вырастет нагрузка на GPU видеорегистратора.


Как настроить "Zoom-zones".

Для создания и настройки дополнительных "Зум-зон" откройте настройки "Нейронного детектора", перейдите в раздел "Размеры объектов" и нажмите кнопку "Создать новую зону детекции":

Далее выделите на экране нужную зону.

В созданной зоне необходимо настроить минимальный и максимальный размеры объекта, который будет детектироваться. 

Про размеры объекта

Имеется в виду размер прямоугольников детекции, а не реальный размер людей. Для стоящих людей бокс детекции будет больше, чем сам человек. Для частично закрытых и сидящих людей размер бокса будет меньше, чем для стоящего человека. То есть всегда нужно указывать максимальный размер объекта на 3-5% больше, чем фактически занимает детектируемый объект.

Влияние количества зон на производительность.

Как было сказано выше, каждая зона будет отправляться в детектор, как отдельная картинка - это значит, что на каждую такую зону детектор будет выделять ресурсов мощности, как на отдельный канал. Таким образом качество обработки изображения на "глубоких" сценах повышается, но параллельно с этим и повышается потребление ресурсов регистратора.

© Неизвестный пользователь (v.fedorenko)