Журнал "Системы Безопасности" № 3‘2018

работоспособности, что позволяет сертифици- ровать и использовать устройства на базе Xilinx ® ZynQ ® в задачах обеспечения безопасно- сти человека и оборудования. Однако вернемся к нашей основной теме – обработке изображений. Как мы уже упомина- ли ранее, без эффективных и удобных инстру- ментов программирования широкое примене- ние даже самых замечательных решений вряд ли возможно. В экосистеме Xilinx ® эта роль отводится набору библиотек и инструментов reVision Stack, открывающему пути к внедре- нию эффективных технологий FPGA в популяр- ные среды разработки на различных этапах: создание оптимизированной аппаратной кон- фигурации, разработка алгоритмов и, нако- нец, конечного приложения в большинстве случаев без необходимости использования достаточно сложного в применении языка VHDL. Принцип оптимизации вычислений Выглядит работа программиста следующим образом (рис. 3). В привычной среде, напри- мер на базе OpenCV, создается программный код. С помощью отладчика определяются наи- более затратные по времени функции. Затем они заменяются на аналогичные из библиотеки Xilinx, но выполняемые с использованием воз- можностей оптимизированной архитектуры и параллельных вычислений на базе FPGA. Про- изводится компиляция кода с подключением фирменных библиотек Xilinx. По оценкам ком- пании-производителя, это по сравнению с популярными компактными платформами на базе GPU дает выигрыш: l в машинном обучении – в шесть раз (изобра- жений/секунд/ватт); l при обработке изображений – в 42 раза (кад- ров/секунд/ватт); l сокращает время отклика в пять раз. Так, широко применяемый алгоритм определе- ния траектории движения объектов Dense Opti- cal Flow для изображения 4K60 с MIPI-камеры выполняется на платформе разработчика ZCU102 без пропуска кадров (60 кадр/c при качестве 4K), при этом плата потребляет менее 5 Вт и задержка составляет менее 17 мс при загрузке процессора в 15%. А как же столь популярные сегодня нейронные сети? Стандарт- ные подходы из конца 80-х были основаны на вычислениях с 32-разрядной точностью, что представляет определенные трудности для FPGA. Последние исследования в области опти- мизации нейронных сетей показывают незначи- тельное падение точности их работы при сни- жении разрядности весовых коэффициентов до восьми и даже трех разрядов, что позволяет эффективно использовать высочайшую ско- рость целочисленных вычислений FPGA в око- нечных устройствах, реализующих в том числе www.secuteck.ru июнь – июль 2018 МАШИННОЕ ЗРЕНИЕ w w w . a l l - o v e r - i p . r u n В И Д Е О Н А Б Л Ю Д Е Н И Е 127 Таблица. Сравнительная таблица компактного воплощения NVIDIA CUDA Jetson TX1/TX2 Рис. 2. Программная экосистема для обработки и распознавания reVision Рис. 3. Визуализация результатов работы алгоритма Dense Optical Flow С екрет эффективности технологии ПЛИС (FPGA) по сути своей прост: микросхема, архитектура которой оптимизирована для выпол- нения заданной программы, всегда выигрывает в производительности и потреблении в сравнении с универсальными процессорами, где оптимизация возможна лишь в программном коде, а аппаратная избы- точность – неизбежная плата за универсальность

RkJQdWJsaXNoZXIy Mzk4NzYw