Дайырбаева Э.Н. –
ст. преподаватель, Казахская академия транспорта и
коммуникации им. М.Тынышпаева (г. Алматы, Казахстан)
ТЕХНОЛОГИИ МАШИННОГО ЗРЕНИЯ
Машинное зрение – один из наиболее перспективных методов автоматизации
действий с применением компьютерных технологий и робототехники. В самом общем
виде системы машинного зрения подразумевают преобразование данных, поступающих с
устройств захвата изображения, с выполнением дальнейших операций на основе этих
данных. В настоящее время машинное зрение наиболее востребовано в медицине и
биотехнологиях, военной отрасли, автомобильной промышленности. Во всяком случае, в
этих областях уже есть четко сформулированные задачи для машинного зрения, решением
которых занимаются ведущие исследовательские центры и робототехнические компании.
При этом возможное поле применения машинного зрения, по-настоящему, огромно – эти
технологии могут быть использованы практически во всех сферах жизнедеятельности.
В частности, в медицине обработка полученных при помощи компьютерного
зрения изображений и видеоданных может применяться для более точной постановки
диагнозов, а в промышленности использование машинного зрения позволяет значительно
снизить себестоимость продукции за счет частичного или полного отказа от выполнения
ручных операций, таким образом, сводя к минимуму воздействие «человеческого
фактора».
Технология машинного зрения включает следующие основные компоненты:
1.
подсистему формирования изображений;
2.
вычислительную систему;
3.
алгоритмы анализа изображений.
Развитие машинного зрения интенсивно идет по всем трем перечисленным
компонентам. Однако, в условиях, когда качественные устройства захвата изображений
259
«РОЛЬ ТРАНСПОРТНОЙ НАУКИ И ОБРАЗОВАНИЯ В РЕАЛИЗАЦИИ ПЯТИ ИНСТИТУЦИОНАЛЬНЫХ
РЕФОРМ», ПОСВЯЩЕННОЙ ПЛАНУ НАЦИИ «100 КОНКРЕТНЫХ ШАГОВ»
__________________________________________________________________________________________________________________________________________________________________________________________
________________________________________________________________________________________________________________________________________________________________________________________
___________________________________________________________________________________________________________________________________________________________________________________________________________________________________
___________________________________________________________________________________________________________________________________________________________________________________________________________________________________
становятся вполне доступными для их не только промышленного или военного
использования, но и бытового, а вычислительные мощности позволяют совершать
миллиарды операций в секунду, давая тем самым возможность их использования в
системах реального времени, критичным становится построение эффективных алгоритмов
для анализа получаемых изображений [1].
Одной из наиболее сложных задач в машинном зрении при применении его в
робототехнике
является
распознавание,
включающее
в
себя
обнаружение
и
идентификацию объектов. В частности, решение этой задачи позволяет выполнить оценку
положения объекта относительно устройства захвата изображения.
Перспективным направлением развития машинного зрения является получение и
дальнейшая обработка данных с использованием пассивных устройств захвата
изображения, к которым относится камера. В отличие от применения различных датчиков,
такой метод вплотную приближает работу системы машинного зрения (особенно, при
использовании стереозрения) к той, что использует человек для решения зрительных
задач. Другими словами, на входе и робототехническая система, и человек получают одну
и ту же зрительную информацию. Разнятся только алгоритмизация и вычислительные
мощности, которые используются для ее преобразования и интерпретации. Но и в этом
направлении уже сделаны весомые шаги, дающие решать различные задачи в самом
общем виде.
Такой подход позволяет эффективно внедрять робототехнические системы,
использующие машинное зрение, непосредственно в обычную для человека среду. А это
дает возможность расширить сферы применения машинного зрения, выводя их далеко за
рамки жестко детерминированных сред в промышленности и постепенно захватывая все
новые области его использования в быту.
Робототехника является традиционной областью применения машинного зрения.
Однако основная доля парка роботов долгое время приходилась на промышленность, где
очувствление роботов не было лишним, но благодаря хорошо контролируемым условиям
(низкой
недетерминированности
среды)
возможными
оказывались
узкоспециализированные решения, в том числе и для задач машинного зрения. Кроме
того,
промышленные
приложения
допускали
использование
дорогостоящего
оборудования, включающего оптические и вычислительные системы.
В этой связи показательно (хотя и не связано только с системами компьютерного
зрения) то, что доля парка роботов, приходящаяся на промышленных роботов, стала менее
50% лишь в начале 2000-х годов [2]. Стала развиваться робототехника, предназначенная
для массового потребителя. Для бытовых роботов, в отличие от промышленных,
критичной является стоимость, а также время автономной работы, что подразумевает
использование мобильных и встраиваемых процессорных систем. При этом такие роботы
должны функционировать в недетерминированных средах. К примеру, в промышленности
долгое время (да и по сей день) использовались фотограмметрические метки,
наклеиваемые на объекты наблюдения или калибровочные доски, – для решения задач
определения внутренних параметров и внешней ориентации камер. Естественно,
необходимость наклеивать пользователю такие метки на предметы интерьера
существенно ухудшила бы потребительские качества бытовых роботов. Не удивительно,
что рынок бытовых роботов ждал для начала своего бурного развития достижения
определенного уровня технологий, что произошло в конце 90-х.
Точкой отсчета этого события может служить выпуск первой версии робота AIBO
(Sony), который, несмотря на сравнительно высокую цену ($2500), пользовался большим
спросом. Первая партия этих роботов в количестве 5000 экземпляров была раскуплена в
Интернете за 20 мин., вторая партия (также в 1999 г.) – за 17 с, и далее темп продаж
составлял порядка 20 000 экземпляров в год.
260
«РОЛЬ ТРАНСПОРТНОЙ НАУКИ И ОБРАЗОВАНИЯ В РЕАЛИЗАЦИИ ПЯТИ ИНСТИТУЦИОНАЛЬНЫХ
РЕФОРМ», ПОСВЯЩЕННОЙ ПЛАНУ НАЦИИ «100 КОНКРЕТНЫХ ШАГОВ»
__________________________________________________________________________________________________________________________________________________________________________________________
________________________________________________________________________________________________________________________________________________________________________________________
___________________________________________________________________________________________________________________________________________________________________________________________________________________________________
___________________________________________________________________________________________________________________________________________________________________________________________________________________________________
Также в конце 90-х появились в массовом производстве устройства, которые
можно было бы назвать бытовыми роботами в полном смысле этого слова. Наиболее
типичными автономными бытовыми роботами являются роботы-пылесосы. Первой
моделью, выпущенной в 2002 г. фирмой iRobot, стала Roomba. Затем появились роботы-
пылесосы, выпущенные фирмами LG Electronics, Samsung и др. К 2008 г. суммарные
объемы продаж роботов-пылесосов в мире составили более полумиллиона экземпляров в
год.
Дальнейшее повышение производительности мобильных процессоров позволяет
ставить новые задачи для систем компьютерного зрения в бытовых роботах, число продаж
которых по всему миру исчисляется уже миллионами экземпляров в год [3]. Помимо задач
навигации, от роботов, предназначенных для персонального использования, может
потребоваться решение задач распознавания людей и их эмоций по лицам, распознавание
жестов, предметов обстановки, включая столовые приборы и посуду, одежду, домашних
животных и т. д., в зависимости от типа задачи, решаемой роботом. Многие из этих задач
далеки от полного решения и являются перспективными с инновационной точки зрения.
Еще более массовыми по сравнению с бытовой робототехникой и системами
помощи водителю являются задачи компьютерного зрения для персональных мобильных
устройств, таких как смартфоны, планшеты и т. д. В частности, число мобильных
телефонов неуклонно растет и уже практически превысило по численности население
Земли. При этом основная доля телефонов выпускается сейчас с камерами. В 2009 г.
количество таких телефонов превысило миллиард, что создает колоссальный по размерам
рынок для систем обработки изображений и компьютерного зрения, который далек от
насыщения, несмотря на многочисленные R&D-проекты, проводящиеся как самими
фирмами — изготовителями мобильных устройств, так и большим числом стартапов.
Достарыңызбен бөлісу: |