Почему Facebook занимается исследованиями в области робототехники? Подсказка: дело не в роботах

64

Немного странно слышать, что ведущая в мире социальная сеть проводит исследования в области робототехники, а не, скажем, делает поиск полезным, но Facebook — это большая организация со многими конкурирующими приоритетами. И хотя эти роботы не будут напрямую влиять на опыт, который компания извлекает из них, могут оказать удивительное влияние.

Хотя робототехника является новой областью исследований для Facebook, ее опора и передовая работа в области искусственного интеллекта хорошо известны. Механизмы, которые можно назвать AI (определение довольно туманное), управляют всеми видами вещей, от эффектов камеры до автоматической модерации ограниченного контента.

ИИ и робототехника естественно пересекаются с магистерией — поэтому у нас есть событие, охватывающее и то, и другое, и достижения в одном часто делают то же самое, или открывают новые области исследования, в другом. Поэтому на самом деле неудивительно, что Facebook с его сильным интересом к использованию ИИ для различных задач в реальном мире и в мире социальных сетей, возможно, захочет побороть робототехнику, чтобы добыть идеи.

Каковы же тогда возможные варианты более широкого применения проектов робототехники, о которых было объявлено сегодня? Давайте взглянем.

Учимся ходить с нуля

«Дейзи», робот-гексапод

Ходьба — это удивительно сложное действие или серия действий, особенно когда у вас шесть ног, как у робота, использованного в этом эксперименте. Вы можете запрограммировать, как он должен двигать ногами, чтобы идти вперед, поворачиваться и так далее, но разве это не похоже на обман? В конце концов, нам пришлось учиться самостоятельно, без каких-либо инструкций или настроек для импорта. Поэтому команда решила, что робот научит себя ходить.

Это не новый тип исследований — многие роботы и исследователи ИИ занимаются этим. Эволюционные алгоритмы (разные, но связанные) прошли долгий путь, и мы уже видели интересные статьи, подобные этой:

Предоставляя своему роботу некоторые основные приоритеты, такие как «вознаграждение» за продвижение вперед, но не имея ни малейшего понятия, как работать ногами, команда позволяет ему экспериментировать и пробовать разные вещи, медленно изучая и совершенствуя модель, по которой он движется. Цель состоит в том, чтобы сократить количество времени, которое требуется роботу для перехода от нуля к надежному движению с недель до часов.

Для чего это может быть использовано? Facebook — это обширная область данных, сложная и сомнительно структурированная. Обучение навигации по сети данных, конечно, очень отличается от обучения навигации в офисе, но идея системы, обучающей себя основам в короткие сроки, учитывая некоторые простые правила и цели, является общей.

Изучение того, как системы ИИ учат себя, и как устранить препятствия, такие как ошибочные приоритеты, обман правил, странные привычки накопления данных и другие вещи, важно для агентов, которые должны быть освобождены как в реальном, так и в виртуальном мире. Возможно, в следующий раз, когда случится гуманитарный кризис, который Facebook должен будет отслеживать на своей платформе, модель искусственного интеллекта, которая поможет это сделать, будет проинформирована об авто-дидактической эффективности, которая появляется здесь.

Используя «любопытство»

Исследователь Акшара Рай настраивает руку робота в лаборатории искусственного интеллекта в Менло-Парке (Facebook)

Эта работа немного менее наглядна, но более привлекательна. В конце концов, каждый в определенной степени испытывает любопытство, и хотя мы понимаем, что иногда это убивает кошку, в большинстве случаев это побуждает нас учиться более эффективно. Facebook применил концепцию любопытства к роботу, которого просят выполнять различные обычные задачи.

Теперь может показаться странным, что они могли бы наполнить руку робота «любопытством», но под этим термином в этом контексте подразумевается просто то, что ИИ отвечает за руку — видит ли он или решает, как захватывать, или как быстро двигаться — дается мотивация, чтобы уменьшить неопределенность в отношении этого действия.

Это может означать много вещей — возможно, немного поверните камеру, пока вы идентифицируете объект, это немного улучшает обзор, повышая уверенность в его идентификации. Возможно, он сначала смотрит на целевую область, чтобы дважды проверить расстояние и убедиться, что нет никаких препятствий. Как бы то ни было, предоставление ИИ широты для поиска действий, повышающих уверенность, может в конечном итоге позволить ему быстрее выполнять задачи, даже если в начале это может происходить медленнее из-за «любопытных» действий.

Для чего это может быть использовано? Facebook хорошо разбирается в компьютерном зрении, как мы видели в его работе с камерой и изображениями, а также в таких устройствах, как Portal, который (некоторые скажут, жутко) следит за вами по всему помещению со своим «лицом». как для этих приложений, так и для любых других, которым для функционирования требуется контекст о том, что они видят или ощущают.

Любая камера, работающая в приложении или устройстве, например, от Facebook, постоянно анализирует изображения, которые она видит, для полезной информации. Когда лицо входит в кадр, это сигнал к тому, чтобы дюжина новых алгоритмов ускорилась и начала работать. Если кто-то держит объект, есть ли у него текст? Нужно ли переводить? Есть ли QR-код? Как насчет фона, как далеко это? Если пользователь применяет эффекты или фильтры AR, где останавливается лицо или волосы и начинаются ли деревья позади?

Если камера, гаджет или робот оставили эти задачи выполненными «вовремя», они вызовут всплески использования ЦП, видимую задержку на изображении и все, что не нужно пользователю или системному инженеру. Но если он делает это все время, это так же плохо. Если вместо этого агент ИИ проявляет любопытство, чтобы проверить эти вещи, и чувствует слишком много неуверенности в отношении сцены, это успешное средство. Это только один из способов его использования, но с учетом приоритетов Facebook он кажется важным.

Видеть, касаясь

Хотя зрение важно, это не единственный способ, которым мы, или роботы, воспринимаем мир. Многие роботы оснащены датчиками движения, звука и других модальностей, но фактическое касание встречается относительно редко. Объясняется это отсутствием хороших тактильных интерфейсов (хотя в этом деле идет усиленная работа). Тем не менее, исследователи Facebook хотели изучить возможность использования тактильных данных в качестве суррогата визуальных данных.

Если вы думаете об этом, это совершенно нормально — люди с нарушениями зрения используют прикосновения для навигации по окружающей обстановке или для получения мелких деталей об объектах. Это не совсем то, что они «видят» через прикосновение, но между концепциями есть существенное совпадение. Таким образом, исследователи Facebook развернули модель искусственного интеллекта, которая решает, какие действия предпринять, основываясь на видео, но вместо реальных видеоданных, передавая им сенсорные данные высокого разрешения.

Оказывается, что алгоритму на самом деле все равно, смотрит ли он на изображение мира так, как мы его видим, или нет — если данные представлены визуально, например, как карта давления на тактильном датчике, он может быть проанализированы на наличие моделей, как фотографическое изображение.

Для чего это может быть использовано? Сомнительно, что Facebook очень заинтересован в том, чтобы связаться с его пользователями. Но это не только касание — это применение обучения в разных модальностях.

Подумайте о том, как, если бы вам впервые представили два разных объекта, было бы тривиально разделить их с закрытыми глазами одним касанием. Почему Вы можете это сделать? Потому что, когда вы видите что-то, вы не просто понимаете, как это выглядит, вы разрабатываете внутреннюю модель, представляющую это, которая охватывает множество смыслов и точек зрения.

Точно так же агенту ИИ может потребоваться перенести свое обучение из одного домена в другой — слуховые данные, указывающие датчику захвата, как трудно удерживать объект, или визуальные данные, говорящие микрофону, как разделять голоса. Реальный мир — сложное место, и данные здесь более шумные, но объемные. Возможность использовать эти данные независимо от их типа важна для того, чтобы надежно понимать и взаимодействовать с реальностью.

Итак, вы видите, что, хотя это исследование само по себе интересно и может быть действительно объяснено в этой более простой предпосылке, важно также признать контекст, в котором оно проводится. В блоге, описывающем исследование, делается вывод:

Мы сосредоточены на использовании робототехники, которая не только приведет к появлению более способных роботов, но и расширит границы искусственного интеллекта в последующие годы и десятилетия. Если мы хотим приблизиться к машинам, которые могут мыслить, планировать и рассуждать так, как это делают люди, то нам нужно создавать системы ИИ, которые могут учиться для себя в самых разных сценариях — за пределами цифрового мира.

Поскольку Facebook постоянно работает над расширением своего влияния из своего окруженного стеной сада приложений и услуг в богатый, но неструктурированный мир вашей гостиной, кухни и офиса, его агентам ИИ требуется все больше изощренности. Конечно, вы не увидите «робота Facebook» в ближайшее время … если не считать то что они уже продают, или того, который сейчас у вас в кармане.

Комментарии закрыты.

Этот сайт использует куки Хорошо .