Среда была большим днем ​​для новостей, связанных с искусственным интеллектом. Не менее пяти громких заявлений от крупных компаний. Многое нужно разобрать, но дает интересный снимок того, где дела и куда они, возможно, идут. Веские доказательства того, что искусственный интеллект в его нынешней форме глубокого обучения превращается из лабораторных экспериментов в отрасль.

Element AI объявила, что собрала 102 миллиона долларов на разработку инкубатора для стартапов, связанных с искусственным интеллектом, который обеспечит доступ к инфраструктуре и критической массе, необходимой для создания бизнеса, чего в противном случае не было бы у небольших групп инженеров. Они надеются поддержать до 50 стартапов и предоставить альтернативу быстрой консолидации всего, что связано с ИИ, в крупнейших технологических компаниях. Такие инкубаторы, как Element AI, могут предоставить небольшим компаниям возможность фактически выводить продукты на рынок.

Объявление Snapchat показало, что они приложили значительные усилия для повышения эффективности, чтобы позволить телефонам выполнять задачи глубокого обучения без помощи облака. Существует большая разница в компьютерных ресурсах, необходимых для обучения и реального использования сетей глубокого обучения. Обучение может потребовать множества проходов через наборы данных из миллионов изображений. Однако полезный результат этого обучения (он же логический вывод) может потребовать обработки только одного изображения. Поэтому разумно предположить, что в телефонных приложениях может использоваться глубокое обучение. Тем не менее, сети глубокого обучения занимают много памяти, а количество арифметических операций, необходимых для вывода, пропорционально размеру сети. Поэтому оптимизация, подобная той, что есть в Snapchat, критически важна для мобильного развертывания. Теперь мы можем ожидать появления большего количества мобильных приложений, в которых распознавание объектов находится в центре внимания.

«Теперь мы можем ожидать появления большего количества мобильных приложений, в которых распознавание объектов находится в центре внимания».

Facebook разработал чат-бота, который лжет, пока ведет переговоры. Сети глубокого обучения охватывают все больше и больше аспектов человеческого поведения. Конечно, это не новость, поскольку ежедневно собираются огромные объемы статистических данных, позволяющих определить и предсказать, как люди реагируют на различные формы информации. Будут ли люди платить определенную сумму за место в авиакомпании? Или что ваше мнение о последнем фильме о Бэтмене говорит о вашей вероятности увидеть фильм о цыпочках, или даже о том, что вы едите или какую машину вы могли бы купить? Возможность статистически предсказывать человеческое поведение и таким образом имитировать это поведение сильно отличается от способности действовать разумно, но во многих случаях это мощный суррогат. Чат-бот Facebook показывает, что, если стратегия работает, глубокое обучение может уловить эту стратегию, даже если она немного сомнительна.

«Чат-бот Facebook показывает, что, если стратегия работает, глубокое обучение может уловить эту стратегию, даже если она немного сомнительна».

Мисс Пакман попадает в руки ИИ-игрока из Microsoft с не меньшим высшим баллом. Pacman - более сложная задача, чем многие классические игры, которые проигрывали раньше, из-за множества разных персонажей и целей. Команда Microsoft применила глубокое обучение с подкреплением (RL), которое учится исключительно методом проб и ошибок. В обучении было задействовано более 800 миллионов видеокадров игры (при 30 кадрах в секунду, это будет полный год, 24 часа в сутки. Это много для Pacman). Обученная RL, система использует серию из 150 агентов, каждый из которых выполняет подзадачи по предотвращению и сбору объектов. Новшество здесь - это способ, которым отдельные действия агентов объединяются для принятия общих решений. Они утверждают, что такая система может помочь продавцам решить, каких клиентов обслуживать в первую очередь, чтобы максимизировать доход. Более вероятно, что такой подход будет полезен для беспилотных автомобилей, где ситуация постоянно и быстро меняется, и множество различных соображений должны приводить к единичным действиям.

Наконец, что, возможно, наиболее важно, Vicarious AI анонсировал основанную на моделях систему обучения с подкреплением (RL), Schema Networks, которая изучает свою задачу совершенно иначе, чем глубокое обучение. Они отмечают, что традиционный глубокий RL выигрывает, но упускает из виду главное. Под этим они подразумевают, что глубокая сеть научилась тому, что нужно делать статистически в любой момент времени, но она не обязательно имеет какую-либо основную рабочую модель того, что она делает. Системы RL могут изучить работоспособную и эффективную стратегию для задачи, но эта стратегия может быть неустойчивой даже к незначительным изменениям в правилах. Подход Vicarious, с другой стороны, изучает стратегию, которая гораздо более четко моделирует задачи игры. Когда они изменяют игру, но на самом деле не меняют основ, Schema Network адаптируется немедленно, потому что игра на самом деле не так сильно изменилась и использует то, что ей известно. Системе RL, основанной на глубоком обучении, приходится в значительной степени заново учиться, чтобы восстановиться в игре.

Объявления в среду охватывают множество вопросов. Глубокое обучение - отличный инструмент, который можно использовать во множестве различных приложений, и его отрасль постоянно развивается. Глубокое обучение может воспроизводить, по крайней мере, статистически, многие формы человеческого поведения, хорошие и плохие. Но нынешние тенденции отождествления глубокого обучения с ИИ или смешения набора поведений с реальным интеллектом уже кажутся опрометчивыми.

Глубокое обучение - отличный инструмент, который можно использовать во множестве различных приложений, и его отрасль постоянно развивается. Глубокое обучение может воспроизводить, по крайней мере, статистически, многие формы человеческого поведения, хорошие и плохие.

Первоначально опубликовано на www.madstreetden.com

Об авторе: Коста Колберт - старший вице-президент и главный научный сотрудник Mad Street Den Labs. Он возглавляет устав MSD вместе с техническим директором по созданию будущих архитектур нейронных сетей, которые позволят создать более обобщенные модели интеллекта.