Flexpoint — float16 с 16-битной мантиссой

Intel — как часть своих процессоров Nervana — представила Flexpoint (flex16+5) для тензорных операций. Подробности в статье ниже, но думайте об этом как

все элементы тензора имеют одинаковый показатель
дополнительные 5 бит точности в 16-битной операции теперь могут быть отнесены к мантиссе.
что означает, что вы в основном выполняете целочисленные операции со всем тензором
что может означать более быстрое и менее дорогое оборудование
показатель степени (и, следовательно, динамический диапазон) обновляется для тензора в целом во время обучения

Последнее особенно полезно — и увлекательно! — так как оказывается, что во время обучения тензоры «имеют довольно остроконечное (и перекошенное вправо) распределение, достаточно охватываемое 16-битным диапазоном. Но положения этих диапазонов варьируются от тензора к тензору, а для некоторых тензоров они значительно сдвигаются в процессе обучения» (изображение выше).

Независимо от того, приживется ли Nervana, flex16+5 кажется отличной идеей для глубокого обучения.

(°) Подробнее об Intel Nervana — https://ai.intel.com/intel-nervana-neural-network-processor-architecture-update/

материалы по теме:

Новые материалы

Плюсы и минусы Gradle

Отказ от ответственности: все мнения являются моими собственными Я начну с того, что у меня есть отношения любви и ненависти к каждому инструменту сборки, который я когда-либо использовал...

В Keap встроен интеллект

AI и ML — модные словечки в индустрии программного обеспечения. Просто чтобы установить уровень, ИИ — искусственный интеллект — это наука об имитации человеческих взаимодействий; Машинное..

Как я использую свой 8-летний опыт работы с ИИ, чтобы создать чертовски лучший информационный бюллетень по ИИ

Многие из вас могут узнать во мне основателя Zeroth.AI Team , вполне возможно, первого ускорителя искусственного интеллекта в мире, особенно в Азии. Для меня было честью возглавить команду..

Google исследует, как использовать AutoML для оптимизации прогнозирования временных рядов

Новый метод, предложенный Google, использует AutoML для изучения различных архитектур временных рядов для данной проблемы. Недавно я запустил образовательный информационный бюллетень,..

Задача NumPy: создание одномерного массива NumPy

Задача NumPy: создание одномерного массива NumPy Создайте функцию с именем array_numpy(n) , которая принимает целое число n в качестве аргумента и возвращает одномерный массив NumPy со..

Один простой способ разделить данные на обучающие и тестовые наборы для машинного обучения.

Давайте посмотрим, как это сделать с помощью Scikit-Learn. Почему мы разделяем данные? В машинном обучении обычной практикой является разделение набора данных на 2 подмножества: набор для..

Получить в руки Mongo DB

Привет, ребята, надеюсь, вам понравилось читать мой последний блог, в котором мы обсуждали основы Mongo DB. Вместе мы прошли все ключевые функции, такие как установка среды Mongo DB, создание базы..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Python Software Development Web Development Coding Deep Learning AI React Software Engineering Nodejs Front End Development Typescript Java Computer Science Development NLP Tech Programming Languages Algorithms Python Programming HTML Angular Javascript Tips Data ChatGPT API Reactjs Code Developer Data Visualization CSS Tutorial Neural Networks Computer Vision Statistics