Поведение логарифма вероятности в машинном обучении, часть 1

Правильно ли вы используете журнал испытаний? (arXiv)

Автор: Самир К. Дешпанде, Сумья Гош, Тин Д. Нгуен, Тамара Бродерик

Аннотация: Тест логарифмического правдоподобия обычно используется для сравнения различных моделей одних и тех же данных или различных алгоритмов приблизительного вывода для подбора одной и той же вероятностной модели. Мы представляем простые примеры, демонстрирующие, как сравнения, основанные на логарифмическом правдоподобии, могут противоречить сравнениям по другим целям. В частности, наши примеры показывают, что (i) алгоритмы приближенного байесовского вывода, которые достигают более высоких логарифмов правдоподобия, не обязательно должны также давать более точные апостериорные аппроксимации и (ii) выводы о точности прогноза, основанные на сравнениях логарифмов правдоподобия, могут не согласовываться с выводами, основанными на среднеквадратическая ошибка

2. Метод максимального логарифмического правдоподобия для несбалансированных задач обучения с несколькими выстрелами (arXiv)

Автор : Сэмюэль Гесс, Грегори Дитцлер.

Аннотация: Обучение за несколько шагов — это быстро развивающаяся область исследований в области машинного обучения, целью которой является классификация неразмеченных данных только с помощью одного или нескольких помеченных образцовых образцов. Нейронные сети обычно обучаются минимизировать метрику расстояния между помеченными примерными образцами и набором запросов. Ранние подходы с несколькими выстрелами используют эпизодический процесс обучения для разделения обучающих данных на пакеты из нескольких кадров. Этот процесс обучения соответствует подвыборке, выполненной при оценке. В последнее время традиционная контролируемая тренировка в сочетании с косинусной дистанцией позволила добиться превосходных результатов при малом количестве выстрелов. Несмотря на разнообразие подходов, применявшихся за последнее десятилетие, большинство методов по-прежнему полагаются на слой косинусного или евклидова расстояния между скрытыми особенностями обученной сети. В этой работе мы исследуем распределения обученных функций с несколькими выстрелами и демонстрируем, что их можно грубо аппроксимировать как экспоненциальные распределения. При этом предположении экспоненциального распределения мы предлагаем новую метрику максимального логарифмического правдоподобия для архитектур с несколькими выстрелами. Мы демонстрируем, что предлагаемая метрика обеспечивает превосходную точность производительности по сравнению с другими показателями. традиционные метрики подобия (например, косинус, евклидова и т. д.) и обеспечивают современную индуктивную производительность с несколькими импульсами. Кроме того, дополнительных преимуществ можно достичь, тщательно комбинируя несколько метрик, и ни один из наших методов не требует преобразований признаков постобработки, которые являются общими для многих алгоритмов. Наконец, мы демонстрируем новый итерационный алгоритм, разработанный на основе нашего подхода максимального логарифмического правдоподобия, который обеспечивает современную трансдуктивную производительность при нескольких выстрелах, когда оценочные данные несбалансированы. Мы выложили наш код в открытый доступ по адресу https://github.com/samuelhess/MLL_FSL/.

материалы по теме:

Новые материалы

Использование условия внутри map() в React

При работе с React обычно используется метод `map()` для отображения списка элементов. Однако иногда вы можете захотеть условно отображать определенные элементы на основе некоторых критериев. В..

Будущее искусственного интеллекта : как машинное обучение революционизирует отрасли

Искусственный интеллект (ИИ) был горячей темой в течение многих лет, и ясно, что эта технология будет становиться все более распространенной в будущем, особенно с появлением ChatGPT в конце..

Матрица | Вектор интеллекта

Когда мы слышим слово «матрица», у нас возникает интуитивное представление о прямоугольном массиве чисел, или так это называется в книгах. Изучая главу «Матрица» в школьной математике, кто бы..

365 Days of Python: Day #200 — Beach Bumming

«Время, потраченное впустую на пляже, — это время, проведенное с пользой». - Неизвестный Достижения N/A Цели на неделю Напишите программу, которая… (0%) Заключительные мысли

🏊 Glidesort в Rust в 4 раза быстрее на случайных данных

Недавно анонсированная Glidesort оказалась в 4 раза быстрее на случайных данных. Давайте проверим, о чем пух!

Новые методы с использованием деревьев решений, часть 4 (машинное обучение)

Эффективное обнаружение мошенничества с использованием деревьев принятия решений с глубоким повышением (arXiv) Автор: Бяо Сюй , Яо Ван , Сюву Ляо , Кайдун Ван . Аннотация: Обнаружение..

Хранилище данных объяснил

Хранилище данных — это централизованный репозиторий, в котором хранятся структурированные, интегрированные и исторические данные, которые используются для бизнес-анализа и принятия решений. Это..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Web Development Python Software Development Coding Deep Learning React AI Software Engineering Nodejs Front End Development Typescript Java Computer Science Development Angular Algorithms Javascript Tips NLP HTML Developer Tech Python Programming Programming Languages ChatGPT API Reactjs Data Visualization Data CSS Code Neural Networks Tutorial Productivity Open Source