LLLit: Изучение и практика программирования

Публикации по теме 'data'


8 советов и рекомендаций по работе с большими наборами данных в машинном обучении
Основное руководство по оптимизации памяти и кода Pandas и Scikit-learn - популярные библиотеки в сообществе специалистов по науке о данных, поскольку они обладают высокой производительностью и простыми в использовании структурами и функциями данных. Pandas предоставляет инструменты анализа данных для подготовки и анализа данных. Эти библиотеки хорошо работают, работая с наборами данных в памяти (данными, которые помещаются в ОЗУ), но когда дело доходит до обработки наборов данных..

Оправдывает ли повышенная точность дополнительную сложность модели машинного обучения?
Поскольку вычислительная мощность компьютеров становится дешевле и доступнее, для достижения большей точности все чаще используются сложные алгоритмы машинного обучения. Однако оправдывает ли повышение точности добавленную сложность? Чтобы ответить на этот вопрос, я провел небольшой эксперимент. Я обучил и протестировал набор данных Доход взрослых с различными алгоритмами классификации машинного обучения, чтобы наблюдать разницу в AUC (площадь под кривой) и времени, затрачиваемом..

5 статей для чтения по использованию искусственного интеллекта с роботизированной автоматизацией
Управление трафиком с помощью социального робота-гуманоида ( arXiv ) Автор: Фейсал Гаффар Аннотация . С развитием таких технологий, как искусственный интеллект, машинное обучение и Интернет вещей, стало легко разрабатывать больше роботов-гуманоидов и автоматизировать различные процессы. Интерактивный робот должен иметь высокое социальное поведение, чтобы его могли легко принять люди, использующие его. В этом исследовании мы разработали робота дорожной полиции (TRAPROB) для..

Как подготовить данные для машинного обучения
Подготовка данных к моделированию — один из первых фундаментальных этапов работы с данными Обучение прогностических моделей требует, чтобы наши данные были в соответствующем формате. Мы не можем передать наш файл .csv модели и ожидать, что она научится правильно обобщать. В этой статье мы рассмотрим, как подготовить данные для машинного обучения, начиная с конвейера подготовки данных и заканчивая его разделением на наборы для обучения, проверки и тестирования. Конвейер подготовки..

Работа с полиномиальной регрессией, часть 1 (машинное обучение)
Оптимальный план подвыборки для полиномиальной регрессии (arXiv) Автор: Торстен Рейтер , Райнер Швабе . Аннотация: Улучшения в технологии приводят к увеличению доступности больших наборов данных, что делает потребность в сокращении данных и информативных подвыборках еще более важной. В этой статье мы строим D-оптимальные планы подвыборки для полиномиальной регрессии в одной коварианте для инвариантных распределений ковариаты. Мы более внимательно изучаем квадратичную регрессию для..

Банки Digital Next с интеллектуальными платформами на базе AI/ML
Сегодня банки имеют доступ к огромному количеству данных о клиентах, продуктах и ​​операционных данных. Данные поступают из внутренних и внешних источников, включая потоковые данные в реальном времени с датчиков, устройств, мобильных приложений, IoT и корпоративных центров обработки данных. Банки также борются с использованием неструктурированных данных, таких как комментарии, жалобы, электронные письма и т. д., помимо структурированных данных, находящихся в архиве. По мере того, как..

Добавление динамических данных из Javascript на сайты Hype
Hype от Tumult - отличный инструмент для некодеров, позволяющий создавать впечатляющие веб-сайты, особенно если вы ищете что-то довольно динамичное. Для людей, знакомых с AfterEffects или Sketch, его интерфейс очень похож. Hype даже позволяет вам добавлять свои собственные функции javascript, что означает, что вы даже можете создать динамический веб-сайт, подобный CMS, без необходимости знать какой-либо код. В этом руководстве мы собираемся использовать Hype для динамического обновления..

Новые материалы

Я спросил GPT
Я спросил GPT о самосознании: Самосознание – это способность распознавать и понимать собственные мысли, чувства и поведение. Это предполагает осознание себя и понимание того, как свои..

Работа с алгоритмом Forward-Backward часть 2 (искусственный интеллект)
Стохастический алгоритм прямого и обратного типа Ценга для монотонных включений (arXiv) Автор: Ван Дунг Нгуен , Нгуен Винь Аннотация: В этой статье мы предлагаем стохастическую версию..

Сжатие цифровых изображений: обзор
Эта история была написана Лаик Аслам , членом группы технического контента Educative. Введение в цифровые изображения В этом блоге обсуждаются цифровые изображения и некоторые методы..

Примеры использования командной строки Laravel Artisan 2020
Платформа Laravel предоставляет три основных инструмента для взаимодействия через командную строку, а именно: Artisan, Ticker и REPL . В этой главе подробно рассказывается о Artisan...

Что такое визуализация данных?
Визуализация данных в машинном обучении и науке о данных Визуализация данных — очень важная тема в машинном обучении и науке о данных. Визуализация данных, как следует из названия,..

Генерация взрывов с помощью Python
Объяснение генераторов Python и комбинаторного взрыва Я рад показать вам весь новый мир генераторов на Python и, надеюсь, привнесу немного математики во все ваши жизни (потому что каждому всегда..

8 советов и рекомендаций по работе с большими наборами данных в машинном обучении
Основное руководство по оптимизации памяти и кода Pandas и Scikit-learn - популярные библиотеки в сообществе специалистов по науке о данных, поскольку они обладают высокой производительностью..