LLLit: Изучение и практика программирования

Публикации по теме 'nlp'


2021: Как далеко мы вместе продвинулись, чтобы обеспечить равную производительность языковых технологий во всем…
Приложения обработки естественного языка (NLP) в настоящее время широко распространены и ежедневно используются миллионами людей во всем мире. Тем не менее, эти приложения могут быть чрезвычайно хрупкими и предвзятыми. Например, было замечено, что точность моделей синтаксического разбора падает по крайней мере на 20 процентов на афроамериканском разговорном английском по сравнению с английским, похожим на учебник (на котором обычно говорит более привилегированный класс американцев)...

Анализ настроений с помощью SentiWordNet — Часть II
#ИИ, #искусственный интеллект #НЛП Примечание. Оригинал статьи находится на сайте авторов nidhikayadav.org. Эта статья представляет собой приложение лексической базы данных sentiwordnet. В прошлой статье я предоставил код для доступа к настроению, вот еще несколько подробностей о sentiwordnet с примерами. Sentiwordnet — отличная база данных для поиска тональности слова по его POS-тегу. Таким образом, вы можете искать тональность слова с его POS-тегами, или вы также можете искать..

Ускорение приложений для ответов на вопросы с помощью MobileBERT и TFLite
Мир обработки естественного языка быстро развивается благодаря использованию предварительно обученных моделей с самоконтролем. Однако современные модели, такие как BERT, как правило, имеют огромное количество параметров и, следовательно, страдают от высокой задержки. Для многих приложений с ограниченными ресурсами вычислительные требования этих моделей могут сделать их использование невозможным. В этом посте я хотел бы поделиться нашей траекторией к развертыванию модели семейства BERT..

Большое и маленькое из txtai
Единая платформа машинного обучения для микромоделей вплоть до LLM 2023 год обещает стремительное начало для txtai 🚀 По мере того как мы входим в февраль, ряд крупных инициатив из нашей дорожной карты на 2023 год (см. статью ниже) находятся в стадии реализации и достигли значительного прогресса. NeuML — обзор 2022 года Подводя итоги 2022 года и ожидая 2023 года medium.com Вот краткий обзор этих новых функций. Быстрый поиск с..

Анализ настроений: глубокое погружение в теорию, методы и приложения
Все, что вам нужно знать о классификации настроений, прежде чем начинать код Классификация настроений - одна из наиболее удобных для новичков задач в области науки о данных. Однако сделать это нелегко. Существуют различные модели, разработанные для анализа тональности наборов данных. Важно понимать, как они возникли и как функционируют, чтобы убедиться, что выбранная вами модель наиболее подходит для имеющихся у вас данных. В этой статье я обобщу теорию, лежащую в основе анализа..

Компенсация за непонимание НЛП
Лучшие приложения AI без AGI Выражение «картина стоит тысячи слов» несправедливо по отношению к языку. Это говорит о том, что слова являются неэффективной формой общения, хотя на самом деле верно обратное. Когда люди используют язык для общения, очень многое упускается из виду, потому что говорящий и слушающий разделяют опыт одного и того же мира, что делает явные утверждения об этом общем мире ненужными в повседневной речи. Например, если я говорю вам: «Ваза на боку, катится по..

SmartDict для Python 3.9.2
Иногда мне просто нужен словарь Python, который знает, как обрабатывать разные значения для одного и того же ключа. Считайте это учебным пособием, которое вы можете использовать для расширения поведения стандартного объекта Python dict. Объекты Python dict могут быть очень полезны для НЛП (обработки естественного языка). Один из таких случаев произошел сегодня, когда я хотел собрать результаты «docker ps -a», чтобы дать мне один словарь, который связывает имя образа с идентификатором..

Новые материалы

Как развивается смешанно-целочисленное программирование, часть 7
Унифицированная техника раннего завершения для первично-двойственных алгоритмов в смешанно-целочисленном коническом программировании (arXiv) Автор : Ювэнь Чэнь , Кэтрин Нин , Поль Гулар..

Как научить модель Keras распознавать текст переменной длины
Я некоторое время играл с официальным примером Keras image_ocr.py и хочу поделиться своими выводами в этом посте. В официальном примере выполняется только обучение модели, но отсутствует..

Практическая пакетная нормализация
История начинается после использования инициализации He вместе с ELU (или любым вариантом ReLU) может значительно снизить опасность проблем с исчезающими/взрывающимися градиентами в начале..

Поэзия онлайн-кодирования: путешествие пикселей и страсти
В мире, наполненном инновациями, онлайн-обучение программированию становится холстом, на котором обретает форму полотно вашей мечты. Это больше, чем просто создание строк кода; это сродни..

Обработка изображений с помощью Python - размытие и повышение резкости для начинающих
Как применить ядра свертки к цветным изображениям? В этой статье мы обсудим, как применять ядра размытия и повышения резкости к изображениям. Эти базовые ядра составляют основу многих более..

Ограничение скорости в .NET Core 7 Web API
Что такое ограничение скорости? Ограничение скорости — это процесс, используемый для ограничения количества запросов, разрешенных для определенного ресурса в указанном временном окне. .NET..

Стабильная Diffusion 1.0 выдаёт более красивые картинки, чем SD 2.1?! Почему?
Удивительные открытия, которые я сделал недавно. Смотрите в видео: https://youtu.be/PakgD6FewoU Есть одно логичное объяснение — что у вас?