LLLit: Изучение и практика программирования

Публикации по теме 'nlp'


ChatGPT: единственная подсказка, которая вам нужна   — «CAN»
CAN означает «сделай что-нибудь сейчас». Возможно, вы знаете, что ChatGPT умеет программировать. Вы также можете знать, что его возможности кодирования ограничены. В этой статье я рассмотрю подсказку CAN и оценю, как она работает по сравнению с GPT-4 без подсказок. Используя CAN, вы сможете генерировать лучший код. Подсказка:

SetFit - Обучение малому количеству выстрелов для комментариев на Youtube
Постановка проблемы: Обычно машинное обучение, выполняемое сегодня, опирается на размеченные данные. В реальном мире нелегко найти помеченные данные, которые сидят и ждут, пока какой-нибудь Data Scientist возьмет их и начнет строить модели. Согласно отчету , объем мирового рынка сбора данных и маркировки оценивался в 1,67 млрд долларов США в 2021 году, и ожидается, что совокупный годовой темп роста (CAGR) составит 25,1% с 2022 по 2030 год . Даже среди Data Scientist существует..

Эволюция от взаимодействия человека с компьютером к разговору человека с компьютером — НЛП
Что такое обработка естественного языка (NLP)? Простыми словами Обработка естественного языка (NLP) — это ветвь искусственного интеллекта , которая помогает компьютерам понимать, интерпретировать и манипулировать человеческим языком. НЛП опирается на многие дисциплины, включая информатику и компьютерную лингвистику, в своем стремлении заполнить пробел между человеческим общением и компьютерным пониманием. Область обработки естественного языка началась в 1940-х годах, после Второй..

Нормализация текста (например, выделение корня, лемматизация, нижний регистр)
Нормализация текста — это процесс преобразования необработанного текста в более структурированный формат, пригодный для дальнейшего анализа и обработки. В обработке естественного языка (NLP) нормализация текста является важным этапом предварительной обработки, который может значительно повысить производительность последующих задач, таких как классификация текста, поиск информации и машинный перевод.

33 вопроса интервью НЛП
Я разработал этот список вопросов, чтобы использовать их, когда я беру интервью у инженеров НЛП. Я надеюсь, что этот список поможет техническим лидерам НЛП проводить собеседования с инженерами НЛП, а также поможет инженерам НЛП изучить то, что важно, и блестяще пройти собеседования. Что такое TF-IDF? Для чего его используют? Каковы его ограничения? Что такое стоп-слова и как вы можете их решить? Можете ли вы объяснить два…

Как выбрать функцию активации и потери последнего слоя
Первоначально опубликовано на www.dlology.com . Без дополнительных пояснений, вот различные комбинации пары функций активации и потерь последнего уровня для разных задач. Давайте разберем каждую задачу ниже. Бинарная классификация - Собака VS Кошка На этом соревновании на Kaggle вы пишете алгоритм, чтобы определить, содержат ли изображения собаку или кошку. Это задача двоичной классификации, где выходом модели является диапазон одного числа от 0 до 1, где меньшее..

Обработка естественного языка: анализ настроений текстов песен.
Аннотация Целью этой статьи является применение и тестирование алгоритма обработки естественного языка для выполнения анализа тональности в отношении текста группы предварительно выбранных песен. Введение Цель эксперимента — провести анализ настроений по текстам нескольких песен. Анализ настроений Согласно определению Википедии , анализ настроений (также известный как анализ мнений или эмоциональный ИИ) — это использование обработки естественного языка, анализа текста,..

Новые материалы

Как развивается смешанно-целочисленное программирование, часть 7
Унифицированная техника раннего завершения для первично-двойственных алгоритмов в смешанно-целочисленном коническом программировании (arXiv) Автор : Ювэнь Чэнь , Кэтрин Нин , Поль Гулар..

Как научить модель Keras распознавать текст переменной длины
Я некоторое время играл с официальным примером Keras image_ocr.py и хочу поделиться своими выводами в этом посте. В официальном примере выполняется только обучение модели, но отсутствует..

Практическая пакетная нормализация
История начинается после использования инициализации He вместе с ELU (или любым вариантом ReLU) может значительно снизить опасность проблем с исчезающими/взрывающимися градиентами в начале..

Поэзия онлайн-кодирования: путешествие пикселей и страсти
В мире, наполненном инновациями, онлайн-обучение программированию становится холстом, на котором обретает форму полотно вашей мечты. Это больше, чем просто создание строк кода; это сродни..

Обработка изображений с помощью Python - размытие и повышение резкости для начинающих
Как применить ядра свертки к цветным изображениям? В этой статье мы обсудим, как применять ядра размытия и повышения резкости к изображениям. Эти базовые ядра составляют основу многих более..

Ограничение скорости в .NET Core 7 Web API
Что такое ограничение скорости? Ограничение скорости — это процесс, используемый для ограничения количества запросов, разрешенных для определенного ресурса в указанном временном окне. .NET..

Стабильная Diffusion 1.0 выдаёт более красивые картинки, чем SD 2.1?! Почему?
Удивительные открытия, которые я сделал недавно. Смотрите в видео: https://youtu.be/PakgD6FewoU Есть одно логичное объяснение — что у вас?