LangChains для задач НЛП

ЧИТАЙТЕ ПОЛНЫЙ БЛОГ ЗДЕСЬ

LangChains для NER, суммирования и текстовых тегов
Погружение глубже в мир LangChains? Наше недавнее руководство раскрыло волшебство создания приложений с использованием LangChain…vteam.ai

Мы уже рассмотрели руководство по LangChains для начинающих о том, как создавать различные приложения с использованием инфраструктуры LangChain вместо LLM. Если вы пропустили это, мы предоставим вам все необходимое.

https://vteam.ai/blog/posts/beginners-guide-for-lang-chain

Итак, как вы, наверное, знаете, LangChain — это мощная платформа, построенная на основе больших языковых моделей (LLM), предназначенная для таких задач, как чат-боты, генеративные ответы на вопросы, обобщение и многое другое. Основная идея LangChain — «связать» вместе различные компоненты, создавая последовательности компонентов или подцепей для достижения конкретных задач. Эти компоненты включают в себя шаблоны подсказок, языковые модели и анализаторы вывода, которые гармонично работают для обработки пользовательского ввода, генерации ответов и обработки выходных данных. LangChain упрощает настройку таких моделей, как GPT-3, предоставляя API для быстрого проектирования, повышая доступность работы с LLM для различных приложений. Он упрощает интеграцию с различными типами моделей и интерфейсов, позволяя специалистам LLM принимать строки в качестве входных данных и создавать строки в качестве выходных данных, что ускоряет разработку приложений на основе больших языковых моделей.

В последнем уроке мы создали три разных приложения: проверку грамматики, смену тонов и языковой переводчик, коды для которых доступны в упомянутом выше сообщении блога. Немного усложняя задачу, мы перейдем к некоторым формулировкам проблем, связанных с НЛП, и к тому, как их реализовать с помощью LangChains и LLM. Но прежде чем переходить к кодам, давайте разберемся с несколькими фундаментальными понятиями, необходимыми для понимания этого руководства.

Распознавание именованных объектов (NER): NER включает идентификацию и классификацию именованных объектов (таких как имена людей, мест, организаций, даты и т. д.) в тексте. Пример: «Джонни живет во Флориде» — NER идентифицирует «Джонни» как ЧЕЛОВЕКА, а «Флориду» как GPE (геополитическую сущность).

Разметка текста. Разметка текста в системе обработки естественного языка (NLP) включает в себя присвоение определенных меток или тегов словам в текстовом корпусе для обозначения их грамматических или семантических свойств. Эти теги предоставляют информацию о части речи (существительное, глагол, прилагательное и т. д.) или других лингвистических характеристиках каждого слова.

LLM: Большие языковые модели (LLM) — это тип искусственного интеллекта, характеризующийся большим размером. Они обладают способностью обрабатывать и генерировать человеческие ответы на запросы на естественном языке. LLM обучаются на огромных объемах текстовых данных, часто взятых из Интернета, с использованием ускорителей искусственного интеллекта. Они используются в различных задачах обработки естественного языка и способны генерировать связный и контекстуально релевантный текст. Популярные примеры LLM включают BERT, GPT-3 и T5. Эти модели произвели революцию в обработке естественного языка, продемонстрировав способность генерировать человеческий текст и понимать контекст, что привело к применению в чат-ботах, генерации контента, переводе и т. д.

LangChains: LangChain — это платформа, предназначенная для упрощения создания приложений с использованием больших языковых моделей (LLM). Он позволяет объединять различные компоненты для создания расширенных вариантов использования LLM, таких как чат-боты, генеративные ответы на вопросы, обобщение и многое другое. LangChain предлагает стандартный интерфейс для построения цепочек моделей и интегрируется с различными инструментами. Это облегчает взаимодействие между цепочками и внешними источниками данных для генерации дополненных данных.

Урок 1. Распознавание именованного объекта

В этой короткой демонстрации мы извлечем имя человека, организации и города. Давайте начнем с необходимого импорта

#!pip install openai langchain
from langchain.chat_models import ChatOpenAI
from langchain.chains import create_extraction_chain
# Schema
schema = {
"properties": {
"name": {"type": "string"},
"city":{"type": "string"},
"organization":{"type":"string"}
}
}

Здесь схема относится к объектам, которые мы хотим извлечь в форме словаря.

# Run chain
llm = ChatOpenAI(openai_api_key=api_key)
chain = create_extraction_chain(schema, llm)

Далее мы загружаем объект LLM. Помните, что на этом этапе нам нужен api_key. Используйте схему и LLM в качестве параметра для передачи в create_extraction_chain().

Время для некоторых испытаний

inp = """Being working at Salesforce, Bengaluru, Ravi has earned a fortune for himself"""
print(chain.run(inp))
inp = 'Diksha heads the Marketing department at DBS, Singapore'
print(chain.run(inp))
inp = 'How is life in Hyderabad, Mehul?'
print(chain.run(inp))

Как вы можете заметить, мы успешно извлекли все сущности, присутствующие в тексте. Если вам нужны и другие объекты, укажите их в схеме.

Пожалуйста, прочитайте полный блог, где вы найдете руководства по разметке текста и обобщению !!

материалы по теме:

Новые материалы

Как развивается смешанно-целочисленное программирование, часть 7

Унифицированная техника раннего завершения для первично-двойственных алгоритмов в смешанно-целочисленном коническом программировании (arXiv) Автор : Ювэнь Чэнь , Кэтрин Нин , Поль Гулар..

Как научить модель Keras распознавать текст переменной длины

Я некоторое время играл с официальным примером Keras image_ocr.py и хочу поделиться своими выводами в этом посте. В официальном примере выполняется только обучение модели, но отсутствует..

Практическая пакетная нормализация

История начинается после использования инициализации He вместе с ELU (или любым вариантом ReLU) может значительно снизить опасность проблем с исчезающими/взрывающимися градиентами в начале..

Поэзия онлайн-кодирования: путешествие пикселей и страсти

В мире, наполненном инновациями, онлайн-обучение программированию становится холстом, на котором обретает форму полотно вашей мечты. Это больше, чем просто создание строк кода; это сродни..

Обработка изображений с помощью Python - размытие и повышение резкости для начинающих

Как применить ядра свертки к цветным изображениям? В этой статье мы обсудим, как применять ядра размытия и повышения резкости к изображениям. Эти базовые ядра составляют основу многих более..

Ограничение скорости в .NET Core 7 Web API

Что такое ограничение скорости? Ограничение скорости — это процесс, используемый для ограничения количества запросов, разрешенных для определенного ресурса в указанном временном окне. .NET..

Стабильная Diffusion 1.0 выдаёт более красивые картинки, чем SD 2.1?! Почему?

Удивительные открытия, которые я сделал недавно. Смотрите в видео: https://youtu.be/PakgD6FewoU Есть одно логичное объяснение — что у вас?

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Python Software Development Web Development Coding Deep Learning AI React Software Engineering Nodejs Front End Development Typescript Java Computer Science Development NLP Tech Programming Languages Algorithms Angular Python Programming HTML Javascript Tips ChatGPT Data Reactjs Developer API Code Data Visualization CSS Tutorial Neural Networks Computer Vision Statistics