ЧИТАЙТЕ ПОЛНЫЙ БЛОГ ЗДЕСЬ



Мы уже рассмотрели руководство по LangChains для начинающих о том, как создавать различные приложения с использованием инфраструктуры LangChain вместо LLM. Если вы пропустили это, мы предоставим вам все необходимое.

https://vteam.ai/blog/posts/beginners-guide-for-lang-chain

Итак, как вы, наверное, знаете, LangChain — это мощная платформа, построенная на основе больших языковых моделей (LLM), предназначенная для таких задач, как чат-боты, генеративные ответы на вопросы, обобщение и многое другое. Основная идея LangChain — «связать» вместе различные компоненты, создавая последовательности компонентов или подцепей для достижения конкретных задач. Эти компоненты включают в себя шаблоны подсказок, языковые модели и анализаторы вывода, которые гармонично работают для обработки пользовательского ввода, генерации ответов и обработки выходных данных. LangChain упрощает настройку таких моделей, как GPT-3, предоставляя API для быстрого проектирования, повышая доступность работы с LLM для различных приложений. Он упрощает интеграцию с различными типами моделей и интерфейсов, позволяя специалистам LLM принимать строки в качестве входных данных и создавать строки в качестве выходных данных, что ускоряет разработку приложений на основе больших языковых моделей.

В последнем уроке мы создали три разных приложения: проверку грамматики, смену тонов и языковой переводчик, коды для которых доступны в упомянутом выше сообщении блога. Немного усложняя задачу, мы перейдем к некоторым формулировкам проблем, связанных с НЛП, и к тому, как их реализовать с помощью LangChains и LLM. Но прежде чем переходить к кодам, давайте разберемся с несколькими фундаментальными понятиями, необходимыми для понимания этого руководства.

Распознавание именованных объектов (NER): NER включает идентификацию и классификацию именованных объектов (таких как имена людей, мест, организаций, даты и т. д.) в тексте. Пример: «Джонни живет во Флориде» — NER идентифицирует «Джонни» как ЧЕЛОВЕКА, а «Флориду» как GPE (геополитическую сущность).

Разметка текста. Разметка текста в системе обработки естественного языка (NLP) включает в себя присвоение определенных меток или тегов словам в текстовом корпусе для обозначения их грамматических или семантических свойств. Эти теги предоставляют информацию о части речи (существительное, глагол, прилагательное и т. д.) или других лингвистических характеристиках каждого слова.

LLM: Большие языковые модели (LLM) — это тип искусственного интеллекта, характеризующийся большим размером. Они обладают способностью обрабатывать и генерировать человеческие ответы на запросы на естественном языке. LLM обучаются на огромных объемах текстовых данных, часто взятых из Интернета, с использованием ускорителей искусственного интеллекта. Они используются в различных задачах обработки естественного языка и способны генерировать связный и контекстуально релевантный текст. Популярные примеры LLM включают BERT, GPT-3 и T5. Эти модели произвели революцию в обработке естественного языка, продемонстрировав способность генерировать человеческий текст и понимать контекст, что привело к применению в чат-ботах, генерации контента, переводе и т. д.

LangChains: LangChain — это платформа, предназначенная для упрощения создания приложений с использованием больших языковых моделей (LLM). Он позволяет объединять различные компоненты для создания расширенных вариантов использования LLM, таких как чат-боты, генеративные ответы на вопросы, обобщение и многое другое. LangChain предлагает стандартный интерфейс для построения цепочек моделей и интегрируется с различными инструментами. Это облегчает взаимодействие между цепочками и внешними источниками данных для генерации дополненных данных.

Урок 1. Распознавание именованного объекта

В этой короткой демонстрации мы извлечем имя человека, организации и города. Давайте начнем с необходимого импорта

#!pip install openai langchain
from langchain.chat_models import ChatOpenAI
from langchain.chains import create_extraction_chain
# Schema
schema = {
"properties": {
"name": {"type": "string"},
"city":{"type": "string"},
"organization":{"type":"string"}
}
}

Здесь схема относится к объектам, которые мы хотим извлечь в форме словаря.

# Run chain
llm = ChatOpenAI(openai_api_key=api_key)
chain = create_extraction_chain(schema, llm)

Далее мы загружаем объект LLM. Помните, что на этом этапе нам нужен api_key. Используйте схему и LLM в качестве параметра для передачи в create_extraction_chain().

Время для некоторых испытаний

inp = """Being working at Salesforce, Bengaluru, Ravi has earned a fortune for himself"""
print(chain.run(inp))
inp = 'Diksha heads the Marketing department at DBS, Singapore'
print(chain.run(inp))
inp = 'How is life in Hyderabad, Mehul?'
print(chain.run(inp))

Как вы можете заметить, мы успешно извлекли все сущности, присутствующие в тексте. Если вам нужны и другие объекты, укажите их в схеме.

Пожалуйста, прочитайте полный блог, где вы найдете руководства по разметке текста и обобщению !!