RAG и генеративный ИИ. Создаем собственные RAG-пайплайны с помощью Llamalndex, Deep Lake и Pinec

Дэнис Ротман

Обложка:


Ключевые темы книги
Глава 1: Почему именно генерация с дополненной выборкой

В первой главе автор знакомит читателя с базовыми концепциями RAG, подчеркивает ее адаптируемость под различные типы данных и разбирает сложности интеграции фреймворка RAG в существующие ИИ-платформы. К ее концу вы уже будете хорошо понимать, что такое RAG, приобретете практический опыт создания различных конфигураций для простых, продвинутых и модульных систем RAG с помощью Python и будете готовы к более сложным случаям их применения, рассматриваемым в последующих главах.

Глава 2: Сохранение эмбеддингов RAG с помощью Deep Lake и OpenAI

Здесь рассматривается процесс преобразования сырых данных в структурированные векторные хранилища. Автор показывает, как использовать модели Activeloop Deep Lake и OpenAI для создания и управления эмбеддингами. Читатель научится строить масштабируемые мультимодальные пайплайны RAG на Python, разделяя экосистему RAG на независимые компоненты для эффективной обработки больших датасетов с использованием продвинутых возможностей извлечения данных, что позволит улучшить результаты выдачи генеративных ИИ-моделей с помощью встраиваемых векторов документов.

Глава 3: Реализация индексированной RAG с помощью LlamaIndex, Deep Lake и OpenAI

Эта глава посвящена повышению точности и скорости работы моделей ИИ за счет индексирования. Интеграция в системы LlamaIndex, Deep Lake и OpenAI позволяет создавать трассируемые пайплайны. На примерах демонстрируется, как оптимизировать извлечение релевантной информации и улучшать качество выдаваемых результатов.

Глава 4: Мультимодальная RAG

Автор поднимает планку, переходя от текстовых данных к мультимодальным решениям при помощи фреймворка RAG, созданного специально для технологических решений в сфере беспилотных летательных аппаратов. Здесь начинается разработка системы генеративного ИИ, которая обрабатывает текстовую информацию и включает в себя продвинутые возможности распознавания изображений. Используя LlamaIndex, Deep Lake, OpenAI, читатель научится создавать мультимодальные системы RAG на базе Python, способные генерировать развернутые ответы на запрсы с учетом контекста.

Глава 5: Повышение эффективности RAG за счет обратной связи от эксперта

В этой главе описывается адаптивная RAG, где обратная связь от человека интегрируется в цикл обучения. На Python создается гибридная система, которая непрерывно уточняет данные, повышая релевантность и точность ответов.

Глава 6: Масштабирование банковских данных клиентов в системе RAG с помощью Pinecone

Практический кейс: разработка рекомендательной системы для снижения оттока клиентов банка, начиная с получения и анализа данных на примере датасета Kaggle. Читатель научится создавать эмбеддинги и обновлять/вставлять большие объемы данных через Pinecone и OpenAI, разработав рекомендательную систему с использованием GPT-4o.

Глава 7: Создание масштабируемой RAG на основе графа знаний с помощью API Википедии и LlamaIndex

Здесь читатель ознакомится с разработкой трех пайплайнов: сбора данных из Википедии, заполнения векторной БД Deep Lake и реализации RAG на основе индексируемого графа знаний. Глава охватывает автоматизирование извлечения и подготовку данных, создание и опрос граф знаний для визуализации сложных связей между этими данными, а также улучшение генерируемых ИИ ответов структурированной информацией.

Глава 8: Динамические RAG с помощью Chroma и Hugging Face Llama

Используя Chroma и Hugging Face Llama, автор объясняет, как создавать и управлять временными датасетами, обеспечивая высокую точность и актуальность информации.

Глава 9: Улучшение моделей ИИ: тонкая настройка данных RAG и обратная связь

Глава посвящена техникам тонкой настройки, используемым для систематизации данных RAG. В ней акцент будет сделан на том, как трансформировать обширные, непараметрические, сырые данные в более управляемый параметрический формат с обучаемыми весами, подходящий для непрерывного взаимодействия с ИИ.

Глава 10: RAG для создания стоковых видео с помощью Pinecone и OpenAI

Финальная глава посвящена интеграции RAG в генерацию видеоконтента. Читатель узнает, как OpenAI и Pinecone могут использоваться для автоматического создания, комментирования и разметки видео, расширяя творческие возможности за счет ИИ.