Денис Соломатин – Искусственный интеллект от А до Б (страница 20)

Шрифт

Новые возможности ИИ не только увеличили спрос на приложения ИИ, но и снизили входной барьер для разработчиков. Начать создание приложений ИИ стало очень просто. Можно даже создать приложение, не написав ни одной строки кода. Этот сдвиг превратил ИИ из специализированной дисциплины в мощный инструмент разработки, которым может пользоваться каждый.

Несмотря на то, что внедрение ИИ сегодня кажется новым, оно основано на методах, которые существуют уже некоторое время. Статьи о моделировании языков вышли еще в 1950-х годах. Приложения с расширенной генерацией поиска (RAG) построены на технологии поиска, которая использовалась в поисковых и рекомендательных системах задолго до того, как был придуман термин RAG. Рекомендации по развертыванию традиционных приложений машинного обучения – систематическое экспериментирование, тщательная оценка, неустанная оптимизация для более быстрых и дешевых моделей – по-прежнему остаются лучшими практиками для работы с приложениями на основе базовых моделей.

Знакомость и простота использования многих методов инженерии ИИ могут ввести людей в заблуждение, заставив их думать, что в инженерии ИИ нет ничего нового. Но в то время, как многие принципы создания приложений ИИ остаются прежними, масштаб и расширенные возможности модели ИИ открывают возможности и создают проблемы, требующие новых решений. В этой главе представлена основа для адаптации базовых моделей, которые включают в себя как большие языковые модели (LLM), так и большие мультимодальные модели (LMM), к конкретным приложениям.

Существует множество различных способов создания приложения. В этой книге описываются различные решения, а также поднимаются вопросы, которые вы можете задать, чтобы оценить наилучшее решение для ваших нужд. Вот некоторые из многих вопросов, на которые эта книга может помочь вам ответить: стоит ли создавать это приложение с искусственным интеллектом? Как оценить мою заявку? Могу ли использовать ИИ для оценки результатов ИИ? Что вызывает галлюцинации? Как обнаружить и смягчить галлюцинации? Каковы лучшие практики для оперативного проектирования? Почему RAG работает? Какие существуют стратегии проведения RAG? Что такое агент? Как создать и оценить агента? Когда следует выполнять тонкую настройку модели? Когда не следует выполнять тонкую настройку модели? Какой объем данных мне нужен? Как проверить качество данных? Как сделать модель быстрее, дешевле и безопаснее? Как создать цикл обратной связи, чтобы постоянно улучшать мое приложение?

Книга в целом также поможет вам сориентироваться в ошеломляющем ландшафте искусственного интеллекта: типах моделей, оценочных тестах и, казалось бы, бесконечном количестве вариантов использования и шаблонов приложений.

Содержание этой книги проиллюстрировано с помощью тематических исследований, тщательно изучено экспертами из самых разных областей.

Инструменты быстро устаревают, но теоретические основы должны служить дольше.

DMLS фокусируется на создании приложений на основе традиционных моделей машинного обучения, что включает в себя больше табличных аннотаций данных, проектирование признаков и обучение моделей. AIE специализируется на создании приложений на основе моделей фундаментов, что включает в себя более быстрое проектирование, построение контекста и точную настройку с эффективностью параметров. Обе книги являются самостоятельными и модульными, поэтому вы можете читать любую из них по отдельности.

Поскольку базовые модели являются моделями машинного обучения, некоторые концепции имеют отношение к работе с обеими моделями. Если тема имеет отношение к AIE, но широко обсуждалась в DMLS, она все равно будет освещена в этой книге, но в меньшей степени, с указанием соответствующих ресурсов.

Обратите внимание, что многие темы рассматриваются в DMLS, но не в AIE, и наоборот. В первой главе этой книги также рассматриваются различия между традиционной инженерией машинного обучения и инженерией искусственного интеллекта. Реальная система часто включает в себя как традиционные модели машинного обучения, так и базовые модели, поэтому часто необходимы знания о работе с обеими моделями.

Однако определить, прослужит ли что-то долго, часто бывает непросто. Во-первых, что касается проблемы, как определить, является ли она результатом фундаментальных ограничений работы ИИ или она исчезнет с более совершенными моделями. Во-вторых, можно консультироваться с обширной сетью исследователей и инженеров, которые умнее, о том, что они считают наиболее важными проблемами и решениями.

Иногда можно полагаться на закон Линди, который предполагает, что ожидаемая продолжительность жизни технологии в будущем пропорциональна ее текущему возрасту. Так что, если что-то существует какое-то время, то это будет существовать еще какое-то время.

Несмотря на то, что можно создавать приложения на основе базовых моделей без опыта в области машинного обучения, базовое понимание машинного обучения и статистики может помочь вам создавать более качественные приложения и избавить вас от ненужных страданий. Вы можете прочитать эту книгу без какого-либо предварительного опыта в области машинного обучения. Тем не менее, вы будете более эффективны при создании приложений ИИ, если будете знать следующие концепции: вероятностные концепции, такие как выборка, детерминизм и распределение; концепции машинного обучения, такие как супервизия, самоконтроль, логарифмическое правдоподобие, градиентный спуск, обратное распространение, функция потерь и настройка гиперпараметров; различные архитектуры нейронных сетей, включая с прямой связью, рекуррентные и трансформаторные; такие метрики, как точность, F1, точность, полнота, косинусное сходство и пересечение, энтропия. Если вы еще не знакомы с ними, не волнуйтесь – в этой книге есть либо краткие, высокоуровневые объяснения, либо указатели на ресурсы, которые могут помочь вам быстро войти в курс дела.

Эта книга предназначена для всех, кто хочет использовать базовые модели для решения реальных проблем. Это техническая книга, поэтому язык этой книги ориентирован на технические роли, включая инженеров по искусственному интеллекту, инженеров по машинному обучению, специалистов по обработке и анализу данных, менеджеров по инженерам и технических менеджеров по продуктам. Эта книга для вас, если вы можете соотнести себя с одним из следующих сценариев: Вы создаете или оптимизируете приложение ИИ, независимо от того, начинаете ли вы с нуля или хотите перейти от этапа демонстрации к этапу подготовки к производству. Вы также можете столкнуться с такими проблемами, как галлюцинации, безопасность, задержка или затраты, и нуждаетесь в целенаправленных решениях. Вы хотите оптимизировать процесс разработки ИИ в своей команде, сделав его более систематическим, быстрым и надежным. Вы хотите понять, как ваша организация может использовать базовые модели для улучшения итоговых показателей бизнеса и как создать команду для этого.

Вы также можете извлечь пользу из книги, если принадлежите к одной из следующих групп: Разработчики инструментов, которые хотят определить недостаточно обслуживаемые области в инженерии ИИ, чтобы позиционировать свои продукты в экосистеме. Исследователи, которые хотят лучше понять варианты использования ИИ. Кандидаты на работу, которым нужна ясность в отношении навыков, необходимых для продолжения карьеры инженера по искусственному интеллекту. Всем, кто хочет лучше понять возможности и ограничения ИИ, а также то, как он может повлиять на различные роли.

Некоторые разделы погружаются немного глубже в техническую сторону. Хотя многим ранним читателям нравятся детали, они могут быть не для всех. Не стесняйтесь пропустить вперед, если вы чувствуете себя слишком запутавшимся. Книга структурирована таким образом, чтобы следовать типичному процессу разработки приложения ИИ.

Вот как выглядит этот типичный процесс и как каждая глава вписывается в него. Поскольку эта книга является модульной, вы можете пропустить любой раздел, с которым вы уже знакомы или который менее актуален для вас.

Прежде чем принять решение о создании приложения ИИ, необходимо понять, что включает в себя этот процесс, и ответить на такие вопросы, как: необходимо ли это приложение? Нужен ли ИИ? Нужно ли создавать это приложение самостоятельно? Хотя опыт машинного обучения не является необходимым для создания приложений ИИ, понимание того, как работает базовая модель, полезно для получения максимальной отдачи от нее. Далее анализируется создание базовой модели и проектные решения, оказывающие значительное влияние на последующие приложения, включая рецепт обучающих данных, архитектуру и масштабы модели, а также то, как модель обучается в соответствии с предпочтениями человека. Затем обсуждается, как модель генерирует ответ, который помогает объяснить кажущееся непонятным поведение модели, такое как непоследовательность и галлюцинации. Изменение настроек поколения модели также часто является дешевым и простым способом значительно повысить производительность модели. После того как вы приступили к созданию приложения на основе базовых моделей, оценка будет неотъемлемой частью каждого шага на этом пути. Оценка – одна из самых сложных, если не самая сложная задача в области разработки искусственного интеллекта. Качество ответа модели зависит от следующих аспектов (помимо настройки генерации модели): инструкция о том, как должна вести себя модель; контекст, который модель может использовать для ответа на запрос; сама модель. Благодаря наличию множества фреймворков тонкой настройки, сам процесс тонкой настройки часто бывает простым. Однако получить данные для тонкой настройки сложно.

19 20 21 22 Вперед