Клуб 4CIO – Искусственный интеллект (страница 4)
Функция потерь – представляет собой меру расхождения между реальными и предсказанными результатами. Она помогает оценить качество работы модели на основе входных данных и ожидаемых выходных данных. Чем меньше значение функции потерь, тем лучше работает модель.
Функция активации – определяет результат работы нейрона; преобразует выходной сигнал нейрона в определенный результат. Примеры: ReLU, sigmoid, tanh и другие.
Обратное распространение ошибки – процесс, обеспечивающий корректировку весов и смещений нейронов на основе значений функции потерь.
Метрика оценки – критерий, который определяет, насколько хорошо сеть выполняет свою задачу. Таким критерием может служить функция потерь, но также могут использоваться метрики вроде точности, F1-мера и другие.
Состав слоёв ИНС:
Входной слой – принимает входные данные для анализа. Входные данные могут быть любыми, от изображений до текстовых данных. Этот слой обычно преобразует входящие данные в форму, удобную для дальнейшей обработки сетью.
Скрытые слои – промежуточные слои, выполняющие основную обработку данных. Скрытые слои могут быть одного или нескольких типов. Они выполняют сложные преобразования входных данных, чтобы подготовить их для выходного слоя. Количество скрытых слоев и количество нейронов в каждом слое зависят от сложности решаемой задачи и архитектуры сети.
Выходной слой – выдаёт результат работы сети, например, предсказание или классификацию. Выходной слой может иметь один или несколько нейронов, в зависимости от задачи, которую решает ИНС.
Также стоит отметить, что некоторые ИНС могут содержать дополнительные слои:
Блок нормализации – используется для приведения входных данных к стандартному диапазону значений, что облегчает последующую обработку сети.
Дескрипторные слои (Embedding Layers) – в случае обработки текста или других структурированных данных, эти слои преобразуют исходные данные в векторное представление, которое затем обрабатывается остальной частью сети.
Подготовка к последовательной обработке (Recurrent Neural Networks) – такие слои используются в рекуррентных нейронных сетях (RNN) для хранения состояния сети и учета контекста предыдущих временных шагов.
Дополнительные слои являются специфическими для определенных типов задач и архитектур сетей, и их использование зависит от конкретного приложения
Классификация ИИ
Известно множество разных вариантов классификации ИИ. Однако мы предлагаем еще один вариант. Согласно рекомендованному определению, ИИ – это результат процесса автоматизации построения алгоритма и его отображения на архитектуру ЭВМ в виде программы. Математическим обоснованием сходимости и устойчивости процесса автоматизации является теорема А.Н. Тихонова о неподвижных точках отображения на упорядоченных ограниченных множествах. Как только мы примем за основу для дальнейших рассуждений, что ИИ – это программа, то у нас появится возможность построить классификацию ИИ по степени сложности программ, где под сложностью понимается рост количества и разнообразия компонентов программы и их взаимодействий между собой. При этом, по мере усложнения, программы объединяются в платформы. Платформы как и программы получают свою специализацию: платформы разработки, платформы безопасности, платформы автоматизации операций непрерывной интеграции и развертывания, платформы автоматизации процессов эксплуатации и контроля качества.
На основе этих утверждений предлагаются следующие классификаторы:
Методы и модели
ИИ-системы.
ИИ-платформы.
Подотчетные платформы.
Методы и модели
Методы обучения и полученные в результате модели используются для решения конкретных задач. Приведем обобщенную классификацию методов обучения и получаемых моделей. В основу классификации моделей и методов легли материалы ресурса machinelearning.ru (создатель ресурса – Константин Воронцов).
Категория “Методы и модели” изображена на Рисунке 2.
Supervised learning
Основные задачи, решаемые с помощью Supervised learning:
●
Классификация. Это задача, в которой модель должна дать ответ (да/нет) на принадлежность заданной категории (классу) для каждого примера. Например, определение, является ли электронное письмо спамом или нет.
●
Многоклассовая классификация. Это разновидность классификации, в которой модель должна предсказать одну из нескольких возможных категорий. Например, распознавание рукописных цифр от 0 до 9.
●
Регрессия. Это задача, в которой модель должна предсказать непрерывное значение. Например, прогнозирование цены на жилье на основе различных характеристик, таких как площадь, количество комнат и расположение.
Для успешного применения Supervised learning требуется наличие большого количества данных со сбалансированной разметкой, что может вызвать сложности с подготовкой эффективного обучения.
Unsupervised learning
Основные задачи, решаемые с помощью Unsupervised learning:
●
Кластеризация. Это задача, в которой модель группирует данные в кластеры на основе их сходства. Например, группировка клиентов магазина по их покупательским предпочтениям.
●
Выявление аномалий. Это задача, в которой модель обнаруживает необычные или аномальные наблюдения в данных. Это может быть полезно для обнаружения мошенничества или технических проблем.
●
Ассоциативные правила – задача, в которой модель находит правила, описывающие связи между различными объектами в данных. Например, анализ покупок в супермаркете для выявления товаров, которые часто покупают вместе.
Unsupervised learning может быть полезным в ситуациях, когда разметка данных невозможна или слишком трудоемка, однако этот метод может потребовать больше времени и усилий для настройки и интерпретации результатов.
Semi-supervised learning
Задачи, решаемые с помощью Semi-supervised learning:
●
Улучшение качества обучения. Добавление небольшого количества размеченных данных к большому количеству неразмеченных данных может значительно повысить точность модели по сравнению с обучением только на неразмеченных данных.
●
Снижение затрат на разметку данных. Использование неразмеченных данных позволяет сократить затраты на ручную разметку данных, которая может быть дорогостоящей и трудоемкой.
●
Адаптация к новым данным. Модель, обученная на комбинации размеченных и неразмеченных данных, может лучше адаптироваться к новым, ранее не виденным данным.
Semi-supervised learning находит применение в различных областях, включая обработку изображений, анализ текстов и биоинформатику, где ручная разметка данных может быть сложной или невозможной.
Reinforcement learning
Задачи, решаемые с помощью Reinforcement learning:
●
Автоматическое управление. Это обучение роботов и автономных транспортных средств принимать решения в реальном времени на основе обратной связи от среды.
●
Игры и стратегические задачи. Это создание алгоритмов, способных играть в сложные игры (например, шахматы) или решать стратегические задачи, такие как управление ресурсами.
●
Оптимизация процессов. Это использование приложений со встроенными механизмами Reinforcement learning для оптимизации производственных процессов, логистики и управления запасами.