Инженер – Использование нейросетей в профессиональной деятельности и в быту (страница 3)
распознавание речи;
машинный перевод;
прогнозирование временных рядов (курсы валют, спрос);
генерация текста.
3.4. Трансформеры (Transformers)
Назначение: обработка естественного языка (NLP) и не только.
Ключевые особенности:
механизм внимания ($\text{attention}$) — оценивает важность разных частей входных данных;
высокая параллелизуемость — обучаются быстрее RNN;
масштабируемость — хорошо работают с большими объёмами данных.
Типичные задачи:
генерация текстов (ChatGPT, Yandex GPT);
суммаризация (краткое изложение статей);
ответы на вопросы (QA‑системы);
мультимодальные задачи (текст + изображение).
Примеры моделей: BERT, GPT, T5, Yandex GPT.
Назначение: генерация реалистичных данных.
Архитектура: состоят из двух конкурирующих сетей:
генератор ($\text{Generator}$) — создаёт новые данные (изображения, тексты);
дискриминатор ($\text{Discriminator}$) — отличает реальные данные от сгенерированных.
В процессе обучения генератор совершенствуется, пока дискриминатор не может отличить подделки от оригинала.
Типичные задачи:
создание фотореалистичных изображений;
увеличение разрешения (SRGAN);
перенос стиля (CycleGAN);
генерация видео и музыки.
Примеры: DALL‑E, Midjourney, Kandinsky.
Назначение: сжатие данных и обнаружение аномалий.
Архитектура: состоит из двух частей:
энкодер — сжимает входные данные в компактное представление;
декодер — восстанавливает исходные данные из сжатого кода.
Типичные задачи:
уменьшение размерности данных;
удаление шума из изображений или аудио;
обнаружение аномалий (выявление нетипичных транзакций);
предварительная обработка данных для других моделей.
3.7. Сети с долгой краткосрочной памятью (LSTM — Long Short‑Term Memory)
Назначение: анализ последовательностей с долгосрочными зависимостями.
Особенности:
специальные «ворота» ($\text{gates}$) регулируют поток информации;
сохраняют важные данные на длительных промежутках;
устойчивы к проблеме затухания градиента.
Типичные задачи:
прогнозирование погоды;
анализ финансовых временных рядов;
генерация музыкальных композиций;
распознавание рукописного текста.
3.8. Сравнительная таблица типов нейросетей
Тип сети
Основные задачи
Преимущества
Недостатки
CNN
Обработка изображений
Эффективны для пространственных данных, инвариантны к сдвигам
Плохо работают с последовательностями
RNN/LSTM
Анализ последовательностей
Учитывают контекст, подходят для временных рядов
Медленное обучение, проблема затухания градиента
Трансформеры
NLP, мультимодальные задачи
Высокая точность, параллелизуемость