реклама
Бургер менюБургер меню

Слушать книги Антон Белявский (1)

На этой странице Вы можете бесплатно слушать аудиокниги Антон Белявский онлайн. Также Вы найдете и других авторов книг схожих с Антон Белявский

Последние
Антон Белявский - Проблема фрагментарной когерентности в генеративных языковых моделях при обработке протяженных контекстов: архитектурные и методологические решения
Антон Белявский - Проблема фрагментарной когерентности в генеративных языковых моделях при обработке протяженных контекстов: архитектурные и методологические решения
В докладе рассматривается проблема фрагментарной когерентности (FCP) в больших языковых моделях (LLM), таких как DeepSeek, при работе с объёмными документами. FCP проявляется в том, что модель, вместо того чтобы целостно перерабатывать текст, генерирует разрозненные фрагменты, возлагая задачу их интеграции на пользователя. Анализируются основные причины: архитектурные ограничения механизма внимания, акцент на локальном контексте и неадаптированность обучения для сложного редактирования. Предлагается многоуровневое решение, которое включает архитектурные новшества (иерархическое внимание, динамическая память), методологии работы (стратегическое чанкирование, мастер-промпты) и новые подходы к обучению (RL для глобальной когерентности). Доклад завершается протоколом для эмпирической проверки методов.

Электронные книги (1)

Антон Белявский - Проблема фрагментарной когерентности в генеративных языковых моделях при обработке протяженных контекстов: архитектурные и методологические решения
Антон Белявский - Проблема фрагментарной когерентности в генеративных языковых моделях при обработке протяженных контекстов: архитектурные и методологические решения
В докладе рассматривается проблема фрагментарной когерентности (FCP) в больших языковых моделях (LLM), таких как DeepSeek, при работе с объемными документами. FCP проявляется в том, что модель генерирует разрозненные фрагменты, вместо того чтобы целостно переработать текст, что заставляет пользователя заниматься их интеграцией. Анализируются основные причины: архитектурные ограничения механизма внимания, акцент на локальном контексте и неподходящие методики обучения для сложного редактирования. Предлагается многоуровневое решение, которое включает архитектурные инновации (иерархическое внимание, динамическая память), подходы к работе (стратегическое чанкирование, мастер-промпты) и новые методы обучения (RL для глобальной когерентности). Доклад завершается протоколом для эмпирической валидации предложенных методов.