Игорь Шнуренко – Демон внутри. Анатомия искусственного интеллекта (страница 64)

Шрифт

Модели, основанные на принципе статистической семантики, строят предложения по ассоциациям, а не по смыслу, поэтому приложение их для понимания ограничено. Однако с их помощью легче достичь результата, если иметь очень много данных —и с этими данными просто работать, ведь их не нужно предварительно обрабатывать или размечать.

Но все же конечная цель NLP — это понимание речи, поэтому все чаще применяются другие подходы.

Например, в семантике фреймов алгоритмы разбирают предложения по кирпичикам, выделяя слова, которые отвечают на вопросы кто, что, где, когда, а также существительные и глаголы. Например, если попросить Алексу: «Найди грузинское кафе в центре на завтра», алгоритм разобьет фразу на части: действие —что сделать (найти), что (грузинское кафе), когда (в пятницу) и где (в центре). Алгоритм различает простейшие фрагменты информации, что позволяет модели отвечать на простые вопросы или запросы. Это можно использовать для создания чатботов и голосовых помощников.

Фреймовые модели могут обрабатывать простые предложения и, таким образом, показывают элементы понимания текста, на котором учатся. Впрочем, они не улавливают нюансы, лишены гибкости и для обучения им нужны большие массивы данных под каждый конкретный запрос.

Третий подход называется теоретико-модальная семантика. Основана она на идее, что человеческие знания можно закодировать в виде логических правил. Если модель знает, что птицы могут летать, а орлы — это птицы, то она сама делает вывод, что орлы летают. Когда-то, на заре машинного обучения, за таким методом видели большое будущее, но вскоре убедились, что язык не так логичен, как кажется, и из каждого правила есть много исключений. Например, курица хоть и птица, но с полетами у нее проблемы, а летают, кроме птиц, самолеты и даже люди — космонавты.

Сейчас модели, основанные на этом подходе, используются для работы с базами данных, где информация уже упорядочена. Тогда модель может разбить предложение на части и дать ответ, исходя из логических правил, применимых к каждой из частей. Если взять вопрос «В какой стране мира было меньше всего убийств по неосторожности на душу населения в прошлом году?», алгоритм разделит его на серию отдельных запросов: «Какие есть страны мира?», «Какие бывают виды убийств?», «Сколько убийств по неосторожности было в таком-то году по странам?» и так далее. Алгоритм последовательно задает вопросы, обращаясь к базам данных, пока не получит окончательный ответ.

Такой метод позволяет отвечать на сложные запросы, хотя требует серьезной подготовки с представлением знаний. Если вопрос сформулирован неточно или выходит за рамки имеющихся данных, модель не работает.

Самый перспективный подход в машинной обработке естественных языков — это низкоуровневая семантика. Обучение нейросети идет так же, как человек учится языку в течение своей жизни: с нуля. Через разговор и наблюдение за действием модель учится подбирать слова и правильно их использовать. Это напоминает популярную игру в крокодила, когда участники должны по движениям догадаться, что перед ними изображают. Например, компьютеру дают команду: «Переместить красный куб влево», а затем показывают, что имеется в виду. Со временем машина поймет значение слов в этой команде и научится выполнять ее самостоятельно.

Исследователи считают, что именно так, через действие и взаимодействие, человек создает и меняет язык, вводя туда новые слова и понятия. Истинное понимание языка невозможно без понимания целей, которых нужно достичь, поэтому этот алгоритм очень близок к нашему восприятию мира.

Впрочем, пока что методы низкоуровневой семантики применяются в обучении нейросетей редко, потому что отнимают слишком много времени, да и не все фразы так легко проиллюстрировать, как команду переставить куб. Проверенным подходом остается модель распределительной семантики, и в ближайшем будущем все достижения NLP, скорей всего, будут связаны с ним. Однако у этого подхода, в сущности, не эвристического, а чисто статистического, есть предел. Для достижения качественного скачка исследователям придется работать с куда более сложными моделями.

АНТРОПОЦЕНТРИЗМ

Мы очень любим бинарные вопросы, и один из них звучит так: «Сможет ли машина заменить писателя?» Сразу предполагается и ответ: «Нет, не сможет», ибо мало того, что мы считаем себя неповторимыми, мы уверены и в том, что Искусственный Интеллект как наше создание будет всегда нуждаться в нашей опеке, что без нашего программирования он не сможет функционировать, что мы всегда сможем управлять им, а в крайнем случае просто выдернем штепсель из розетки.

Наш врожденный антропоцентризм на уровне инстинкта вынуждает нас противопоставлять себя миру —как возникшему без нашего участия, так и созданному нами самими. Мы склонны отделять машину от человека — хотя она уже давно стала частью нашего коллективного разума, если угодно, коллективного человеко-машинного интеллекта.

Социологи и социобиологи обычно понимают под коллективным интеллектом некий консенсус разумов или консенсусный разум, возникающий при совместных действиях групп людей. Часто в том же духе говорят о животных, например о пчелах или муравьях. Они ставят цели, распределяют роли и делают свою работу настолько слаженно, что бизнес-коучи любят приводить их командную работу в пример. Но давно пора включить в «разумный» консенсус и то, что называют «искусственным интеллектом» —во всяком случае, пока машина нам подчиняется (когда перестанет, не будет и консенсуса).

Итак, коллективный интеллект — это консенсус, возникающий в ходе взаимодействия людей и «интеллектуальных машин». Мы отказываем последним в собственном разуме, но подчиняемся принятыми ими решениям. Без них уже сегодня не могут функционировать ни государство, ни бизнес. Коллективный разум — это, например, биржа, с ее тысячами трейдеров и брокеров, которые срослись с мониторами и дают задания ботам, работающим без устали день и ночь. Кто биржевики как не киборги, машинолюди, кентавры, подключенные к трейдинговым сетям?

Другой пример коллективного разума — это «Википедия», где при помощи машины кристаллизуется труд и знания тысяч постоянных авторов-людей. Появятся ли среди них в будущем боты — вопрос открытый, но и сейчас работа над статьями для «Википедии» не обходится без искусственного интеллекта, к помощи которого авторы, желая того или нет, прибегают в поиске и анализе информации.

ТРУДНОСТИ СЕПУЛЯЦИИ

Итак, когда мы говорим о «машине» или «Искусственном интеллекте», мы имеем в виду коллективный интеллект людей и машин. Впрочем, конечному пользователю все равно, что происходит внутри системы, во всех хитросплетениях которой разберется разве что сам искусственный интеллект. Для индустрий, в том числе книготорговой и издательской, Искин — это черный ящик, принимающий решения, которые до него принимали люди. Очень удобно переложить ответственность на черный ящик, решения которого не верифицируемы и не подлежат исправлению, даже если они нам не нравятся. На любые вопросы есть ответ: мы пользуемся Искином, потому что его решения, как нам сказали, эффективнее.

Если при управлении самолетом автопилот, получающий указания от Искина, выдает странные решения, то воздушное судно может быть не допущено к полетам — ведь на кону жизнь людей. При этом причины, по которым Искин скомандовал самолету резко пойти носом вниз, так и останутся неизвестными — ведь машина обрабатывает огромный массив информации, и решающим фактором может стать что угодно. Наука о психологии поведения ИИ еще не создана, так что вместо объяснения мы можем просто сказать «машина сошла с ума», и этого будет довольно.

Конечно, можно в принципе создать Искин, который будет способен к самопознанию — в отличие от человека, который закрыт сам от себя и не знает, как именно он приобретает свое знание. Ничто внутри Искина не укроется от него самого, но даже если так, сможет ли он дать нам это знание в форме, которая была бы понятна нам?

Так или иначе, если Искин определяет деятельность издательства, то оснований вмешиваться в его деятельность у людей куда меньше, чем в случае с Искином системы управления самолетом или автомобилем: ведь в первом случае речь не идет о непосредственном риске для жизни. Если системам с Пекином все чаще доверяется безопасность пассажиров и мы не видим горячей общественной дискуссии по этому поводу, значит, этичность вмешательства Пекина в процесс написания, издания и распространения книг никто не будет оспаривать и подавно. То же самое относится к другим креативным отраслям: музыке, кино и другим искусствам. Можно привести множество сомнений по поводу вмешательства в творческие процессы бездушной машины, но постольку, поскольку эти отрасли монетизируются и являются рыночными, нет принципиальных отличий между производством повестей и выпуском стали: и то и другое подсчитывается количественно и может быть оптимизировано, а следовательно, подвластно воздействию алгоритмов.

ТРЕУГОЛЬНИК РЫНКА

Чтобы понять, как технологии Пекина изменят книгоиздательство и книготорговлю, рассмотрим треугольник издатель-писатель-ИИ (искусственный интеллект).

63 64 65 66 Вперед