Ричард Йонк – Сердце машины. Наше будущее в эру эмоционального искусственного интеллекта (страница 11)
Именно это усовершенствование в геометрической прогрессии приведет к тому, что в грядущие десятилетия технология искусственного интеллекта совершит гигантский скачок вперед. Эти исследования станут настолько значительными, что мы окажемся перед фактом: интеллектуальному превосходству людей брошен вызов. Проще говоря, мы можем не удержаться на вершине разума.
В течение последних десятилетий к проблеме искусственного интеллекта применялись многочисленные подходы, например перцептроны, простые нейронные сети, экспертные системы на основе дерева принятия решений, алгоритм имитация отжига и байесовские сети. Каждый из них был по-своему успешен и носил прикладной характер, но спустя время стало ясно, что ни один из этих подходов даже не приблизился к искусственному интеллекту уровня человека.
Такой была ситуация, когда молодой инженер по вычислительной технике по имени Розалинд Пикард поступила на работу в междисциплинарную исследовательскую лабораторию Массачусетского технологического института в 1987 году. Вначале она работала ассистентом преподавателя и научным сотрудником, а в 1991 году заняла должность штатного сотрудника в группе по разработке машинного распознавания образов и моделированию. Пикард преподавала и работала над рядом новых технологий и инженерных задач, включая разработку методов распознавания образов, математического моделирования, машинного зрения, изучения восприятия и обработки сигналов. Получив степень по электротехническому проектированию, а позже по информатике, Пикард уже внесла значительный вклад в развитие некоторых из этих направлений.
Но именно работа Пикард по разработке технологии моделирования образов и систем поиска по содержимому привела ее в направлении, неожиданном для многих и для нее самой. В этих системах ряд математических моделей используется для приближения к системам биологического зрения, наподобие того, как мы «извлекаем» из обстановки (например, фильма или реальной жизни) предметы, содержание и смысл. Система, которую вместе со своей командой разработала Пикард, была одной из первых трех систем в мире и прототипом таких современных систем, как Google Images.
Система, основанная только на жестких правилах, не может быть устойчивой.
Чтобы лучше понимать, как мозг обрабатывает изображения, Пикард сотрудничала с учеными, исследовавшими зрительную зону коры головного мозга человека. Но даже когда имитация человеческого зрения была освоена, остались серьезные проблемы, от решения которых зависела стабильная и надежная работа системы. Было недостаточно просто создать фильтры для выделения сцен или жестко задать правила, описывающие, как выглядит тигр, стул или машина. Линии размываются. Цвета и текстуры накладываются друг на друга. Тени исчезают. Поэтому система, основанная только на жестких правилах, не может быть устойчивой. Такие системы программного обеспечения называют нестабильными, поскольку имеют ограниченное применение в жизни. Нестабильность – очень подходящее название; получая новые условия или непонятную информацию на входе, система просто ломается.
Именно в ходе этой работы Пикард поняла, что многие системы, над которыми она работала, могли быть более эффективными, если бы только удалось узнать, куда направить их внимание. Глядя на изображение, мы не фокусируем внимание с одинаковым интересом на всем, что видим. Мы рассматриваем один элемент, а потом другой. Направление взгляда и фокус внимания смещаются к тому, что нас интересует: цвет, контраст, узор. Пикард предположила, что если бы удалось смоделировать внимание, это помогло бы ее группе решить некоторые задачи. Однако для этого требовалось нечто близкое к системе биологического зрения, что могло активно различать объекты и определять важные. Как объясняет Пикард:
Чувства определяют многое из того, что мы воспринимаем. Они указывают нашим глазам, куда смотреть. Определяют, что нам делать, что мы выбираем делать, чему уделить внимание. И я поняла, что компьютерам кое-чего не хватает. Компьютеры воспринимают каждый фотон на входе одинаково. Каждый бит информации для них одинаков. Они не ощущали, что какой-то бит был более значимым, чем остальные. Собственно говоря, у них вообще не было никаких чувств насчет какого бы то ни было значения, и я подумала: «Если они собираются нам помогать, а для нас некоторые биты более значимы, чем остальные, тогда им [компьютерам] нужна функция оценки, которая говорит, что некоторые вещи более ценны, чем другие.
В качестве примера того, как наши чувства влияют на зрение и внимание, Пикард рассказывает историю о своем друге, с которым она начинала работать в Лабораториях Белла и который занимался разработкой системы сжатия видеоинформации в рамках работы над докторской диссертацией. Он уже знал, что комиссия, которой он собирался демонстрировать свой новый метод, состояла из трех мужчин. Итак, он сделал видеоролик с пышногрудой девушкой из группы поддержки, зная наверняка, куда именно будет смотреть комиссия. В этой области он сохранил резкость и сильно сжал все остальные области, на которые комиссия не смотрела, создав при этом множество всевозможных дефектов и искажений. Несмотря на все визуальные недостатки изображения, никто ничего не заметил, и комиссия оценила метод сжатия на отлично. Пикард радостно делает заключение: «Теперь это эмоциональный интеллект!»
Тем не менее создать такую разновидность эмоционального интеллекта было крайне сложно. Компьютер мог обнаружить в изображении линии и границы, но распознать и распределить объекты по категориям в зависимости от их важности было принципиально иной задачей. Оставался вопрос: как мы решаем, что имеет значение, когда рассматриваем изображение?
В 1991 году, в свой первый год работы в Массачусетском технологическом институте, Пикард прочла статью на первой полосе
Исследование продвигалось, и Пикард обнаружила, что сталкивается с проблемами, которые показывают, насколько ограниченным был ее прежний подход. Она сотрудничала с учеными, исследовавшими зрение, и изучала и моделировала визуальную область коры головного мозга, тот участок, который отвечает за обработку зрительной информации. Подход был в чем-то полезен, но системы все равно не выполняли того, что требовалось, и в процессе работы возникли дополнительные вопросы. Например, откуда мы знаем, на что следует обратить внимание? Почему один объект или фигура интересует нас в один момент времени и совершенно не интересует в другой? Или, как в случае с Эллиотом после операции, как наше разум
Другая работа в области цифровой обработки информации заставила Пикард задать те же вопросы о мотивации и расстановке приоритетов. Конечно, можно было создать системы, которые бы проходили последовательность жестко заданных шагов, устанавливая фильтры и определяя степень важности различных элементов, но такие подходы не работали, если на входе оказывалась необычная или неожиданная информация. Программное обеспечение по-прежнему было слишком нестабильным. Она считала, что нужен другой подход, чтобы повысить стабильность и адаптивность системы и сделать ее устойчивой.
Как-то во время рождественских каникул Пикард читала книгу «Человек, который пробовал формы на вкус» (The
Молодой профессор уже тогда интересовалась процессами памяти и внимания, так что она начала читать многочисленные работы по нейронаукам, узнав из них, что эмоции возникают постоянно. Различные исследования подтверждали, что эмоции неразрывно связаны с памятью, вниманием, восприятием и принятием решений. Пикард начала думать, что нашла недостающий фрагмент головоломки.
К сожалению, он находился слишком далеко от того, чем она занималась. Она привыкла, что в науке и инженерном проектировании нет места таким иррациональным вещам, как эмоции. В Технологическом институте Джорджии Пикард была единственной женщиной в учебной аудитории среди сотни мужчин. Если бы она связалась с чем-то необъективным и ненаучным, таким как чувства, она не получила бы докторскую степень по проектированию электрических систем.