18+
реклама
18+
Бургер менюБургер меню

Ричард Йонк – Сердце машины. Наше будущее в эру эмоционального искусственного интеллекта (страница 18)

18

Beyond Verbal предлагает интерфейс программирования приложений (API) и набор средств разработки (SDK), позволяющие разработчикам встроить в собственные приложения функцию анализа эмоций по интонациям голоса. Они также запустили технологию Moodies, которая позиционируется как первое в мире приложение обработки и анализа данных для смартфонов. В Beyond Verbal утверждают, что оно может оценивать результат на основе более чем четырехсот эмоциональных вариантов, определяющих широкий спектр чувств и настроений. Генеральный директор компании Юваль Мор прогнозирует, что вскоре приложения для обработки и анализа голосовых данных станут частью каждого устройства или платформы с голосовой активацией.

Десятки компаний стремятся занять свою нишу в сфере технологий распознавания голоса. Одни разрабатывают собственные продукты с нуля, другие пользуются интерфейсами программирования и наборами средств для разработки приложений от сторонних производителей.

Кроме Affectiva и Emotient, в сфере распознавания выражений лица работают такие компании, как Eyeris, IMRSV, Noldus, RealEyes, Sightcorp, и Affective Computing Company (tACC).

Даже Microsoft запустила когнитивные сервисы, предложив API-интерфейс Emotion, предоставляющий естественные и контекстные интерактивные инструменты для улучшения взаимодействия с пользователем. Сейчас интерфейс ориентирован в основном на распознавание выражений лиц.

В других областях распознавания эмоций работает компания Emospeech, которая, как и Beyond Verbal, разрабатывает приложения для определения эмоций в речи. Nemesysco, еще одна израильская компания, занимается анализом уровня стресса говорящего с целью выявления мошенничества. Шведская компания Tobii's business ориентируется на контроль взгляда и движений глаз при изучении человеческого поведения. Анализ походки и поз также считается предметом исследования эмоционального программирования и находит применение в таких областях, как физиотерапия и эргономика. Однако пока еще сложно использовать согласованные признаки эмоциональных состояний для фиксирования той или иной эмоции. Возможно, когда технология геолокации достигнет определенного разрешения или с портативных камер можно будет получать обратную связь о передвижениях владельца, анализ общих признаков сможет продвинуться вперед.

Обратная сторона эмоционального программирования – синтез эмоций для программного обеспечения и роботизированных систем. Некоторые компании начали заполнять этот сегмент рынка и обучать машины создавать видимость эмоций. Например, компания Emoshape, с представительствами в Лондоне и Нью-Йорке производит эмоциональный процессор, который можно встраивать в устройства, создавая у пользователя впечатление, что устройство переживает эмоции11. Эмоциональный процессор позиционируется как первый эмоциональный чип для ИИ, роботов и электронных устройств широкого потребления. Он подключается к сенсорам, определяющим эмоции пользователя, а затем воспроизводит эту информацию в своем поведении. Отслеживая выражения лица, используемые слова и тона голоса пользователя, устройство может оценивать уровень его эмоций.

Другие компании неизменно последуют их примеру, либо создавая собственные специализированные эмоциональные процессоры, как Emoshape, либо разрабатывая и продавая собственные эмоциональные движки с API-интерфейсом, в которые можно встраивать другие приложения. С их помощью можно будет изменять поведение и действия роботов, программных приложений и персональных ИИ-помощников, подобных Мэнди (персональному цифровому помощнику из главы 1).

Во всей этой ситуации интересно одно – преобладающее количество стартапов, использующих технологии распознавания эмоций. По всей видимости, это объясняется двумя причинами. Во-первых, существующие технологии позволяют развивать именно это направление: веб-камеры, камеры смартфонов с достаточным разрешением и скоростью; доступные вычислительные мощности всех наших устройств – стационарных компьютеров, ноутбуков и, самое главное, смартфонов; высокая скорость передачи данных и возможность подключаться к серверам и службам проводным способом, по Wi-Fi или через мобильные устройства.

Вторая причина интереснее. Компьютерное распознавание образов и глубинное обучение – технологии, которые за последние годы достигли значительной сложности и больших возможностей. В некоторых ситуациях компьютеры способны распознавать то, что человек заметить не в состоянии, в то время как в других условиях они откровенно слабы. Когда имеются разумно структурированные универсальные признаки – скажем, четыре зубца у вилки, четыре колеса у автомобиля или начертание в алфавита, – система распознавания, основанная на нейронной сети, может обучаться очень хорошо даже в плохих условиях. Большинство систем распознавания выражений лиц основаны на структурированной таксономии, по большей части на карте движений лицевых мышц, составленной Экманом. Обучение возможно, потому что природа выражения эмоций на лицах людей универсальна. Четко определенная таксономия может быть одной из причин, по которой компании, разрабатывающие технологии анализа эмоций, специализируются в основном на чтении лиц. Со временем, когда удастся разработать и разобраться в техниках распознавания других эмоциональных каналов, ситуация может измениться.

Мы находимся на пороге странной новой эры, когда границы между людьми и технологиями становятся все более зыбкими. Нам станут доступны чудеса, которых мир прежде не видел.

Разумеется, в сфере эмоционального программирования будут происходить слияния компаний и приобретения одних компаний другими. Как упоминалось, Physiio объединилась с Empatica Sri, образовав Empatica, Inc. в апреле 2014 года. В 2015 году компания Kairos, производящая программное обеспечение для распознавания выражений лиц, купила IMRSV за 2,7 миллиона долларов. И предоставила своим клиентам услуги, на которые существовал спрос, но которые не входили в компетенцию Kairos. В январе 2016 года мировой гигант Apple купила Emotient за сумму, размер которой не разглашается. Хотя Apple не уточнила причину покупки Emotient на момент написания книги, было распространено мнение, что они могли разрабатывать усовершенствованную версию своего приложения личного помощника Siri. В пользу этого предположения говорят и некоторые другие приобретения Apple в тот же период времени. В их числе британская компания по производству программного обеспечения для анализа естественных языков VocallQ, компания Perceptio, занимающаяся глубинным обучением в распознавании образов, и недавно созданная компания Faceshift, специализирующаяся на распознании выражений лиц на видеоизображениях. Как уже говорилось, создание систем программного обеспечения, способных понимать нас и взаимодействовать с нами более естественным образом, постоянно способствует усовершенствованию множества поддерживающих технологий.

На расширение новой сферы влияют и другие факторы, например законодательство в области патентов и интеллектуальной собственности. Например, в мае 2015 года Emotient запатентовала свой метод сбора и категоризации до ста тысяч изображений лиц в день. За год до этого Apple подала патентную заявку на систему, которая оценивает настроение, основываясь на выражении лица. Защита интеллектуальной собственности – крайне важная движущая сила и мотивирующий фактор. В то же время новые технологии получают патенты, формулировки которых слишком общие или слишком очевидны с точки зрения существующего законодательства. К сожалению, недостаток осведомленности в новой отрасли науки часто ведет к перегибанию палки в виде некорректно работающей защиты. Патенты на гены рака груди, выданные в 1997 и 1998 годах компании Myriad Genetics, признанные недействительными в 2013 году, – яркий тому пример12.

Чрезмерно широко трактуемые патенты могут препятствовать инновациям и развитию. Оценка патентов, подобных патенту Emotient, не является целью этой книги, но уместно задать вопрос: правомерно ли защищать патентом нечто подобное проекту машинного обучения, данные для которого были получены от бескорыстных исполнителей. Время покажет. В действительности важно на ранних этапах развития новой отрасли науки то, чтобы мы не создавали ненужных препятствий. Просто представьте, что бы произошло, если бы кто-то получил в 1980-е или 1990-е годы патент, в общих чертах описывающий таксономию выражения лица человека. В то время этот процесс мог показаться новым и неочевидным, и общая формулировка патента могла затормозить развитие всей отрасли эмоционального программирования! Главным образом стоит понять: на столь ранних стадиях будет мудрым решением ввести дополнительную защиту от патентов, которые очевидно будут вредными для всех. Важно помнить, что, кроме выдачи патентов, основная миссия Ведомства США по патентам и торговым знакам— «способствовать индустриальному и технологическому прогрессу США и укреплять национальную экономику». В нашем быстро меняющемся мире необходимо установить продуманный баланс в том, кому служит патентная защита.

В условиях экономики свободного рынка заманчиво ориентироваться на выгоду как главный фактор мотивирования и движущую силу инноваций, но это лишь одна из ее составляющих и даже не самая важная. Огромное значение для долговременного успеха имеют поддержка инфраструктуры, достаточного количества мечтателей-единомышленников и общества, готового ухватиться за некоторые, если не за все, возможности новой технологии. Инновации не развиваются в вакууме, а являются результатом взаимного обогащения идей. Делая доступными некоторые аспекты развивающейся технологии, но при этом защищая действительно заслуживающую этого интеллектуальную собственность, технологическая экосистема получает возможность расти и процветать, что идет на пользу не только обществу, но и самим новаторам. Эль Калиуби, по всей видимости, поддерживает эту идею, говоря: «Наша самая большая проблема заключается в том, что существует так много прикладных способов использовать эту технологию, что мы с моей командой понимаем: нам будет не под силу создать их самим, поэтому мы сделали технологию доступной для других разработчиков, которые хотят создавать и творить»13.