Игорь Шнуренко – Демон внутри. Анатомия искусственного интеллекта (страница 33)
Далее мы по очереди выпускаем на арену всех парней и девушек. Нейроны Кохонена можно воспринимать как набор электрических лампочек, так что для любого входного вектора загорается одна из них. Берем наугад пример номер 10 из нормализованной таблицы (студент Нетреба, зачеты не сдал), и по формулам находим расстояния от Нетребы до текущих центров каждого из четырех кластеров. Получается, он ближе всего к кластеру 3 (неуспевающие студенты-юноши, не имеющие одного или нескольких зачетов и не получающие стипендию). Таким образом, третий нейрон — победитель и его веса должны быть скорректированы, также по заданной заранее формуле. Веса остальных нейронов при этом не меняются.
Таким образом мы прогоняем через нашу сеть все 20 примеров по списку, от Варданян до Шевченко. И переписываем все веса. После этого начинается следующая эпоха обучения, меняем в формулах коэффициент скорости и снова прогоняем всех по кругу. И наконец ура! — полный цикл обучения сети Кохонена пройден, и мы получаем итоговые значения весов. В первом кластере у нас один человек, во втором — 8, в третьем — 7, в четвертом — 4. О чем это говорит? Это говорит о том, что девушки у нас очень усидчивые и сдают предметы хорошо. Только у одной проблемы, может ей помочь? А с парнями ситуация плоха: разгильдяи. Как это исправить? Это, пожалуй, проблема для искусственного интеллекта следующего уровня, но вот довольно простенькая нейросеть, придуманная финном Кохоненом в 1980-е годы, дает вполне приличный результат, особенно при наличии хорошей вычислительной техники, поскольку все это в столбик никак не обсчитать.
После того, как нейросеть самообучилась, она готова к практическому применению. Теперь, если к нам придет набор данных по следующему 21-му студенту, сеть автоматически занесет его в тот или иной кластер, либо сделает вывод о невозможности такого отнесения (при большом расстоянии до центра ближайшего кластера). При этом веса узлов сети и кластеров на выходе, снова скорректируются, то есть новые данные продолжают учить сеть.
РАБОЧАЯ ЛОШАДКА ГЛУБОКОГО ОБУЧЕНИЯ
Эта главка написана для подлинных афисионадос обучения — человеческого или машинного, все равно. Для тех, кто ее пропустит, скажу лишь, что алгоритмы нейросетей сегодня невероятно усложнились, да и подходы за последние 20 лет изменились довольно сильно. Так, даже многослойные нейросети по нынешним меркам обучаются ужасно медленно и не в состоянии выполнять задачи, допустим, распознавания в течение пяти секунд лица гражданина Китая и установления его личности.
После многослойных сетей ученые придумали когнитрон и неокогнитрон, рекуррентные сети, которые обладали ассоциативной памятью, а в 2000-е годы вышли на алгоритмы глубокого обучения. Все вопросы, поставленные в свое время Минским, были сняты, и те, кто воспринимал его критику перцептрона как приговор машинному обучению как таковому, в конце концов оказались посрамлены.
Но нельзя говорить, что Минский задержал развитие науки и технологий на двадцать лет, как считают некоторые. Во-первых, как мы убедились, его сомнения лишь подхлестнули настоящих исследователей — то есть коллективный разум ученых повел себя как тот самый мозг, который увидев, что один из его компьютеров-ученых выдал сигнал ошибки, передал решение задачи другим своим колонкам. В итоге с задачей, как об этом говорил сам Минский, справился кто-то другой. Конечно, все не совсем так, и «компьютеры» коллективного разума, если можно так говорить, сами берут на себя выполнение задач.
Но так или иначе, любой разум, бывает, дает сбои и порой нуждается в перезагрузке, и 1969 год — год, когда Минский написал свою работу, американцы высадились на Луну и на экраны вышла кубриковская «Космическая одиссея 2001 года» и был такой перезагрузкой для коллективного разума всего человечества.
Артур Кларк как-то писал, что если крупный ученый говорит, что нечто может быть выполнено, то он почти всегда прав. Если же ученый говорит, что это не может быть выполнено, он почти всегда неправ. Этот «закон Кларка» применим и к развитию машинного обучения. Когда в распоряжении исследователей появились новые вычислительные возможности и под их разработки была подведена солидная теоретическая база, результат не замедлил сказаться.
Есть разные мнения по поводу того, когда началась новая «весна искусственного интеллекта». Возможно, это произошло в начале 1990-х, а может быть и раньше. Одной из таких дат является 1987 год, когда в мире прошли четыре ключевых совещания по нейронным сетям, а в научных журналах резко выросло число научных сообщений на эту тему. В шестидесятые-семидесятые годы математики и физики несколько выдохлись и перебросили мяч на половину поля биологов. За десяток лет те помогли коллегам и перебросили мяч обратно, что позволило игре выйти на новый уровень. Нейросети стали глубокими, то есть стали состоять из десятков тысяч, а впоследствии и сотен тысяч нейронов. Для таких сетей стали разрабатывать особую архитектуру, которая использовала новые открытия в том, как работает неокортекс.
Нобелевские лауреаты в области медицины Торстен Нильс Визель и Дэвид Хьюбел открыли в зрительной коре головного мозга кошки так называемые простые клетки, которые возбуждаются, реагируя на прямые линии под разными углами, и сложные клетки, реагирующие уже на сочетания простых клеток и их движение в одном направлении. Получалось, что мозг различает паттерны, сначала выделяя очень мелкие фрагменты изображений, а потом складывая из них все более усложняющуюся картину.
Архитектуру, нацеленную на этот метод распознавания образов, предложил в 1988 году французский математик (снова тяжело одним словом охарактеризовать сферу интересов ученого!) Ян Лекун. Она получила название сверточных нейросетей — и ей предстояло стать рабочей лошадкой глубокого машинного обучения, которая пыхтит и сегодня.
Сейчас Лекун возглавляет лабораторию искусственного интеллекта Facebook в Нью-Йорке — что, кстати, многое говорит о том, где применяются эти сверточные нейросети. Лекун не Эйнштейн и не Оппенгеймер, чтобы задавать власть имущим вопросы о том, в каких целях используются научные достижения, на благо людям или во зло. Сегодня наука не та, что была 50-60 лет назад, ее перестроили так, что она зависит от денег крупных корпораций и приватизированных ими государств. Талантливые ученые, такие как Лекун, понимают, что их статус в современном обществе совсем не эйнштейновский.
«Фейсбук» известен тем, что использует ваши фотографии для обучения своих нейросетей, и в общем довольно точно может установить в итоге, кто изображен на фото — не только размещенном в соцсети, но и вообще выложенном в интернет. Именно сверточные нейронные сети позволяют это делать с максимальной эффективностью (в последние годы к ним прибавились и капсульные сети).
Эта социальная сеть активно занимается профайлингом, то есть сбором, классификацией и анализом данных о пользователях, которым эти данные, получается, не принадлежат. Надо понимать, что «Фейсбуку» принадлежит также Whatsup, Instagram и другие соцсети, которые, разумеется, обмениваются данными и используют их для машинного обучения своего искусственного интеллекта. Пользователи бесплатно отдают этим соцсетям права и на свои данные, и на свой контент —точнее, отдают в обмен на почетное право быть членом сети, за право подвергаться цензуре, за право быть выпоротым или убранным из сети из-за слов, которые не понравились невидимым и неслышимым кураторам.
В этот электронный концлагерь люди идут добровольно, раздеваясь и складывая стыд вместе с личными вещами на входе. В больницах или образовательных учреждениях мы заполняем кучу документов с разрешениями на обработку наших персональных данных, но «Фейсбук» просто и открыто берет их у нас без всякого спроса. Якобы согласие «подразумевается» на входе в сеть (а на входе в другие места оно не «подразумевается»?
Эта публичная компания с капитализацией 500 миллиардов долларов слишком сильна для того, чтобы власть имущие осмеливались задавать ей вопросы. В апреле 2019 года суд в Москве оштрафовал «Фейсбук» аж на три тысячи рублей. Представитель компании на заседание не пришел, ничего не сообщалось и о выплате компанией столь беспощадного и разорительного штрафа.
Что останавливает «Фейсбук» от еще более широкого, чем сегодня, коммерческого использования невиданных в истории человечества возможностей по контролю над мыслью и сознанием? Пожалуй, лишь европейский закон о защите персональных данных GDPR. Хотя это и слабая защита — ведь «Фейсбук» научился обходить законы и, будучи самой мощной в мире структурой в области рекламы и манипуляции сознанием, знает, как преподнести себя публике с позитивной стороны.
Вы у нас под колпаком, мы контролируем ваши мысли и зарабатываем на вас миллиарды, господа, но делаем это для вашего же блага. Чтобы вам жилось лучше и веселей. Эта компания еще совсем недавно была стартапом, но в последние годы сконцентрировала в своих сетях — не руках же? — власть и могущество, которые не снились империям прошлого. Многие из власть имущих недостаточно образованы и не следят за ошеломляющим развитием технологий настолько, чтобы отдавать себе в этом отчет. Другие уже стали лоббистами компании или считают за лучшее не становиться ее врагами.