Светлана Гусакова – ИИ: Путеводитель для начинающих. От цифрового помощника до машинного разума (страница 2)

Шрифт

В середине XX века сошлись несколько критически важных линий развития.

Кибернетика и теория информации: Норберт Винер разрабатывал теорию управления и связи в машинах и живых организмах, введя понятие «обратной связи» – фундаментальное для обучения.

Математическая логика: Работы Алана Тьюринга, Алонзо Чёрча и Курта Гёделя показали, что любые логические рассуждения можно свести к последовательности символов и механических операций над ними. Машина Тьюринга (1936) стала абстрактной моделью универсального вычислителя.

Появление электронных компьютеров: Во время Второй мировой войны были созданы первые реальные, хотя и примитивные, ЭВМ (такие как Colossus в Великобритании и ENIAC в США). Они доказали, что электронные схемы могут выполнять сложные вычисления с огромной скоростью.

Дартмутская конференция 1956 года: Имя и амбиции. Это событие считается официальным днем рождения ИИ как научной дисциплины. Молодые ученые – Джон Маккарти (который и предложил термин «искусственный интеллект»), Марвин Минский, Клод Шеннон, Натан Рочестер – собрались с грандиозным, почти наивным оптимизмом. Они полагали, что за лето сильная группа ученых сможет существенно продвинуть создание машин, которые «будут использовать язык, формировать абстракции и концепции, решать задачи, сейчас доступные только человеку, и улучшать самих себя». Их вера была так сильна, что они недооценили сложность задачи на десятилетия вперед.

После Дартмута наступил период бурного энтузиазма и, как казалось, стремительного прогресса. Казалось, что сильный ИИ не за горами.

Логика и решение задач: Были созданы программы, которые доказывали геометрические теоремы (Geometry Theorem Prover) и решали алгебраические задачи. Программа «Логик-теоретик» (1956) и ее преемница «Общий решатель проблем» (GPS) пытались имитировать человеческий способ поиска решений через цели и подцели.

Игры как полигон для интеллекта: Написание программы для шашек, которая к началу 60-х смогла обыграть сильного игрока-человека, стало первой громкой победой. Это доказывало, что машина может превзойти человека в четко структурированной интеллектуальной деятельности.

Зарождение машинного обучения: Фрэнк Розенблатт изобрел перцептрон (1957) – простейшую модель искусственного нейрона, способную обучаться распознаванию образов. Это породило огромные надежды на создание самообучающихся сетей, похожих на мозг.

Первые чат-боты и понимание языка: Программа ELIZA (1966), созданная Джозефом Вейценбаумом, имитировала диалог с психотерапевтом, используя простые правила подстановки. К удивлению создателя, многие люди воспринимали ее серьезно и доверяли ей, что стало первым тревожным звоночком об этических последствиях ИИ.

Оптимизм в воздухе: Герберт Саймон предрекал, что «машина будет чемпионом мира по шахматам в течение десяти лет», а Марвин Минский заявлял, что «проблема создания искусственного интеллекта будет в значительной степени решена в течение одного поколения». Финансирование, особенно от военных ведомств, было щедрым.

Эйфория быстро столкнулась с непреодолимыми на тот момент трудностями. Наступила первая «зима ИИ» – период разочарования, резкого сокращения финансирования и скептицизма.

Провал машинного перевода: Ранние системы пытались переводить, опираясь только на словари и грамматические правила, без понимания контекста и смысла. Результаты были комичными (знаменитый пример: «The spirit is willing, but the flesh is weak» переводилось как «Водка крепка, но мясо протухло»).

Ограничения перцептрона: В 1969 году Марвин Минский и Сеймур Паперт опубликовали книгу «Перцептроны», где математически доказали фундаментальные ограничения простых однослойных сетей: они не могли решить даже простейшие логические задачи (например, функцию «исключающее ИЛИ» – XOR). Это привело к почти полному замораживанию исследований нейронных сетей на долгие годы.

Проблема комбинаторного взрыва: Программы, основанные на логическом переборе вариантов (как GPS), становились неэффективными в реальных, сложных задачах. Число возможных ходов или решений росло экспоненциально, перегружая слабые вычислительные мощности того времени.

Отчет Лайтхилла (1973): В Великобритании математик Джеймс Лайтхилл подготовил критический доклад для правительства, в котором заявил, что громкие обещания исследователей ИИ не оправдались, а практическая польза от их работы ничтожна. Это привело к резкому сворачиванию государственного финансирования в Европе и волне скепсиса по всему миру.

ИИ выжил, сменив парадигму. Если не удалось создать универсальный разум, может, стоит сделать узкого, но очень компетентного «эксперта»?

Экспертные системы: Это были программы, которые кодировали знания и логику принятия решений настоящих экспертов (врачей, геологов, инженеров) в виде наборов правил «ЕСЛИ-ТО». Например: «ЕСЛИ у пациента температура > 39 И есть сыпь, ТО вероятность кори = высокая».

Коммерческий успех: Системы вроде MYCIN (диагностика инфекций крови) и DENDRAL (определение молекулярных структур) показали реальную практическую и коммерческую ценность. Компании бросились внедрять экспертные системы для конфигурации компьютеров, оценки кредитов, управления процессами.

Ограничения и закат: Создание и поддержка таких систем были дорогими и трудоемкими. Они были хрупкими: не могли работать вне строгой области знаний, не умели учиться на новых данных, а их базы правил разрастались до неуправляемых размеров. Когда обещанной следующей революции не случилось, наступила…

К концу 1980-х волна вокруг экспертных систем схлынула. Инвестиции снова иссякли. ИИ снова стал синонимом неудачи и завышенных ожиданий. Однако в тени этой зимы вызревали семена настоящей революции.

Парадигма снова сменилась. Вместо того чтобы пытаться вручную «вложить» в машину знания и правила (символический подход), исследователи все больше стали полагаться на данные и статистические методы. Девизом стало «Пусть данные говорят сами за себя».

Возвращение нейронных сетей: Были разработаны алгоритмы для эффективного обучения многослойных нейронных сетей (метод обратного распространения ошибки, 1986). Это преодолело ограничения, указанные Минским и Папертом.

Взлет машинного обучения как ядра ИИ: Появились и доказали свою эффективность на реальных задачах новые алгоритмы: метод опорных векторов (SVM), случайные леса, бустинг. Они побеждали на соревнованиях по распознаванию рукописного текста, фильтрации спама, прогнозированию.

Интернет как гигантский источник данных: Всемирная паутина создала беспрецедентные объемы текстовой, графической и пользовательской информации, необходимой для «тренировки» алгоритмов.

Практические победы: Алгоритмы машинного обучения стали незаметно, но прочно встраиваться в повседневность: поисковые ранги Google, системы рекомендаций Amazon, фильтры спама в почте. ИИ перестал быть научной диковинкой и стал инструментом бизнеса.

Все необходимые компоненты наконец сошлись, вызвав взрывной рост, который мы наблюдаем сегодня.

Большие данные: Объемы доступной цифровой информации стали поистине астрономическими.

Вычислительная мощность: Появление мощных графических процессоров (GPU), изначально созданных для видеоигр, позволило тренировать огромные нейронные сети в сотни и тысячи раз быстрее, чем на обычных процессорах.

Прорывные архитектуры нейросетей: Появление сверточных нейронных сетей (CNN) совершило революцию в компьютерном зрении. Рекуррентные нейросети (RNN) и, позже, трансформеры радикально улучшили работу с языком. Генеративно-состязательные сети (GAN) научились создавать реалистичные изображения.

Звездные моменты: 2012: Модель AlexNet на основе CNN с огромным отрывом побеждает в престижном конкурсе ImageNet по распознаванию изображений. Это «момент Осады Бастилии» для глубокого обучения. 2016: AlphaGo от DeepMind побеждает чемпиона мира по игре Го Ли Седоля. Го считалась игрой, где требуется человеческая интуиция, и победа машины стала культурным шоком. 2017: Представлена архитектура Transformer, лежащая в основе всех современных больших языковых моделей (LLM), включая ChatGPT. 2018-н.в.: Появление и стремительное улучшение гигантских языковых моделей (GPT-3, GPT-4, и аналоги от Google, Meta), способных генерировать связный текст, переводить, писать код и вести диалог. 2022: Запуск ChatGPT как публичного, удобного интерфейса к мощной языковой модели. Он стал самым быстрым потребительским продуктом в истории, привнеся ИИ буквально в каждый дом и офис и запустив новую глобальную гонку.

История ИИ – это маятник, качающийся между безудержным оптимизмом и горьким разочарованием. Каждая «зима» была вызвана завышенными ожиданиями и недооценкой сложности задачи. Каждое возрождение приходило вместе с новой парадигмой (логика → экспертные системы → статистика/ML → глубокое обучение) и новыми технологическими возможностями (мощные компьютеры → интернет → GPU).

Главный урок в том, что прогресс в ИИ – нелинейный. Он похож на движение по спирали: мы возвращаемся к старым идеям (нейронные сети), но на новом технологическом витке, что и приводит к качественному скачку.

Сегодня мы живем в период, который историки, возможно, назовут «великим пробуждением» ИИ. Но, зная историю, мы должны сохранять трезвый взгляд, помня как о феноменальном потенциале технологии, так и о том, что путь к истинному разуму (если он вообще возможен) еще очень долог и тернист. Мы освоили инструменты невероятной силы, но самая сложная часть пути – научиться использовать их мудро – только начинается.

1 2 3 Вперед