Дмитрий Сибиряк – Нейросети для hr подбора персонала и оценки резюме (страница 2)
Краткий ликбез по нейросетям для неспециалистов
В прошлой главе мы говорили о том, что HR-аналитика позволяет нам перейти от гаданий на кофейной гуще к работе с цифрами. Но где же здесь место нейросетям? Давайте сразу договоримся: если при слове «нейросеть» вы представляете себе Терминатора или гигантские шкафы с мигающими лампочками из фильмов 80-х, мы с вами это исправим. На самом деле всё гораздо проще и, если честно, даже скучнее (в хорошем смысле этого слова). Никакого восстания машин, только помощь в рутинных задачах.
Что такое нейросеть на пальцах
Представьте, что вы учите маленького ребенка различать кошек и собак. Вы не даете ему свод правил с четкими определениями: «Если у животного длина носа больше 5 сантиметров и виляет хвостом – это собака». Вместо этого вы просто показываете ему много-много картинок. Тысячи картинок. Сначала он будет ошибаться, называть овчарку кошкой, а лысого кота – собакой. Но потом, набравшись опыта, его мозг сам начнет замечать закономерности: у кошек уши чаще острые, у собак носы длиннее и так далее. В какой-то момент он перестанет ошибаться и сможет безошибочно определить зверя даже на самой дурацкой фотографии.
Нейросеть работает примерно так же. Это не программа, которой прописали алгоритм «Если А, то Б». Это математическая модель, которую «натренировали» на огромном количестве примеров. В случае с котиками и собаками – на картинках. В случае с HR – на резюме, историях найма и данных о сотрудниках. Мы скормили нейросети десять тысяч резюме и сказали: «Смотри, вот эти люди отлично работали, а эти уволились через месяц». Нейросеть покорно переварила эту информацию и нашла в ней невидимые человеческому глазу закономерности. Теперь, когда вы дадите ей новое резюме, она скажет: «Этот парень, судя по всему, тоже задержится надолго, а этого лучше не брать, он похож на тех, кто быстро уходит». Важно понимать: она не понимает смысла, она просто видит совпадения с паттернами.
Из чего состоит этот «черный ящик»
Чтобы окончательно развеять ореол таинственности, давайте заглянем под капот. Нейросеть состоит из огромного количества простейших вычислительных элементов – нейронов. Они соединены между собой, как сложная паутина. У каждого соединения есть свой «вес» – важность этого соединения. Когда на вход нейросети падает информация (например, слово «Python» в резюме), она проходит через все эти слои нейронов, и каждый из них решает: «Это важно, передаю дальше» или «Это ерунда, замалчиваю». В результате на выходе мы получаем готовый ответ.
Весь процесс обучения как раз и сводится к тому, чтобы правильно настроить эти «веса». Программа-учитель (то есть мы с вами) говорит: «Неправильный ответ, ошибка. Давай, попробуй еще раз, чуть-чуть подкрути настройки». И так миллионы раз, пока погрешность не станет минимальной. Это очень напоминает процесс настройки гитары: вы дергаете струну, слушаете, крутите колок, пока звук не станет чистым.
Как нейросети видят наши резюме
Теперь представьте, как этот процесс выглядит в мире подбора персонала. Вы скидываете нейросети пачку резюме на должность «Менеджер по продажам». Она не читает их как человек. Она разбивает каждое резюме на тысячи мелких признаков: наличие высшего образования, конкретные вузы, годы окончания, частоту смены работы, ключевые слова в обязанностях, длительность пауз между работами. И из этих «кирпичиков» строит портрет идеального кандидата.
Допустим, у вас в компании уже работают десять супер-продажников, которые приносят 80 процентов выручки. Вы берете их резюме и загружаете в нейросеть как образец для подражания. Нейросеть находит то общее, что их объединяет, хотя вам, людям, могло казаться, что они совершенно разные. Может оказаться, что у всех у них когда-то был опыт работы в такси, или все они в определенный год сменили сферу деятельности. Вы этого даже не замечали, а машина подсветила.
Нейросети и человеческий фактор
Здесь важно сделать небольшую паузу и подумать вот о чем. Нейросеть – это зеркало. Она не учит нас добру и справедливости, она учится на том, что мы сами ей даем. Если вы последние пять лет нанимали в компанию только выпускников одного конкретного вуза, нейросеть решит, что это и есть главный критерий отбора. Она начнет отсеивать талантливых людей из других университетов, даже если они лучше подходят по навыкам.
В этом и заключается главный парадокс. Нейросети часто обвиняют в предвзятости, но на самом деле они лишь доводят до абсолюрда наши собственные, человеческие предрассудки. Они как очень старательный и педантичный помощник, который буквально понимает ваши указания и не способен включить критическое мышление. Поэтому, когда мы говорим про нейросети в подборе, мы всегда должны помнить, что учителем остаемся мы сами.
Почему это не страшно, а удобно
Многие боятся, что нейросети оставят их без работы. Но давайте честно: кто из рекрутеров любит перебирать сотни однотипных резюме в поисках «того самого»? Это выматывает, притупляет внимание и убивает время, которое можно было бы потратить на живое общение с кандидатами. Нейросеть отлично справляется с «грязной» работой. Она как мощный пылесос, который собирает весь мусор и пыль, чтобы вы могли спокойно заниматься творчеством и общением.
Так что не надо представлять себе Скайнет, который захватывает отдел кадров. Представьте себе супер-быстрого стажера, который не спит, не ест, не просит зарплату и может за минуту прочитать тысячу резюме. Но в отличие от стажера, он делает это без эмоций и не устает к вечеру пятницы. Именно для этого мы и собираемся использовать нейросети в нашей книге – чтобы автоматизировать рутину и освободить голову для действительно важных решений.
Подумайте о своей текущей работе. Сколько времени в день вы тратите на механические действия? На поиск, сортировку, первичный отсев? А теперь представьте, что эту работу за вас делает идеальный исполнитель, а вы лишь проверяете итоговый результат. Согласитесь, картина вырисовывается довольно привлекательная. Именно об этом мы и будем говорить дальше: как именно превратить эту фантазию в рабочую реальность вашего отдела подбора.
Этические дилеммы: алгоритмы и предвзятость
Давайте представим ситуацию. Вы приходите на вечеринку, и хозяин дома, чтобы никого не обидеть, решает не знакомить гостей лично, а просит всех надеть бейджики, сгенерированные умным алгоритмом. На вашем бейджике написано не просто "Алексей, программист", а нечто вроде: "Вероятность интересоваться футболом: 87%, Вероятность любить джаз: 12%, Уровень дохода: выше среднего, Индекс ‘свой в доску’: 34%". А на бейджике соседа, который зашел на огонек, красуется "Индекс благонадежности: 99%". И вы уже смотрите на него не как на потенциального друга, а как на статистическую выкладку. Смешно? Возможно. Страшновато? Немного. А теперь представьте, что такие бейджики (только виртуальные) алгоритмы начинают вешать на людей, которые откликаются на вакансии в вашей компании.
В предыдущих главах мы говорили о том, как HR-аналитика и нейросети помогают нам перейти от интуитивных решений к точным алгоритмам. Мы уже поняли, что машина может обработать тысячи резюме быстрее любого рекрутера. Но чем сложнее становятся алгоритмы, тем острее встает вопрос: а не превращаемся ли мы в тех самых гостей на вечеринке, которые судят о человеке по ярлыку, пусть даже и сгенерированному самой передовой технологией? И здесь мы вступаем в зону, которая называется этические дилеммы.
Этика в контексте автоматизации подбора – это не про высокие философские материи, а про вполне конкретные вещи. Это про то, как не дискриминировать кандидата, не нарушить его права и не создать в компании токсичную среду, где вместо живых людей будут бездушные скоринговые баллы. Главная опасность, которая подстерегает нас на этом пути – это предвзятость алгоритмов. И эта проблема гораздо сложнее, чем кажется на первый взгляд.
Откуда берутся предрассудки у машины?
Давайте сразу договоримся: нейросеть сама по себе не может быть злой, доброй, справедливой или предвзятой. У нее нет личного опыта, нет детских травм и нет политических убеждений. Она – просто очень сложная математическая модель. Всю свою "мудрость" она черпает из данных, на которых ее обучают. И если в этих данных есть предвзятость, алгоритм ее не просто повторит, а усилит и возведет в абсолют.
Представьте себе молодого специалиста Петра, который хочет стать аналитиком данных. Он отправляет резюме в крупную технологическую компанию. Компания гордится своей передовой AI-системой отбора, которая отсеивает неподходящих кандидатов. Систему обучили на данных за последние пять лет, показывая ей тысячи резюме успешных сотрудников. Проблема в том, что пять лет назад в компании почти не было женщин-аналитиков, а большинство успешных сотрудников оканчивали одни и те же три столичных вуза и увлекались, скажем, игрой в го.
Система, будучи честной и прилежной ученицей, выявила эти паттерны и начала их использовать. Она не знает, что дискриминация – это плохо. Она просто знает, что "успех" в этой компании коррелирует с мужским полом, конкретным дипломом и хобби. В итоге резюме женщины-программиста из регионального университета с отличными навыками, но без упоминания го в увлечениях, система отбракует с вероятностью 99%, даже не дав шанса показать себя на собеседовании. Или возьмем другой пример: компания ищет курьеров и обучает модель на данных о текучке. Модель обнаруживает, что сотрудники, которые живут дальше 10 километров от офиса, увольняются чаще (потому что им тяжело добираться). Она начинает автоматически отсеивать всех, чей адрес прописки находится за этой чертой, даже если человек готов приезжать и его все устраивает.