Самообучение и «сильный» ИИ: научный сотрудник МАИ рассказал, когда роботы начнут готовить нам кофе
25 сентября 2024Ключевая способность искусственного интеллекта — способность к обучению. Как ИИ учится, может ли он самообучаться и заменит ли когда-нибудь человека? На эти вопросы отвечает научный сотрудник института № 8 «Компьютерные науки и прикладная математика» МАИ, директор департамента цифровой трансформации в компании BetBoom Юрий Чайников.
Большая часть того, что принято называть искусственным интеллектом, это многослойные нейронные сети — алгоритмы, которые нужно учить выдавать правильные, полезные ответы, тренировать на тех данных, для обработки которых они созданы. Наибольшую эффективность при обучении, по оценкам экспертов, даёт следующий подход. Сначала нейросеть тренируют на большом массиве неразмеченных данных, скрывая часть картинки или текста и побуждая правильно предсказывать скрытое. На этом этапе нейросеть выучивает самые общие закономерности и паттерны в исходных данных. Затем наступает этап тонкой настройки нейросети, на котором она должна выдавать пару результатов в ответ на входные данные. Из полученных вариантов специалисты отмечают более предпочтительные, и нейросеть учитывает это в дальнейшем процессе обучения. Этот процесс повторяется десятки и сотни тысяч раз, пока не перестанут улучшаться характеристики нейронной сети или пока не закончатся ресурсы на её тренировку.
— Самое интересное в том, что на определённом уровне сложности, например в очень больших мультимодальных моделях, происходит, с одной стороны, ожидаемое, а с другой стороны в некотором смысле удивительное явление — переход из количества в качество. По мере того, как мы тренируем нейросеть описывать заданные нами изображения текстом, она всё лучше и лучше описывает не только то, что мы ей показывали, но и бесконечное разнообразие других изображений. Удивительно здесь то, что качество описаний картинок можно существенно поднять, показав ей больше текстов, в которых прослеживаются тонкие, глубинные взаимосвязи слов, проистекающие из свойств нашего физического мира: например, яблоки обычно бывают красные, жёлтые, зелёные, но не фиолетовые, Северная столица в российском контексте — это Санкт-Петербург и так далее. Если среди текстов, которыми мы «кормили» нейросеть, какую-то часть составят отрывки из книг по шахматам, она, прочитав их, так или иначе выучит логику шахмат. Было ли это заложено в архитектуре? В некотором смысле было. Является ли это следствием такого метода тренировки? Безусловно. Одни архитектурные подходы больше способствуют обобщению, а другие — меньше. Мультиязычные и мультимодальные нейронные сети с очень большими объёмами обучающей выборки в триллионы токенов и с очень большим вычислительным ресурсом, затраченным на процесс обучения, всё в большей степени проявляют это эмерджентное свойство «думать», но, безусловно, в кавычках, — рассказывает Юрий Чайников.
Есть мнение, что такая способность к самообучению, заложенная в основе ИИ, приведёт к созданию так называемого «сильного» искусственного интеллекта. Перспективы этого уже много лет будоражат сообщество учёных и разработчиков по всему миру.
— Если порассуждать без инженерного приземления, то «слабый» искусственный интеллект — это нейросети, которые умеют решать ограниченный круг задач и никогда не решают их в неограниченно широкой области. Это самый яркий признак «слабости». Фактически, это тот искусственный интеллект, которым мы имеем на данный момент. Теперь можно порассуждать в обратную сторону. Что такое «сильный» искусственный интеллект? Это системы, способные решать любые задачи, которые может выполнять «обычный человек», на уровне качества «обычного человека». Такой искусственный интеллект пока ещё не создан. Многие знакомы с тестом Тьюринга: «обычные люди» по текстовому диалогу с трудом отличают искусственный интеллект от человека. Этот тест фактически пройден текущими большими языковыми моделями. Гораздо более сложный, так называемый «кофейный тест», пока ещё не преодолён. Робот по просьбе человека должен сделать кофе в незнакомом помещении, т.е. сориентироваться, отыскать кофейный автомат, найти всё необходимое, подставить чашечку, налить напиток, принести и сказать: «Кофе готов». Вот такой тест пока не по силам существующему в наше время искусственному интеллекту, — отмечает эксперт.
Хотя «сильный» искусственный интеллект, т.е. способный самообучаться и самостоятельно решать самый широкий круг задач, которые под силу сейчас только человеку, ещё не создан, все тенденции развития в этой области налицо. По оценкам эксперта, свидетелем появления «сильного» ИИ станет нынешнее поколение.
— Я не думаю, что это будет какой-то «скачок». Это будет тот же самый «ползучий» процесс, который уже происходит буквально на наших глазах. Релиз за релизом, пару раз в год, OpenAI выпускает очередную версию ChatGPT. Включившись в гонку, Google планирует выпустить Gemini 2.0, от Anthropic ожидаем версию Claude 3.5 Opus. Пока тенденция такая: каждая последующая версия потребляет в 10 раз больше токенов и в 10 раз больше вычислительных ресурсов. По независимым оценкам, GPT-4 обошлась в 100 млн долларов и «съела» 10 трлн токенов. Вот следующие четыре порядка — это наши вехи. Миллиард, десять миллиардов, сто миллиардов, триллион долларов. До суммы в триллион долларов, до десяти квадриллионов токенов всё будет идти по этой накатанной дороге. Пока тренд таков, что каждый раз при увеличении в десять раз объёма обучающей выборки и затраченного вычислительного ресурса происходит очередное, явное усиление полученного «интеллекта». Есть основания считать, что на этом пути в четыре порядка доля непосильных для искусственного интеллекта задач станет такой малой, что мы признаем его «сильным». Для осуществления этого замысла нужно по-настоящему много вычислительных ресурсов. Не в разы, а именно на порядки больше, чем есть сейчас. И лидеры в этой гонке это отлично понимают. Так, OpenAI совместно с Microsoft анонсировала запуск вычислительного кластера стоимостью 100 млрд долларов к 2031 году, — говорит Юрий Чайников.
Сейчас обычному человеку сложно поверить в такой глобальный переход, но это не смущает тех, кто хорошо знает, как происходили технологические революции в прошлом.
— Когда Максвелл сформулировал законы электромагнитного поля, никто не думал, что всё, что можно было сделать руками, станет доступным для производства с помощью какого-нибудь электроинструмента. А сейчас — да мы жить не можем без инфраструктуры 50 герц и 220 вольт! Подавляющее количество технологических процессов, производящих человеческое благосостояние, делается при помощи электроинструментов, станков и прочего оборудования с электрическими приводами, транспорта с использованием электроэнергии. И в этом смысле оно стало вездесущим. Причина этому проста: электричество многократно повышает производительность труда почти везде. Так же работает и искусственный интеллект. Если судить по современным исследованиям тех задач, которые ИИ уже умеет решать, он «стоит» в десятки раз дешевле человека. Поэтому замена человека роботом произойдёт почти неизбежным образом по тем же чисто экономическим мотивам, по которым электроэнергия заменила лошадь. Так мы «проползём» через очередную революцию повышения производительности труда, обеспеченности и благосостояния, — резюмирует эксперт.
Материал подготовлен при поддержке Минобрнауки России