«Иметь два ума еще никому не помешало»

Расшифровка кодов мозга и запуск искусственного интеллекта — дело ближайшего будущего

Можно ли создать искусственный разум, поняв, как работает человеческий мозг? На этот и другие вопросы, связанные с проблемой искусственного интеллекта, «Газете.Ru» ответил д. ф.-м. н. Виталий Дунин-Барковский, заведующий отделом нейроинформатики Центра оптико-нейронных технологий НИИ системных исследований РАН, адъюнкт-профессор департамента физиологии клетки и молекулярной биофизики Техасского технологического университета, а также основатель и почетный президент Российской ассоциации нейроинформатики.

— C чего зародился ваш интерес к нейросетям и проблеме искусственного интеллекта?

— Темой искусственного интеллекта меня, еще подростка, заразил Андрей Николаевич Колмогоров в 1956 году, так что, поступая в МФТИ, я точно знал, чем именно буду заниматься. На физтехе меня определили в группу, которая занималась компьютерами. Помню, как академик Сергей Алексеевич Лебедев, директор Института точной механики и вычислительной техники, показывал нам БЭСМ, занимавшую весь первый этаж института. Сейчас по мощности она бы уступила калькулятору, но самое замечательное в ней было – это ячейка памяти на один бит из четырех ламп 6Н8С.

— Вы работали на БЭСМ-1?

— Нет, работать мне пришлось уже на другой машине примерно того же поколения – «Стреле ВЦ». Помню, как брал такси и в три часа ночи приезжал запускать на ней свою программу: на все про все мне отводилось 10 минут. Программировали, естественно, в машинных кодах, и надо сказать, что один из главных жизненных принципов, который я назвал «феноменом скрытого фактора», я сформулировал именно тогда. Для исправления программы перфокарты, как правило, не переделывали, а заклеивали дырочки кусками картона. И вот, бывало, приходишь — и видишь следующую картину: машина не работает, солнце взошло не с той стороны, мир встал с ног на голову, и вообще все пошло наперекосяк. В общем, мистика. Хватаешь колоду перфокарт, смотришь — и обнаруживаешь, что один из вклеенных битов отвалился. Вклеиваешь обратно – и мир встает на место, все работает идеально. Несколько обобщая, скажу, что в основе любой мистики лежит феномен скрытого фактора.

Но, поскольку люди не программисты и многие склонны думать, что мир устроен непонятно, скрытый фактор они не видят и предпочитают загадочные объяснения.

— К мистике, если развивать вашу аналогию, побуждают, скорей, скрытые алгоритмы исправления ошибок в наших суждениях о природе. Мистики в таком случае обычно говорят так: «Но кто-то же написал программу по исправлению других программ…» В эпоху, когда программирование зарождалось, таких автокорректирующих технологий еще не было.

— В нашем случае это неважно. Сейчас, когда программируют на языках высокого уровня, создавая сотни тысяч строк кода, и делают ошибки, система автоматической коррекции не срабатывает все равно. Ведь это такая же программа, как и все остальные. В конечном итоге свои ошибки все равно приходится исправлять нам самим, а любая мистика находит реальное объяснение.

— Вы придерживаетесь точки зрения, что вселенная вычислима.

— Эти слова для меня бессмысленны. Я поддерживаю точку зрения, что никаких «мистических» явлений в мире нет. Похоже, что нет никаких неизвестных физических взаимодействий, а если таковые и существуют, то пока в недоступном для измерения масштабе. Все-таки осознанная научная попытка понять мир насчитывает не так уж много времени – начиная с Платона и Аристотеля. При этом 99,9% достоверных научных знаний накоплены за последние 50–100 лет.

— Создание искусственного интеллекта логически вытекает из этой эпопеи?

— Видимо, интеллект — явление общественное, и как некий одиночный феномен рассматривать его неправильно. Именно как общественный феномен он возник, по-видимому, между 70 и 50 тысячами лет назад с возникновением языка. Это был не биологический скачок, а чисто информационный.

— Правильно ли рассматривать информационную эволюцию в отрыве от биологической?

— Конечно. С открытием генетических текстов биологическая эволюция стала вычислимой эволюцией. Мы можем вычислить, как биологически изменялись организмы. Но понять, изучая гены, какие-то культурные феномены мы не можем.

Другое дело, что не все до конца понятно в этих текстах, и феномен скрытого фактора по-прежнему здесь силен. Но, простите, и с момента открытия ДНК прошло не так уж много времени.

— Однако есть очень сильные указания, что феномены, которые воспринимались ранее как эксклюзивно интеллектуальные и культурные, имеют наследственную природу — например, альтруизм, предвзятое отношение к представителям другой культуры, свобода нравов и явно связанная с ней эмансипация общественной и культурной жизни.

— В пользу разделения (биологической эволюции от социальной) говорит тот факт, что человеческий генотип и генотип тех же высших приматов и других животных большей частью совпадают. И лишь небольшие генетические изменения у древних гоминид в узком функциональном окне, отвечающие за расширение сигнального взаимодействия с помощью звуков, привели к возникновению языка и началу интеллектуальной эволюции. То есть незначительные изменения генов, с одной стороны, – и взрывообразный информационный рост, с другой.

— А что принципиально нового дал этот интеллектуальный рост и развитие технологий? Взять тот же интернет, который всего лишь интенсифицировал информационный обмен, но качественно ничего нового не привнес: нынешние соцсети или облачные вычисления – всего лишь модифицированный вариант базарной площади и обмена ресурсами, при этом сложные «сетевые протоколы» есть и у социальных насекомых?

— Мне симпатична идея, что технологии и порождаемые ими устройства, в том числе интернет и гаджеты, являются продолжениями нас самих, в каком-то смысле и нашего собственного тела. Просто сигнальная система принимает новые формы.

— Не с этим ли размыванием границ между человеческим интеллектом и нечеловеческим связана происходящая сейчас ревизия самого понятия «искусственный интеллект»?

— У меня есть четкая точка зрения на это, выработанная на многочисленных конференциях по ИИ. Когда в очередной раз призывают дать определение этому понятию, я сразу говорю, что все это пустая трата времени, и привожу пример. Правильно ли, что люди начали летать благодаря братьям Райт в 1902 году в штате Огайо? Нет, конечно: люди хотели летать и летали и до изобретения самолета братьями Райт. Однако в 30-х годах люди уже определенно владели техникой полета на устройствах тяжелее воздуха. Другими словами, можно до бесконечности уточнять определения того, что значит «летать» и «не летать», выискивая точку перехода. С искусственным интеллектом примерно то же самое. Что считать точкой перехода между «интеллект есть» и «интеллекта нет»? Например, потихоньку сформировалось такое понятие, как «AI complete problems» (AI-полные задачи, см. врез), то есть ряд специфических задач, решаемых интеллектуально, например перевод с языка на язык. Но как решать эти задачи? На родном языке вы способны понять описание ситуации и заново описать ее на родном языке другими словами — или другими словами на другом языке, если владеете иностранным. Но мы видим, что ключевая стадия здесь – это не сам язык, а понимание того, что он описывает. Язык играет здесь, скорей, обслуживающую функцию. Часто говорят, что надо изучать другой язык, чтобы понять другое мышление. По-видимому, это не так. Аналогично, изучая языки программирования, вы не поймете, как устроен компьютер. Натуральные же языки являются в некотором смысле языками программирования нас самих.

— Да, но принцип работы вычислительной машины — это и есть язык ее программирования, т. е. алгоритмическая последовательность элементарных действий по записи и стиранию значений на ленте машины Тьюринга. То есть, разбирая сверху вниз язык какого угодно уровня до уровня простейших кодов, можно понять и принцип действия машины.

— Машина Тьюринга – монстр, существующий только в математических текстах. Мой близкий друг Владимир Чехлов, получивший в свое время Госпремию за разработку БЭСМ-6, занимался разработкой периферии наших ЭВМ и любил говорить, что никто не понимает, что происходит в современном сложном компьютере. Те же асинхронные взаимодействия вряд ли можно описать в терминах теории машины Тьюринга, которая реальную физику вычислительного процесса уже не ловит. Что говорить, если руководство IBM не всегда понимает логику того, что происходит на ее заводской периферии, где идут самостоятельные процессы оптимизации производства вычислительных устройств. Хотя существенные элементы архитектуры ЭВМ во многом наследуют элементы архитектуры фон Неймана, это правда. Но у меня возникает ощущение, что многие, скорее, очень хотят, чтобы они соответствовали этой архитектуре.

— Известна позиция Роджера Пенроуза, критикующего алгоритмическое разложение феномена мышления и ставящего под сомнение реальность его имитации с помощью вычислительных машин. С этим был связан мой предыдущий вопрос о вычислимости.

— Похоже, вы, как и многие, угодили здесь в одну и ту же математическую западню. Когда что-то вычислимо, это не означает автоматически, что это можно сделать. А когда невычислимо, то сделать якобы нельзя. Все это – превратное понимание в широком смысле узких математических терминов. Вообще все рассуждения по поводу теоремы Геделя о неполноте и невозможности из-за этого понять мозг, на мой взгляд, бредовы. Никакого отношения теорема Геделя к тому, как работает мозг, не имеет вообще. Если стоять на простой и наивной точке зрения, что мозг устроен определенным образом и благодаря этому устройству мы наделены определенными способностями, то понять, как именно работает мышление, в конечном итоге можно.

И ничто не запрещает нам это сделать! Другое дело, что скрытых факторов в случае с устройством мозга продолжает оставаться очень много.

— Какие из них уже перестали быть скрытыми? Какие ключевые открытия, приближающие нас к пониманию механизма работы мозга, уже сделаны?

— Становится все более понятен формат представления данных в многонейронных ансамблях. В случае одного нейрона более или менее известен этот базовый формат начиная с 20-х годов. Первые экспериментальные доказательства – это работы Эдриана (см. врез), показавшего, что частота работы нервного элемента определяет интенсивность того, что он передает. Если это нейроэлемент растяжения мышцы, то слабому растяжению соответствует низкая частота, а высокому – высокая. Нейрон, таким образом, может передавать непрерывные величины. Когда нейронов много, они тоже могут передавать одну и ту же величину. Возьмем мышцы, состоящие из многих двигательных единиц, каждой из которых управляет один мотонейрон. Мотонейроны возбуждаются, и от этого сокращается мышца. Сила сокращения мышцы тем больше, чем больше частота возбуждения мотонейрона. Когда мотонейронов много, их частоты складываются, увеличивая тем самым диапазон возможных усилий мышцы. Так вот, еще при работе над кандидатской диссертацией я столкнулся с такой штукой: когда множество нейронов работают с одинаковой частотой, в системе присутствует определенное количество «шума». И в зависимости от шума нейроны могут работать или синхронно, или асинхронно, а переход между этими состояниями представляет собой то, что в физике называется фазовым переходом. На рубеже тысячелетий великий Джон Хопфилд со своим учеником Броди показал, как этот фазовый переход можно использовать для распознавания слов, построив соответствующую схему. Хопфилду я показывал свою статью 1971 года на эту тему Правда, цитировать ее он как-то не рвется. Это один пример. Другой связан с тем, как внутри нейросети можно построить представление непрерывных величин, например частоты (тона) звука. Для такого представления удобны устойчивые одномерные множества состояний нейронов. Принцип такого представления я тоже изложил Хопфилду в 1995-м на симпозиуме Neural Networks for Computing в штате Юта. Я даже назвал тот класс сетей нейросетями Хебба--Хопфилда . И представьте, в 2010-м он публикуют статью с описанием такого представления! И цитирует! Но не меня… Но есть и те, кто мой вклад всё-таки замечают. В ноябре меня пригласили выступить с лекцией об этих нейронных представлениях на конференции в Вашингтоне Biologically Inspired Cognitive Architecture... Но я к другому веду: если долго думать над довольно примитивными вещами и пытаться сложить части в целое, как если бы вы разбирали и собирали часы, аккуратно записывая номера деталей и последовательность действий, то понять, как работает мозг, окажется в конечном итоге достижимой целью. Такой же достижимой, как расшифровка структуры ДНК. Сумели бы те, кто открыл принцип работы ДНК, понять хоть что-нибудь, руководствуясь абстрактными математическими моделями? Нет, конечно. Но, в отличие от расшифрованных кодов жизни, которых насчитывается 64, в случае с разумом мы открыли лишь некоторые коды мозга, с десяток точно, но априорно никто, конечно же, не знает, сколько их должно быть. Притом к открытию трех из них я, хоть и не семи пядей во лбу и совсем не гений, имею, по счастью, прямое отношение.

Это я не из самоуничижения говорю, а к тому, что речь идет не о каких-то сложнейших и фантастических, а достаточно простых и познаваемых вещах.

— Помимо фазового перехода состояний нейросети, какие еще фундаментальные коды вы можете назвать?

— С ходу – стохастический резонанс, когда для работы системы требуется оптимальное добавление шума. Перцептрон, который вы упомянули, и обратное распространение ошибки, которое, пока неизвестно, реализуется ли в живых нейросетях, но его тоже можно считать фундаментальным кодом интеллекта. Перечислять можно и дальше, тут главное не это, а принципиальная реализуемость проекта по расшифровке кодов мозга. По большому счету, никто не брался за реализацию этого проекта в составе большого коллектива специалистов. Никто! А я знаю практически все лаборатории, которые работают на этом поле. Сейчас вот пробуем собрать, наконец, такой коллектив из 21 профессионала в рамках проекта «Россия-2045» — с четко поставленными задачами, финансированием и планом работы на 7 лет. Если есть такая возможность, надо ее использовать.

— Расскажите о вашем участии в этом проекте.

— Чем хороша инициатива-2045? Понять, что такое мышление и разум, – не просто одна из многих целей, а стратегически, наверное, самая важная задача человечества вообще. Ученым это не приходится втолковывать, особенно тем, чьи исследовательские интересы лежат в смежных областях. Но начинаешь объяснять это населению — сразу вопрос «а зачем?» и «какую ты получишь выгоду?».

— Коллективный глас налогоплательщика, спонсирующего фундаментальную науку.

— Я долго прожил в США, чтобы понять, что налогоплательщик – один из многих мифов, которым американцы постоянно отравляют себе жизнь сами и уже отравили остальным. Налогоплательщик не критерий. Претензия «я плачу налоги!» не претензия: я тоже плачу налоги. Но связывать решение фундаментальных, прорывных для человечества задач с налогами – это глупо.

— Бюджет – Коробочка, скрещенная с Чичиковым, и раскошеливаться на подобные предприятия не будет, это очевидно. Впрочем и «Россия-2045» позиционирует себя как сугубо общественная инициатива, рассматривая государство как некую вспомогательную опцию. Однако главной целью этого проекта является не разгадка кодов мозга и запуск нечеловеческого разума, а постройка искусственного тела, радикальное продление жизни, в идеале – бессмертие. Причем здесь искусственный интеллект и вы?

— Всякий, как известно, доволен своим умом, но не состоянием. Парадокс в том, что, когда рассказываешь об уме, слушают тебя несравнимо менее внимательно, чем когда переходишь к телу. Вот тело – это уже что-то очень важное, насущное. Тело – это хорошо, это нужно, это уже что-то! Но искусственным телом надо как-то управлять, так что в качестве побочной, но принципиально важной задачи придется в любом случае расшифровать, как работает ЦНС и ее высшие отделы. И я только рад, что такая задача ставится внутри проекта-2045. А ресурсы на ее решение требуются очень скромные, совершенно не сравнимые с тем эффектом, который они могут произвести на человечество.

— Какие подходы к нейросетям на заре формирования этой стратегии повлияли на вас больше всего?

— Есть авторы, которые, вопреки так называемой «функциональной критике» концепции искусственных нейросетей, прозвучавшей со стороны Марвина Минского, и которая, как потом выяснилось, была совершенно умозрительной, много сделали для понимания мышления как целого, например великий Дэвид Марр. Но Минский – математик, а математики склонны к умозрительным конструкциям и догмам, даже когда пытаются описать что-то реальное, например зрение. Минский, критикуя искусственные нейросети, в свое время призывал: не пробуйте имитировать Бога, строя нейросети, просто попробуйте создать конструкцию, выполняющую такую же зрительную функцию.

— Конструкция, однако, до сих пор не создана, а нейросети – плод эволюции миллиарда лет – триумфально вернулись в начале 80-х с открытием архитектуры обратного распространения ошибки.

— Что касается обратного распространения ошибки, то за изобретение этой архитектуры я представлял своего коллегу Александра Ивановича Галушкина на Пионерскую премию Института инженеров электротехники и электроники, хотя и Пол Вербос считает себя первопроходцем в этой области.

— К этим идеям они пришли почти одновременно.

— Да, но, строго говоря, Галушкин все-таки чуть пораньше. Так вот, я спрашивал Галушкина: «Слушай, Саша, а ты это сам придумал-то вообще?» На что Александр Иванович отвечал: «Ты что, у Розенблата все уже написано!» И это так. Только книга Розенблата написана таким жутким языком, что никто толком-то прочесть ее не мог! Но вернусь к Марру. Через 11 лет после смерти Марра его жена Лючия (не без моей подачи — в предисловии она даже цитирует ответное письмо мужа на мое настойчивое предложение издать эти статьи) опубликовала сборник журнальных статей Марра по нейросетям. Хотя специалистам по искусственному интеллекту больше известна другая книга Марра — «Зрение», опубликованная в 1982, через два года после его смерти, и переведенная на русский.

И вот сейчас оказалось, что многие нейросетевые идеи Марра оказались удивительно верны, например в отношении двух структур – мозжечка, которым я сам плотно занимался, и гиппокампа.

— Какие подходы в современных нейрокогнитивных науках видятся вам самыми перспективными?

— Как и в случае с искусственным интеллектом, мне не нравится это слово – «когнитивный». Забудьте про него. Термины все только усложняют. Надо заниматься конкретными задачами, изучая конкретные феномены и механизмы. В этом смысле я, конечно, типичный представитель bottom-up, предпочитающий двигаться снизу вверх, а к чему может привести up-down, мы уже видели на примере Минского. Как продуктивный и многообещающий пример стратегии bottom-up я (особенно тем, кто только начинает знакомиться с этой темой) посоветовал бы книгу Джеффа Хокинса «Об интеллекте», переведенную на русский: в ней много журнализмов и заносов, от которых меня как специалиста слегка передергивает, но стратегию, выбранную Хокинсом, я приветствую.

— Снизят ли глобальные риски, нависшие над нашей цивилизацией, расшифровка кодов мозга и запуск искусственного интеллекта? В случае привязки мышления к небиологическим носителям, например, намного упрощается экспансия в космос...

— Будет экспансия или не будет — уже не нам решать. Скорей всего, конечно, будет: жить на одной планете объективно чересчур рискованно. Но понимание тайны разума не панацея, а один из существенных элементов нашего знания, могущего снизить такие риски. Один ум – хорошо. Но иметь два или даже больше еще никому не помешало, в деле выживания особенно.