С некоторых пор «Яндекс» без устали предлагает всем пользователям установить новый браузер с нейросетевыми технологиями. Он переводит, озвучивает и пересказывает видео, создаёт по вашему запросу картинки, исправляет за вас ошибки и пишет тексты. Красота! Лежишь на диване, а служба идёт. О новых технологиях и связанных с ними прорывах и опасностях мы говорим с доктором технических наук, директором мегафакультета трансляционных информационных технологий Национального исследовательского университета ИТМО, руководителем Исследовательского центра «Сильный искусственный интеллект в промышленности» Александром Бухановским.
– Понятие «искусственный интеллект» появилось ещё в середине прошлого века. Когда в России начали вести аналогичные разработки?
– И в мире, и в России такие исследования стали развиваться практически синхронно. В ХХ веке ИИ преимущественно основывался на знаниях. На соотношениях между разными фактами, например, в виде правил (если «А» имеет такое-то значение – то будет «Б», или «А» и «Б» не случаются вместе). Таких знаний в нашей жизни накоплено очень много во всех областях – от научных публикаций до законов и нормативных актов. А ещё есть живые носители знаний – эксперты, у которых все эти соотношения между фактами сформировались на основе их профессионального опыта. Само собой, ИИ на знаниях не мог потянуть всё разнообразие задач, присущих человеку. Прорыв в развитии технологий произошёл тогда, когда ИИ обрёл возможность получения знаний непосредственно из данных, характеризующих опыт в той или иной области. Другими словами, чтобы компьютер мог сам писать текст за человека, в него теперь не нужно закладывать грамматические правила. Достаточно показать много качественных и грамотных текстов. И вот для этого стали повсеместно использоваться нейросети.
Современные суперкомпьютеры и накопленные массивы данных (текстов, изображений, количественных характеристик) позволяют работать с по-настоящему гигантскими нейросетями, включающими в себя миллиарды нейронов. Обученные нейросети не только являются «энциклопедиями» знаний, но и позволяют воспроизводить на их основе различные когнитивные функции человека, причём весьма высокоуровневые. Например, реферирование или стилистическую переработку текстов, сотворение стихов или песен, иллюстрирование книг и пр.
Но никакого сакрального смысла, связанного с воспроизведением структуры мозга, понятие «нейронные сети» не несёт. Это только аллегория. Нейронная сеть – лишь удобная математическая конструкция для записи правил соответствия большого количества данных на входе и на выходе. А удобна она потому, что состоит из множества «кирпичиков» – математических нейронов, из которых можно построить конструкцию для решения практически любой задачи (как строители из обычного кирпича могут построить и дворец, и забор).
– В вашем университете создана система интеллектуального планирования развития городских территорий. Что значит «интеллектуальное планирование»?
– «Интеллектуальное планирование» – это когда ИИ пытается воспроизвести творчество архитектора при создании мастер-планов развития территорий: где какие здания построить, как их использовать, как организовать дорожную сеть, техническую и социальную инфраструктуру и как, наконец, сделать это место удобным для проживания и недорогим в эксплуатации. В таких задачах бессмысленно просто поручать ИИ нарисовать картинку «города будущего». Он её легко нарисует, только потом построить это будет невозможно, а эксплуатировать тем более. И даже прямое обучение на существующих архитектурных проектах не всегда помогает – ИИ воспринимает город просто как рисунок, не понимая, как его будут строить и как в нём потом жить. Потому мы создали отраслевую систему ИИ, которая не только может сочетать опыт развития городов с инженерными знаниями, но и оценивать, а как будут себя ощущать жители этого района. Не только с точки зрения доступности основных бытовых благ, но и в части эстетики среды обитания.
Мы научили компьютер понимать «замысел архитектора». И теперь ИИ можно попросить спроектировать современный район «с лёгким подражанием зодчему Росси» или «в стиле исторической части Пекина» – и это будет выполнено. Конечно, современный генеративный ИИ может создавать и свои собственные стили – но он не может их оценить, для этого нужен авторитетный архитектор.
– Какие функции может взять на себя ИИ в промышленности?
– Он может решать две ключевые задачи: сокращать издержки и создавать новые источники дохода. Первая задача (издержки) не сильно прибыльна и связана в основном с автоматизацией функций низкоквалифицированного или линейного технического персонала. Например, можно сократить операторов кол-центра за счёт внедрения голосового помощника. Или внедрить систему, которая контролирует процесс ремонта оборудования, подсказывает, как сделать это быстрее и уменьшить количество ошибок.
Вторая задача (новые источники дохода) гораздо более благодарна. Её потребители – это «белые воротнички», которые должны принимать серьёзные решения в условиях неопределённости и неполноты данных. Например, сделать концептуальный проект разработки нового месторождения с детальным планом… на несколько лет вперёд, или выбрать наилучшее место для строительства транспортного узла и порта на побережье, или сформировать реалистичный план привлечения (а главное, удержания на предприятии) кадров из других городов. Любая оплошность в таких стратегических решениях может привести к проблемам, растянутым на годы, цена ошибки крайне велика. При этом тут внедрение ИИ, на удивление, ещё и добавляет инвестиционную стоимость: чем быстрее будут обоснованы стратегические решения, тем быстрее будет создано (построено, организовано) новое производство и тем быстрее оно будет приносить прибыль.
– Человек нередко принимает решения интуитивно. Может ли появиться интуиция у ИИ?
– Генеративный (умеющий создавать новый контент) ИИ может воспроизводить эффекты, которые можно считать проявлением интуиции, на уровне «озарения». Это связано с тем, что он только частично использует знания, формализованные в нейросети, дополняя их фактами, выбираемыми отчасти случайно. Потому иногда результат работы генеративного ИИ может выглядеть неожиданно даже для опытного специалиста. Но сам генеративный ИИ никогда не поймёт, что он совершил «акт интуиции», так как не может оценить, насколько результат «попал» в ожидания пользователя.
Часто место интуиции у ИИ занимает нетривиальная дедуктивная способность (почти как у Шерлока Холмса), которая может довести до курьёзов. Так, одна из отечественных моделей ИИ, показывая знание классической русской литературы, уверенно сообщает, что главный герой «Песни о купце Калашникове» М.Ю. Лермонтова торговал… оружием! (Хотя в оригинале – тканями!) И тут же поправляется – купец Калашников торговал не автоматами и пулемётами, а… мечами, копьями и стрелами – так как во времена Ивана Грозного автоматов не было. Таким образом, ИИ смог найти компромисс между оружейным брендом Калашникова и реалиями XVI века.
– С одной стороны, этот пример – конечно, курьёз, с другой стороны, ИИ ведь может распространять фейки и совершенно (если так можно говорить о машине) сознательно?
– Несомненно, он может распространять фейки, и их объём в интернете за последний год увеличился на порядок. Однако если ИИ что-то сделал – то ИИ это и обнаружит. Так, например, видеофейк может иметь много модальностей: содержание речи, голос, мимику и пр. Любые несогласованности между ними (которые тоже выявляет ИИ) могут трактоваться как подозрение на искусственное происхождение материала. Потому сейчас мы можем наблюдать борьбу «щита и меча».
В информационном поле всё чаще появляется контент, созданный ИИ. И не обязательно плохой, иногда – весьма полезный (как, например, краткое описание товара в маркет-плейсе, которое ИИ сжал, «прочитав» длинную инструкцию). Потому не нужно пугаться – просто следует соблюдать меры информационной гигиены.
Настоящий ИИ – это инструмент, позволяющий решать сложные неформализованные задачи, в том числе помогать человеку заниматься творчеством. В различных областях. Пока сам творческий процесс в ИИ недостаточно формализован, чаще всего представляется его имитация – заготовка для человека-творца. В технических вопросах (например, кратко изложить статью по заданной теме) этого вполне достаточно. Но в вопросах искусства с учётом этических и эстетических факторов пока ещё опираться на ИИ целиком невозможно. Однако, поскольку он всё-таки сокращает объём работы, у творческого специалиста высвободится время для решения креативных задач более высокого уровня.