Baidu – китайская компания, предоставляющая веб-сервисы, основным из которых является одноименная поисковая система. Технологии Baidu способны переводить речь в режиме реального времени с одного языка на другой, распознавать степень правдивости найденной информации и даже найти похищенного человека. Из этой книги вы узнаете, какие технологии помогли Baidu обыграть Google и какие возможности в будущем откроет перед нами искусственный интеллект. В формате PDF A4 сохранен издательский макет.
Приведённый ознакомительный фрагмент книги Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google предоставлен нашим книжным партнёром — компанией ЛитРес.
Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других
Раздел 2. Миссия искусственного интеллекта: «знать больше, делать больше, испытывать больше»
Гипотеза Лу
1980-е годы были идеалистическими годами, когда все жители КНР стремились к научному прогрессу и жаждали знаний. Особенно в кампусах, студенты колледжа учились, как сумасшедшие. Ученые класса Чэнь Цзинжунь стали кумирами многих людей.
В 1987 году в кампусе Фуданьского университета появился молодой человек, который носил очки и был таким же тощим, как Чэнь Цзинжунь[4]. Он был очень энергичным молодым человеком. Каждый день ходил по кампусу с большой сумкой и любил думать и решать сложные задачки. Для окружающих это было непонятно. И в студенческих кругах к нему прицепилась кличка «Чэнь Цзинжунь».
На выпускном он написал напутствие в Памятной книге:
«Я хотел бы представить свои последние исследования, и я хотел бы сказать то, что хотел бы сказать.
«Гипотеза Лу»: HI=>C∪HB.
(Где: H: Human I: Intellectualized
C: Computer B: Brain)
Мораль: человек в конечном итоге сделает компьютер умным и сделает его намного лучше человеческого мозга. Возможно, это жемчужина на короне всей компьютерной науки».
Это был Лу Цзи. Он впоследствии работал в Yahoo, стал лидером Microsoft, а сегодня является президентом Baidu Group. «Гипотеза Лу», конечно, не является научной теоремой, как «Гипотеза Чена». Но она и не выдумка. Это больше похоже на будущее озарение. Откуда взялось оно 30 лет назад?
Я хотел бы предложить свои последние результаты исследований и попрощаться с этим классом.
«Гипотеза Лу»: HI => C∪HB
(где: H: Человек I: Интеллект C: компьютер B: мозг)
Идея: люди со временем сделают компьютер умным. Умнее, чем человеческий интеллект. Возможно, это жемчужина на короне компьютерной науки.
Речь Лу Цзи о 1984-й годовщине информатики, Университет Фудань
В то время у Лу Цзи было только смутное ощущение: «Компьютеры приносят нам необычайные знания и опыт. Когда мы записывали шахматную программу в компьютерном отделе, которая в сущности была простым кодом, моя интуиция твердила, что нам просто нужно время, чтобы отладить механизм и сделать его умнее, чем люди. Поэтому я и написал то высказывание. А вскоре у меня появилась возможность поступить на компьютерный факультет Университета Карнеги-Меллона».
Личные убеждения Лу Цзи: знать больше, делать больше, испытывать больше.
Когда он окончил университет, он написал «Know more, Do more». А позже добавил — «Know more, Do more, Be more». Потому что чувствовал, что «Be more» важнее, чем все остальное. «Be more» также можно перевести, как «стать лучше». Люди находятся «в пути» и постоянно совершенствуются.
Эти три требования органично связаны друг с другом. И их цель — двигать человечество вперед. Смысл нашего существования заключается в том, чтобы продолжать открывать новые вещи. Чем больше мы знаем, тем больше мы можем сделать. Чем больше мы сделаем, тем больше мы можем испытать. Значит, жизнь будет более насыщенной. Благодаря опыту, накопленному поколениями, мы узнаем, что это продолжительный цикл. И что он является движущей силой человеческого прогресса.
Компьютеры заставляют нас «Know more, Do more, Be more». А искусственный интеллект — последнее эхо этой мелодии. Размышляя подобным образом, мы можем проанализировать то, что люди и организации, заинтересованные в развитии искусственного интеллекта, должны делать. Как искусственный интеллект пришел. Куда идет. Какова его природа и стандарты.
Эра будущего
То, что мы наблюдаем сегодня, — это эра компьютерного и цифрового подъема. Прочный и обязательный процесс в потоке истории человечества. И искусственный интеллект является его движущей силой. Это открывает новую эру, которая принесет долгосрочны революционные изменения в наше общество. Ее последствия связаные с промышленностью, технологиями и другими экономическими и социальными аспектами. Но, в конце концов, революция в искусственном интеллекте позволит нам идти в новом направлении и писать новую историю. Для начала нам нужно понять суть «человеческого прогресса». Мы с энтузиазмом стремимся к тому, что позволяет нам больше познавать, достигать большего и получать больше опыта.
Непрерывное развитие вычислительной мощности, следуя вышеуказанным направлением человеческого прогресса, будет значимым компонентом человеческого прогресса. После изобретения компьютерного программирования прогресс человечества начал ускоряться как никогда. Его модель включает в себя следующие ключевые шаги: человек захватывает различные явления во Вселенной, в частности, через преднамеренное наблюдение, чтобы получить опыт; затем эффективно организует, обрабатывает и уточняет информацию посредством вычислений, которые дают человеку более глубокое и абстрактное понимание того или иного явления, формирующего знания; человек использует знания, полученные в результате познания, чтобы действовать, взаимодействовать с явлениями и в конечном итоге достичь желаемого результата.
В основе современных вычислительных систем и IT-технологий стоимостью в несколько триллионов юаней: информационная организация (IO, способствует познанию), выполнение задач (TC, помогает людям достигать большего), богатый опыт (EE, накапливает опыт). Это три основных измерения человеческого прогресса.
Искусственный интеллект — новые возможности вычислительной мощности человека. И он продолжает способствовать прогрессу. Кроме того, искусственный интеллект — революционная вычислительная система высочайшего уровня (ICS). Это само по себе является беспрецедентным и революционным явлением.
Основной структурой, определяющей современную цифровую вычислительную систему, является организационная форма ресурса. Проще говоря, суть вычислений искусственного интеллекта очень отличается от структуры потока управления фон Неймана, который использует линейную память и булевую функцию в качестве базовой вычислительной операции. Новая парадигма — нейронные сети, характеризующиеся распределенными представлениями и активными моделями. Здесь переменные представлены векторами, наложенными на общие физические ресурсы (например, нейроны), и вычисляются путем активации нейронов. Топологическая архитектура сети и режим активации обеспечивают огромное вычислительное пространство, которое может естественно захватить внушительный объем знаний (через топологию суперпараметров, весов, функций активации). В отличие от локализованного представления в архитектуре фон Неймана (где переменные представлены специализированными или локализованными физическими ресурсами, такими как регистры) и символических вычислений, нейронные сети являются более естественными и мощными в глубоком обучении и представлении физического мира, а также в богатом семантическом знании общества.
Сила вычислений нейронной сети, следующая волна технологии искусственного интеллекта, может поднять текущую вычислительную систему в двух измерениях:
Первое — автоматическая иерархическая функция / представление обучения. Это существенное увеличение возможностей машинного обучения, так как большая часть сегодняшней работы машинного обучения является ключом к характерной инженерии. Например, мозг Baidu уже имеет триллионы параметров, сотни миллиардов образцов и сотни миллиардов характеристик обучения.
Второе — продвинутая когнитивная, особенно перцептивная способность. Это огромный катализатор для устройств следующего поколения (например, беспилотных автомобилей) и платформ следующего поколения (например, сеансов естественного языка).
Мощные вычислительные возможности искусственного интеллекта помогут создать множество новых разновидностей интеллектуальных систем, таких как машинные юристы, машинные аналитики, медицинские роботы, интеллектуальные агенты по обслуживанию клиентов и т. д.
Еще одним направлением развития искусственного интеллекта является организация различных систем, обслуживающих определенную физическую архитектуру и физические элементы, такие как дома, офисы, заводы и другие интеллектуальные системы. Его основная модель заключается в том, что «система восприятия» искусственного интеллекта распознает и воспринимает физическую архитектуру с помощью различных примитивных сигналов от датчиков интернет-вещей; в то время как «когнитивная система» требует организации информации и изучения большего количества знаний о физической архитектуре, а также прогнозирования, оценки и принятия решений, чтобы сделать различные физические системы более интеллектуальными.
В настоящее время в области научных исследований, искусственный интеллект может обеспечить более продвинутые возможности моделирования, стать катализатором для новой волны научных исследований во многих отраслях.
В сфере бизнеса искусственный интеллект — это дополнительные возможности для создания интегрированной платформы вычислительных систем (BCS) для корпораций. Например, запись бизнес-объектов (модели проектирования системы, транзакции) и бизнес-процессов (ERP (планирование ресурсов предприятия), CRM (управление взаимоотношениями с клиентами)); или проектирование системы и имитация деятельности человека, такой как общение, сотрудничество, чтение, письмо, поиск информации и т. д.
В настоящее время искусственный интеллект «системы восприятия» имеет более широкие возможности для бизнеса: с одной стороны, вы можете построить и развернуть «системы зондирования» для физической среды или физических систем, таких как сборочные конвейеры, заводы и так далее. Это позволяет будущему трудоемкому производству, бизнес-услугам и т. д. использовать более продвинутые информационные инструменты и более сильную автоматизацию. С другой стороны, быстрый прогресс в технологии обработки естественного языка позволяет нам сканировать и анализировать текстовые документы и информацию, а также извлекать из них различные ценные бизнес-знания. Создание и развертывание специальных «подсистем понимания текста» может дать много ценной информации и результатов.
«Когнитивная система» искусственного интеллекта представляет собой интеллектуальную эру в долгосрочной перспективе. В будущем будут реконструированы все отрасли, профессии, социальные системы и даже образ жизни. Если цифровое общество мы можем определить как эру «информации на кончиках пальцев», то эра искусственного интеллекта — это «повсеместное знание, где каждое действие является интеллектуальным».
Несомненно, новая эпоха ИИ предоставит человечеству колоссальное количество возможностей.
Хорошие новости для бизнеса — появится много возможностей для продвижения, преобразования и перехода на новые ступеньки роста. Но есть и плохие. Никто не сможет оставаться в стороне. Если вы не двигаетесь вперед, то неизбежно отстанете и будете выброшены за борт.
Предпринимателям достаточно взглянуть на список «рыночных возможностей» и найти там бесконечное число идей для строительства будущих бизнес-империй. Нужно только смотреть вперед с учетом нового духа интеллектуальных предпринимательских возможностей. Сегодняшние руководители предприятий должны шагать в ногу со временем и соответствовать «интеллектуальному возрасту».
Инвесторы также смогут открыть для себя эру нового бизнеса. Поддержите начинающих, чтобы впоследствии вырасти в крупную бизнес-корпорацию, и получите значительную отдачу.
Для страны или правительства каждая технологическая революция сопровождается чередованием взлетов и падений общественных настроений. Всегда найдутся те, кто воспользуется возможностью, предоставленной историей. Они сделают широкий шаг вперед и выиграют благополучие и процветание для своей страны. Для того, чтобы воспользоваться историческим шансом, крайне важно принимать дальновидные политические решения, решительно вкладывать инвестиции в стратегически важные сферы и отрасли и способствовать развитию науки.
Но, конечно, большой поток людей и предпринимателей, влившихся в сферу ИИ, неизбежно спровоцирует хаос.
В Кремниевой долине делают ставки на инвестиции в AI + X. Например, существует инвестиционная компания, специализирующаяся на искусственном интеллекте. Один из партнеров (LP), бывший мэр города Нью-Йорк Блумберг, наблюдает за сотнями компаний. Большинство из них стартапы, которые утверждают, что работают в сфере ИИ. Главный вопрос инвестиционной компании — как определить, куда инвестировать, чтобы вложить деньги эффективно. Это побудило нас задуматься: каковы критерии компаний сферы ИИ? Какие из компаний настоящие, а какие нет?
Критерии измерения искусственного интеллекта
Появление каждой новой технологии в истории человечества неизбежно будет сопровождаться размышлениями, дискуссиями и противоречиями. Перед лицом подъема искусственного интеллекта с революционными и глобальными изменениями в сфере технологий волнение, вопросы и проблемы крайне разнообразны. Некоторые из них более эмоциональны. Например, обсуждают, может ли искусственный интеллект заменить человека. Речь идет о сравнении искусственного интеллекта с природным (Natural Intelligence).
По вопросу природного интеллекта существуют различные исследования и труды, в том числе и те, которые предполагают, что механизм человеческого мозга опирается на квантовые вычисления. Для искусственного интеллекта нет четкого определения, которое бы не вызывало споров. На данном этапе развития ИИ нет необходимости усердствовать над критериями оценки. Мы могли бы обсудить это прагматично: какие интеллектуальные системы теперь могут позволить нам сделать технологии.
Существует два типа вычислительных систем, которые люди называют искусственным интеллектом.
Первый эквивалентен подсистеме «интеллектуальных вычислительных систем» (ICS). Он использует информацию в качестве входных данных и на ее основе моделирует явления, которые нас интересуют. Мы называем этот тип системы ИИ «универсальной интеллектуальной системой» (General AI). Название говорит о том, что машина обладает способностью получать знания и достигать поставленных целей.
Второй — это машины с когнитивными способностями, которые подобны человеческим. Машины могут «видеть», «слушать», «чувствовать», могут все больше рассуждать и планировать, могут двигаться благодаря сенсорному управлению движения. Мы называем этот тип системы искусственного интеллекта «когнитивной интеллектуальной системой» (когнитивный AI). Это машина со способностями восприятия, рассуждения, планирования и сенсорным управлением движения.
К другой классификации системы искусственного интеллекта относятся «узкий ИИ» и «Общий AI». «Общий AI» — это система, которая использует один и тот же алгоритм для решения большого класса задач. Система «обобщенного ИИ» может быть изучена и адаптирована для решения новых задач без вмешательства человека. Система «узкий AI» использует определенный алгоритм для решения конкретных задач, таких как игра в шахматы, создание карт и т. д.
Таблица 2-1 представляет собой обзор состояния системы искусственного интеллекта. И может служить жизнеспособным определением.
Таблица 2-1
Интеллектуальные вычислительные системы напрямую связаны с большими данными. Любые данные имеют критерии, по которым они генерируются. В основе данных лежит знание.
Основная компетенция универсальной системы искусственного интеллекта заключается в извлечении знаний из данных с помощью алгоритмов и вычислительных систем. После того, как мы получим знания, мы можем сделать множество вещей. Мы можем предсказывать явления и события, можем решить проблему автоматизации, можем решить любую проблему, которая нуждается в решении. Знание говорит нам, чего хотят люди, чего требует общество. Со знанием мы можем найти ответ. Таким образом, первый уровень развития искусственного интеллекта — общий искусственный интеллект.
Прорыв в глубоком обучении, достигнутый в последние годы, касается уровня восприятия. В частности, распознавания изображений и речи, а также понимания естественного языка. Но это только начало. Следующее, что нужно сделать, это добавить познавательную функцию. Система должна научиться познавать окружающий мир через свет, вибрацию звука или язык общения и символы.[5] Самое главное — понять, что это значит. Система видит перед собой картину и может определить, какие объекты или люди в ней находятся и что делают.
В настоящее время почти все компании, которые занимаются разработкой ИИ, могут быть размещены в четырех квадрантах. Большинство компаний создают «узкий AI», который решает только одну проблему или несколько относительно узких: играть в карты или открыть автомобиль. «Общий ИИ» использует одну и ту же систему, для решения всех проблем. И это уже похоже на человеческий интеллект. «Общий ИИ» — это долгосрочная цель развития искусственного интеллекта, достижение которой займет не менее двадцати-тридцати лет. Baidu, Google, Microsoft, Facebook и другие компании работают в направлении «общего AI». И они способны судить, может ли человек с помощью искусственного интеллекта знать больше, делать больше, испытывать больше. Например, компания Baidu, опираясь на данные поисковых систем, провела большое количество технических исследований, прежде чем создать практически невозможное — продукт, который опирается на мнения людей. Мы нашли множество беспрецедентных знаний и сделали множество выводов. Благодаря этому сейчас люди знают больше. Но мы не остановились и продолжаем двигаться вперед, чтобы добиться более невозможного. Беспилотные технологии управления, технологии взаимодействия на естественном языке, сенсорные методы движения постоянно совершенствуются. Сейчас люди используют глаза, чтобы видеть, и уши, чтобы слышать. Но, возможно, в будущем нам не понадобятся ни глаза, ни уши, потому что у нас появится более совершенный способ восприятия реальности.
Таким образом, все компании в сфере ИИ можно оценить по нескольким вопросам: Какой из четырех квадрантов занимает компания? Есть ли у нее силы и средства, чтобы люди с машинами знали больше, делали больше, испытывали больше?
В США и Китае существует множество компаний, которые утверждают, что они занимаются развитием искусственного интеллекта. Некоторые из них говорят, что ИИ — это облачные вычисления. Другие, что ИИ — это большие данные. Но это лишь часть системы искусственного интеллекта. Сила искусственного интеллекта — это массивы данных, облачные вычисления, алгоритмы, время обучения и общая мощность, а также программное и аппаратное обеспечение.
Такую силу невозможно собрать в одночасье. И не имеет смысла обобщать. На Земле нет одной дороги. Есть разные пути. Есть разные сайты, люди, бизнесы. Кто-то из них только начал движение, а кто-то оставил за спиной уже внушительную часть пути.
Baidu Brain можно рассматривать как типичную силу искусственного интеллекта. Его способность к разделению может подчеркнуть нашу состоятельность в индустрии искусственного интеллекта. Если у компании, специализирующейся на продуктах с ИИ, нет возможностей в будущем, можно сказать, что она не готова войти в эту сферу.
Baidu Brain — это сочетание аппаратной базы, базы данных и алгоритмических возможностей, облачных вычислений, больших данных и искусственного интеллекта. Это сочетание является основой стратегии Baidu. Облачные вычисления — это инфраструктура. Массивы данных — это топливо. Искусственный интеллект — это двигатель, объединяющий «физику интернета», интернет-технологии и бизнес-модели цифрового мира. Он входит в общество, чтобы полностью его изменить.
Облачные вычисления, имя в облаке — это нижняя составляющая мозга Baidu, физическая его часть IaaS (Infrastructure as a Service, инфраструктурные услуги).
Супервычислительная мощность Baidu Brain достигается за счет высокопроизводительного вычислительного оборудования. Оно составляет сотни тысяч серверов и использует передовые кластерные операционные системы для унифицированного управления суперкомпьютерами ИИ.
Для того, чтобы расширить возможности обучения, Baidu самостоятельно разработал GPU и FPGA (Программируемая пользователем вентильная матрица) гетерогенный вычислительный сервер. Он был увеличен до 64 GPU / FPGA и превосходит традиционную плотность сервера в 16 раз. Один сервер теперь может завершить обучение 100 миллиардов моделей данных. В основе Baidu FPGA находится процессор, обеспечивающий 10 Tops[6] вычислительной производительности. Он превосходит основной 20-ядерный сервер по вычислительной эффективности в 60 раз.
Но преимущество Baidu не только в одной машине, но и в отличной системе, отличной индивидуальной интеграции. Это формирует широкий спектр возможностей. Интеллектуальное планирование и система управления ресурсами для кластеров GPU позволяют осуществлять управление и динамическое планирование вычислительных, сетевых пулов, а также ресурсов хранения, вычислять общую эффективность и среднее использование кластера на 80 %. Гетерогенное оборудование для онлайн-продуктов, уменьшающее задержки запросов пользователей в 5 раз, повышает эффективность вычислений в десятки раз.
Система представляет собой самый большой кластер GPU/FPGA в Китае, самый большой кластер HADOOP/SPARK — новая одновременная и самая эффективная технология обработки данных (новые вычислительные технологии, серверные технологии, технология доступа 100G RDMA (дистанционная мгновенная технология доступа к данным) и технология O&M). Она обеспечивает вычислительную мощность, необходимую для развития искусственного интеллекта.
Топлива тоже достаточно. За годы работы в сфере ИИ компания Baidu собрала большое количество данных: триллион данных по страницам, миллиарды данных поисковой системы, 10 миллиардов видео, 10 миллиардов изображений и аудиоданных. Данные — это топливо для алгоритмов искусственного интеллекта. Это одно из основных условий развития искусственного интеллекта.
Оборудование в сочетании с топливом является отличным алгоритмом и моделью развития. Baidu собрал команду ведущих мировых ученых и инженеров, специализирующихся на теории и практике непрерывных инноваций, построил крупнейшую в мире глубокую нейронную сеть, поддерживающую триллионы параметров, сотни миллиардов образцов, сотни миллиардов характеристик обучения. Глубина нейронной сети значительно превысила 100 слоев.
Аппаратные мощности, топливо из данных и душа, алгоритм, позволили создать Baidu PaaS (Platform as a Service). Отличительной особенностью Baidu PaaS является то, что ИИ — горизонтальный сервис для всей платформы. Глубокое обучение, технологии машинного обучения в сочетании с мощными вычислениями, массивные данные и отличные алгоритмы, голос, изображения, обработка естественного языка и другие аспекты создают уникальные возможности для разработки карт знаний, портретов пользователей и бизнес-логики. Кроме того, они полностью открыты для пользователей. Пользователи могут легко использовать различные модули алгоритма, инструменты разработки, данные для своих собственных бизнес-целей. Мы используем различные платформы для разных целей: Tianji — для интеллектуальных массивов данных, Tianxiang — интеллектуальных мультимедиа, Tiangong — интеллектуальных вещей. Так, у нас есть возможность оказывать услуги во всех трех областях.
На верхнем уровне SaaS (Software as a Service) искусственный интеллект Baidu используется для принятия вертикальных решений, проникающих во все отрасли. Мы стремимся работать с нашими партнерами над созданием интеллектуальной индустриальной экосистемы, куда войдут образовательное облако, финансовое облако, транспортное облако, логистическое облако и т. д. Мы считаем, что способность строить экологию интеллектуальной промышленности — важный критерий для определения ценности искусственного интеллекта.
В аппаратных мощностях, данных и алгоритмах есть один важный пункт — культура искусственного интеллекта, или «мягкая сила». Технология поиска стала пионером в сфере искусственного интеллекта и первым интернет-порталом цифрового мира. Процесс разработки и технологическое ядро поисковой системы заложили основу для будущего ИИ. Поисковые системы, во-первых, должны были иметь дело с очень большими объемами данных. Во-вторых, должны были обладать функциями глубокого обучения. Операции невозможно совершать вручную, так как объем данных был и остается слишком велик. И, наконец, ключевой момент. Процесс разработки поисковых систем согласуется с развитием систем искусственного интеллекта, в основном с данными, которые представляют ценность для пользователя. Отношения сотрудничества, деловые возможности и рабочие привычки, массивы данных и накопление корпоративной культуры людей из бизнеса поисковых систем очень схожи с бизнесом ИИ. Так Лу Цзи всегда начинал обучать новичков с Bing. Справился там, справишься и в любом другом секторе. В поиске используются очень простые методы. Конечно, культура еще не идеальна. Но она, как и нейронные сети, может развиваться и совершенствоваться при правильном подходе.
Искусственный интеллект + мир
Раньше люди активно обсуждали плюсы интернета. А теперь переключились на плюсы искусственного интеллекта в бизнесе, промышленности, здравоохранении, образовании и так далее. С точки зрения «знай больше, делай больше, испытывай больше», ИИ для мира будущего является фундаментальным явлением. Так появился вопрос — «искусственный интеллект + мир».
Во-первых, интеллектуальная революция может иметь далеко идущие последствия для повседневной жизни каждого человека. Самый простой пример — благодаря новаторским разработкам в области искусственного интеллекта, калькулятор и человек смогут разговаривать на одном языке.
Предыдущие взаимодействия человека и машины происходили через мышь и клавиатуру. Развитие Майкрософт позволило усовершенствовать способ коммуникации. Сегодня мы общаемся через мышь, клавиатуру и GUI (графический интерфейс пользователя), что называется рациональным взаимодействием человека и компьютера. Самый большой вклад компании Apple и Стива Джобса в развитие IT-технологий — это новый способ общения с машинами с помощью пальцев, который изменил мир. В эру искусственного интеллекта мир постоянно меняется. Теперь люди могут общаться с любым устройством на естественном языке.
Естественный язык является наиболее эффективной и универсальной формой общения. Общение между людьми — это язык, самый естественный и широко используемый. Реализация взаимодействия между человеком и компьютером на естественном языке означает, что людям не нужно будет разбираться в принципах работы каждого приложения и устройства, чтобы узнать, как им пользоваться. В будущем мы сможем общаться с автомобилями и домами напрямую.
Мы уже видели зачатки этого интеллектуального взаимодействия. Например, постепенно появляются некоторые интеллектуальные вспомогательные системы. В Соединенных Штатах люди с помощью Amazon превращают дом в умную систему. В Китае команда Baidu тоже провела много исследований в этой области. У нас есть возможность полностью изменить повседневный процесс взаимодействия людей друг с другом.
Наконец, искусственный интеллект станет двигателем новой промышленной революции. Многие люди задумываются о новой версии промышленного производства 4.0. Вступит ли мир в следующий этап цифрового общества? Интеллектуальные системы будут иметь возможность черпать данные из реальной жизни, перемещаться по знаниям. Этим они помогут людям воспринимать и познавать реальный мир. И внедрять изменения в экономические, социальные, культурные и другие аспекты жизни. Нам повезло жить в увлекательной эре, очень похожей на раннюю промышленную революцию. Но искусственный интеллект имеет гораздо большее влияние на общество.
Традиционная обрабатывающая промышленность (оборудование, электроприборы и электроэнергетика, производственные линии) использует очень крупные инвестиции для создания продукта, изменение которого вызывает известные сложности. Например, чтобы создать производственную линию автомобилей, потребуется внушительное количество времени и средств. Умные данные смогут точно предсказать конец завершения преобразования обрабатывающей промышленности и создать новую модель производства. Производство будущего — модульный процесс с цифровым управлением. Если автопроизводитель захочет создать новый тип автомобиля, ему не потребуется перестраивать производственные линии. Нужно будет всего лишь изменить интерфейс (API) для нового продукта и перейти на него. Это в корне изменит производственную базу и значительно улучшит эффективность производства.
В основе этого изменения лежат данные и знания, а именно знание процесса производства. Теперь каждый шаг можно будет контролировать с помощью цифровых технологий.
Приведем пример из фармацевтической промышленности. Создание нового лекарственного препарата — это длительный процесс исследований и разработок, чтобы выявить наиболее эффективный способ для борьбы с конкретным заболеванием. В будущем с помощью вычислительных технологий искусственного интеллекта, больших генетических данных и массивного анализа информации о здоровье человека индивидуальный подбор лекарств будет осуществляться в считанные минуты.
Рис. 2-1 Стремительный рост геномных данных[7]
Искусственный интеллект не только повышает общую конкурентоспособность Китая на мировой арене, но и дает ему существенные преимущества. КНР — крупный игрок в обрабатывающей промышленности, где объем данных имеет большое значение. Это означает, что у нас есть возможность извлечь больше «знаний» и получить лучший результат, чем у других. Вы знаете больше, чем кто-либо другой. Видите больше, чем кто-либо другой. Можете сделать больше, чем кто-либо другой. Вы сильнее, чем кто-либо другой. Интеллектуальная эпоха, национальная конкуренция, промышленная конкуренция, овладение большими объемами информации может сделать тебя непобедимым. Если бы Китай воспользовался этой возможностью и завершил интеллектуальную модернизацию, другие страны не смогли бы с ним конкурировать. Но то, как достичь умного производства, требует общего стратегического анализа.
Преимущества Китая
В настоящее время США и Китай являются двумя крупнейшими странами с точки зрения искусственного интеллекта.
Люди привыкли сравнивать Baidu и Google, что также можно рассматривать как уменьшенную копию сравнения США с Китаем. Я думаю, что у обеих компаний есть много общего — происхождение, корпоративная культура. Baidu имеет преимущество в Китае, а Google — в США.
Но есть и отличия. У Baidu больше пространства для инноваций и выше их скорость, чем у Google. Это связано с национальными условиями Китая и США.
Уровень инноваций мобильного интернета в Китае на многих уровнях превзошел уровень инноваций в США.
Например, создание инновационного мобильного телефона с функциями искусственного интеллекта для поиска информации. Baidu имеет больше возможностей для инноваций, чем Google. IT-отрасли в США и Китае имеют разные модели. Baidu Financial может опираться на преимущества китайского рынка и объемы данных и, используя технологию ИИ, создать нечто революционное. В Соединенных Штатов финансовая индустрия имеет «сильные барьеры», поэтому Google попасть в финансовый сектор проблематично.
Другой пример — беспилотные автомобили. Google и Baidu пионеры в этом направлении. Сейчас Google немного обогнал Baidu. Но не факт, что это будет долго длиться. Сегодня множество китайских автопроизводителей открыты для сотрудничества с предприятиями ИИ, в частности с Baidu. Вместе у нас очень много возможностей для нововведений. И скорость таких нововведений будет значительно быстрее, чем у США. В Америке большинство автопроизводителей располагаются в Детройте, поэтому им сложно наладить коммуникацию с компаниями в сфере ИИ.
Беспилотный ли это автомобиль, финансы, здравоохранение или производство вообще, Китай и Соединенные Штаты смотрят на будущее под одним углом. Тем не менее макросреда в Китае дает умным компаниям, как Baidu, больше возможностей и пространства для действий, чем США для Google.
Итак, какую же ответственность должна взять на себя компания Baidu в условиях новой эры искусственного интеллекта?
В Соединенных Штатах система IT-индустрии, как правило, зависит от пяти компаний: Apple, Google, Facebook, Amazon, Microsoft. Компания, поддерживающая ИИ, — это не просто производственная компания. Это компания, которая управляет развитием технологий и играет роль лидера экосистемы.
В эпоху искусственного интеллекта Baidu является компанией поддержки. У нас есть такая возможность. Поэтому мы должны продолжать бороться за интеллектуальную революцию в Китае и в мире и внести свой вклад в это непростое дело.
Чтобы стать первопроходцами и основателями, мы должны позиционировать себя как «наделенные полномочиями». Baidu — это, прежде всего, китайский мозг Baidu. Интеллектуальное облако Baidu доступно для всех отраслей промышленности и для любой открывает широкие возможности для движения вперед.
Как основоположник отечественного искусственного интеллекта, Baidu имеет влияние на развитие и совершенствование во многих отраслях сферы искусственного интеллекта.
Например, здравоохранение и образование — очень большая область применения ИИ. Здесь особенно ярко наблюдается проблема недостатка данных. Знания и опыт могут быть только приобретены и накоплены. Поэтому высокую квалификацию имеют старые учителя и врачи. В будущем с помощью машин мы сможем автоматически анализировать данные, помогая тем самым врачам упростить подбор медикаментов, а учителям найти индивидуальный подход к каждому ученику. Здравоохранение станет давать людям больше здоровья, а образование — знаний. В обеих областях применение ИИ будет играть существенную роль.
Или беспилотные автомобили, например. Создание дронов также опирается на восприятие, познание и знание. Сегодня введение беспилотных автомобилей в эксплуатацию еще не представляется возможным и требует времени[8]. Но как только мы этого достигнем, у общества откроются огромные перспективы для трансформации. Это не просто решение транспортной проблемы. Беспилотная машина может двигаться сама по себе. И это скажется во всех отраслях промышленности.
Искусственный интеллект предоставляет нам такое количество возможностей, что реализовать их все и сразу не представляется возможным. Конечно, стратегия трансформации общества должна реализовываться шаг за шагом. Направление движения должно быть твердым, а темп устойчивым.
Бизнес-вызов: приземление
Однажды Лу Цзичанг сказал: «Голову держи над облаками, но ногами стой на земле». Это значит, что вы должны держать голову выше, чтобы видеть далеко и ясно, но ноги должны ступать по земле, чтобы шаг за шагом двигаться вперед.
Первое, что мы должны сделать, чтобы дать искусственному интеллекту жизнь, — приземлиться. ИИ сулит нам очень большие и долгие изменения. Для приземления потребуется хороший пользовательский опыт получения реальной выгоды. Также потребуется понятный сценарий — интеллектуальный помощник или беспилотный автомобиль должны иметь достаточно информации о людях, чтобы иметь для них ценность. И, наконец, нужна эффективная бизнес-модель, чтобы добиться устойчивости.
Таким образом, задача заключается в том, чтобы преобразовать пользовательский опыт в пользовательскую ценность, а затем подобрать бизнес-модель для создания инновационного цикла: данные — знание — опыт — новые данные. Попав в такой цикл, ИИ сможет продвигаться вперед стремительно, как снежный ком.
Рис. 2-2. Инновационный «маховик» искусственного интеллекта
Генеральный директор (CEO) каждой компании должен обратить внимание на искусственный интеллект. Затем необходимо найти ресурсы, в том числе нанять тех людей, которые действительно разбираются в ИИ, и тех, которые могут взять на себя ответственность за принятие решений. Компаниям, будь то розничная торговля, обрабатывающая промышленность или туризм, следует разработать собственную интеллектуальную стратегию в соответствии с их бизнес-целями, а затем твердо ей следовать. При этом у исполнителей должны быть достаточные полномочия, чтобы посредством стратегического их разделения внедрять ИИ в конкретные операции.
Модель «рабочего двигателя» может использоваться для реализации стратегии ИИ.
Во-первых, в соответствии с направлением развития искусственного интеллекта следует переосмыслить позиционирование предприятия — ориентируясь на свои бизнес-цели, выбрать новое направление развития, определить новую миссию и видение в эпоху ИИ.
Во-вторых, в соответствии с новым позиционированием предприятия разработать интеллектуальную стратегию. Это возлагает на руководство компании большую ответственность. Оно должно четко понимать, «что входит» в сферу, а «что выходит», чтобы принимать эффективные решения.
При принятии решений о «входе/выходе» следует придерживаться определенных принципов. Иерархическая структура принятия решения консультанта Кремниевой долины Джеффри Мура (Jeffrey Moore) — хороший пример оценки развития искусственного интеллекта. Суть в том, чтобы войти в сферу с высоким ростом и выйти из сферы с низким. Искусственный интеллект будет постоянно создавать новые сферы с огромным потенциалом роста, такие как беспилотные автомобили, роботы, умные устройства, диалоговые системы. Но в то же время он может и чинить препятствия для некоторых отраслей. Новые продукты с функциями ИИ заменят уже имеющиеся. Новые аппаратные средства и программные стеки нанесут ущерб старым стекам HW. Хорошей идеей будет составить полный список сфер и категорий высокого роста, возможного роста и низкого. Так руководство сможет принимать систематические и взвешенные решения.
Далее следует определить исходные данные продукта. Является ли он «ценным и уникальным»? Стоит отметить, что в эпоху ИИ успех продукта будет во многом зависеть от способности компании сохранять свою индивидуальность. Только так возможно получить уникальные активы данных (приносящие уникальные знания).
Следующий шаг — понимание неопределенности, риска, прибыли и графика для прогнозирования и управления. «Модель горизонта» — оптимальное решение. Примерный план развития: период H1 (следующие 18 месяцев) — упор делается на основное направление бизнеса; период H2 (следующие 18-36 месяцев) — инвестирует в создание прибыльной инновации; период H3 (следующие 36 месяцев+) — ставки делаются на долгосрочные инновации, которые имеют большой потенциал и высокий риск. Эра искусственного интеллекта предлагает широкий ассортимент возможностей для периодов H2 и H3. А некоторые из инвестиций в ИИ могут помочь увеличить прибыль и от периода H1. Сейчас искусственный интеллект находится на ранней стадии своего развития, что порождает множество неизвестных. Для того, чтобы глубже понять ИИ, важно принимать принципиальные и прагматические решения.
Во-первых, на этапе реализации стратегии внедрения ИИ предприятию следует придерживаться принципа «структурной целостности» в опыте продукта, технологической архитектуре и бизнес-модели. Необходимо развиваться последовательно. Если вы меняете направление ICS (архитектура сервера/клиента) или инвестируете в «автономную систему», технологические решения должны быть синхронизированы с продуктами и бизнес-решениями.
Во-вторых, важно, чтобы предприятия, использующие ИИ, следовали за направлением развития технологии глубокого обучения. Синхронизация имеет большое значение.
Ведущие компании индустрии испытывают потребность в изменении мира, стремятся сформировать мировоззрение мирового технологического общества. Они собирают сильные научно-исследовательские группы и проводят масштабные исследования. Их цели соответствуют позиционированию компаний и совершенствованию их продуктов. DeepMind, Google, Baidu и некоторые другие гиганты отрасли разделяют эту позицию.
Обновление исследовательских механизмов также является важным шагом на пути развития. Ведь традиционно ИТ-индустрия и наука не очень успешны в коммерциализации результатов исследований. Недавние OtherLab или OpenAI и некоторые другие стартапы искусственного интеллекта активно набирают собственные исследовательские команды. И это превращается в тенденцию. Потому что для разработки структурированных и устойчивых решений требуются усилия различных организаций (ранние экосистемы, крупные предприятия, учебные и научно-исследовательские учреждения).
Инвестиции являются важным фактором, который необходимо учитывать. С углублением интеллектуальной революции, ожесточается борьба за таланты. Это приводит к росту стоимости искусственного интеллекта. Некоторые стартапы привлекают внушительные суммы денег, потому что в долгосрочной перспективе отдача от инвестиций может быть очень велика (высокий риск/высокая отдача). Ключ к планированию инвестиций заключается в приоритезации ресурсов и продуманном процессе принятия решений, отражающем риски, связанные с искусственным интеллектом.
После того, как все необходимые условия сойдутся, лидерские качества человека станут решающим фактором, ценнейшим и перспективнейшим. Эпоха ИИ базируется на технологии, которая абсолютно не похожа на предыдущую (в качестве ядра выступают нейронные вычисления). Поэтому она требует от руководства высокого внимания и ответственности. Кроме того, новые отрасли в сфере ИИ настолько разнообразны и междисциплинарны (все, что вы можете себе представить от генетики до робототехники), что компаниям требуются люди, способные работать с инновациями (найти их непросто, потому что сегодняшнее общество сосредоточено на развитии узкоспециализированных отраслей). Билл Бакстон, главный научный сотрудник Microsoft Research, предлагает эффективные решения для создания новаторской команды высшего руководства.
Стоит напомнить, что в основе инновационного «маховика» ИИ лежит цикл обратной связи: данные — знания — опыт — новые данные. Оптимизация емкости и скорости этого цикла обратной связи является важной составляющей планирования.
Необходимая макросреда
Предприятия и научно-исследовательские институты не могут работать без хорошей макросреды. Национальный китайский интеллектуальный план призывает к созданию интеллектуальной инфраструктуры на уровне страны. Ведь чтобы встретить эру искусственного интеллекта, необходимо создать надлежащую почву.
Во-первых, необходимо обеспечить беспрепятственный доступ к данным. Данные становятся стратегическим активом для многих организаций и могут рассматриваться как новый тип «природных ресурсов». Для правительств, в частности, данные могут быть полезны в процессе разработки стратегии политического управления. Это может послужить стимулом для более широкого внедрения инноваций.
Во-вторых, нужны инструменты и платформы с открытым исходным кодом. Эра искусственного интеллекта требует нового стека программного обеспечения Silicon+. При этом важно, чтобы инструменты и платформы с открытым исходным кодом, такие как PaddlePaddle, были доступны и разработчикам, и новаторам. Глядя в будущее, мы должны постоянно снижать степень участия человека в процессах и передавать задачи инструментам и модулям. Например, AWS (Amazon Cloud Service) делает проще вычисления, а некоторые AI-as-a-service (AI-Service) делают технологии ИИ более доступными.
В-третьих, новаторы должны быстро создавать рыночные и политические условия для своих продуктов и пользователей. Это также очень важно. Потому что инновационный «маховик» ИИ требует быстрого цикла обратной связи.
В-четвертых, в начале эпохи искусственного интеллекта поощряются непрерывные прикладные исследования. В частности, разработка ML-алгоритма (машинного обучения), который может получать знания из данных и создавать опыт — ядро инновационного «маховика». На данном этапе развития ИИ непрерывные исследования — важная составляющая деятельности для всех предприятий этой сферы.
В-пятых, следует озаботиться образованием. Требования ИИ к человечеству неизбежно приведут к проблеме нехватки талантов. Образование должно стать обширнее и качественнее для того, чтобы для проектирования и реализации алгоритмов машинного обучения хватало человеческого ресурса.
Наконец, должен быть сформирован новый структурированный подход, превращающий знания внешнего мира в организованный и доступный материал. Это имеет решающее значение для внедрения инноваций ИИ во многие компании и сферы жизни.
Культура и управление интеллектуальным обществом
Потребуются десятилетия, чтобы искусственный интеллект начал полноценно функционировать. Амбиции и претензии на изменения мира требуют долгосрочного инвестирования. Поэтому долгосрочное планирование и стратегическое управление играют важную роль в эпоху искусственного интеллекта. Нас ожидает трансформация культуры бизнеса и управления во всем мире.
В частности, это требует, чтобы руководство устанавливало более крупный «лицензионный пакет». Он позволит руководящей группе иметь больше свободы и возможностей делать ставки на инновации. Это важный аспект ежегодного управления. Маск говорил, что «инновация, потерпевшая неудачу, не должна быть наказана».
От компаний, пострадавших от ИИ, потребуется обновление всей организации, чтобы влиться в обновленный мировой ландшафт. Высшее руководство должно жестко держать руку на пульсе и управлять процессами трансформации.
Одним из факторов, связанных с долгосрочным менеджментом, является создание новой организационной структуры, которая будет достаточно зрелой, чтобы легко адаптироваться к изменениям, вызванным искусственным интеллектом. Alphabet (Управляющая компания Google после реорганизации) — одна из самых ранних попыток. В этом отношении китайские компании внедряют больше управленческих инноваций, чем США.
Культура — это сила организации, которая может выйти за рамки нескольких поколений лидеров и деловой активности. Для многих зрелых компаний (Google, Baidu) доступ к возможностям искусственного интеллекта представляет собой серьезную проблему: потребность в новых талантах, новых патентах на технологии и создании новой культуры. Очень важно быть активными, терпеливыми и настойчивыми, поскольку культурная трансформация является одной из самых сложных задач для зрелого предприятия. Кроме того, забыть о старых методах работы гораздо сложнее, чем внедрить новые.
Так как мы находимся на начальной стадии развития искусственного интеллекта, привлечение и поддержание специалистов очень важно для управленцев.
В целом, долгосрочное планирование и стратегическое управление являются ключом к использованию любой важной возможности не только в эпоху ИИ. Как изменить существующую инфраструктуру, чтобы привлечь больше денег, талантов и добиться больших результатов — интересная и сложная задача для лидеров бизнеса. Решение глубоких, интересных и сложных проблем является признаком прогресса человечества.
Современное состояние развития технологий ИИ
Статьи на темы искусственного интеллекта, глубокого обучения и новых исследований выходят каждый день. Сегодня, как в эпоху Возрождения, наука меняется на глазах. Ведь истинный смысл науки заключается в том, чтобы наблюдать за миром и обобщать знания. Мы наблюдаем, как мир становится все более компетентным. Мы используем алгоритм глубокого обучения, и появляются новые знания.
Это не только физика, биология, материаловедение… Каждая область науки отчаянно быстро движется вперед. Таким образом, человечество находится в состоянии быстрого прогресса. Давайте в конце этой главы снова обратим внимание на квантовые вычисления.
Отметим очень интересную связь между искусственным интеллектом и нейро-вычислительными структурами, использующими распределенное векторное представление слов. Их основные операции основываются на линейной алгебре, а не булевой. Это говорит о том, что человеческий мозг в чем-то схож с физикой. Даже ученые предполагают, что человеческий мозг работает по принципу, аналогичному квантовой физике, теори и алгоритму квантовых вычислений.
Квантовые вычисления имеют важное значение в сфере искусственного интеллекта. Microsoft и Google, например, создали лабораторию квантового ИИ и ведут активную разработку проектов в этой области. Вопрос об уместности квантовых вычислений в ИИ не должен рассматриваться совсем. А вот вопрос о том, когда квантовые вычисления станут частью искусственного разума, уместен. Существуют разные мнения на это счет. Некоторые отмечают промежуток времени до 5 лет или даже меньше до того момента, как появятся ранние квантовые машины.
Почему квантовые вычисления так важны? Потому что они тесно соприкасаются с человеческим интеллектом. В основе квантовых вычислений лежит квантовая суперпозиция. Квантовая способность изменяет состояние при добавлении энергии. Современный компьютер может занимать только одну позицию — цифру 0 или 1. В то время как квантовые суперпозиции могут занимать три позиции одновременно. А их вычислительная мощность растет экспоненциально.
Преимущество в том, что многие проблемы с данными могут быть решены с помощью квантовых вычислений. Предыдущий подход — это разложение чисел. Например, шифрование и дешифрование данных, декомпозиция с использованием простых чисел. Довольно трудно получить большое число при разложении простых. Например, вычислить разрушение Земли таким образом практически невозможно. Но с помощью квантового алгоритма вычислений это станет не только возможным, но и относительно быстрым процессом. Этот алгоритм сделает машинное обучение вполне естественным.
В связи с этим необходимо усовершенствовать аппаратное обеспечение. В настоящее время все аппаратные средства базируются на булевой алгебре, а основные вычисления глубинного обучения обеспечиваются матричными и тензорными расчетами, а не вычислениями 0 и 1. И они должны выполнять дифференциальные операции. Квантовые вычисления идентичны, и каждый раз, когда квантовая энергия изменяется, образуется вычислительная связь между матрицей и тензором. Природа этих вычислений на самом деле та же самая, что и в человеческом мозге. Мэтью Фишер, Пан Цзяньвэй, Чжу Цин Чжи и другие ученые считают, что суть сознания — это квантовая запутанность.
В 2007 году журнал Nature опубликовал результаты лабораторных исследований, которые проводились под руководством Грэма Флеминга в Калифорнийском университете в Беркли. В ходе исследования лазеры сверхкоротких импульсов были применены для облучения светособирающих комплексов. Это помогло установить, что квантовые эффекты играют незаменимую роль в фоточувствительном синтезе. Революция в области квантовых вычислений — это доказательство единения природы и человеческого интеллекта. Открытие влияния квантовых эффектов на живые организмы в значительной степени вдохновило человечество на новые исследования квантовых вычислений и человеко-машинных комбинаций.
Конец ознакомительного фрагмента.
Приведённый ознакомительный фрагмент книги Baidu. Как китайский поисковик с помощью искусственного интеллекта обыграл Google предоставлен нашим книжным партнёром — компанией ЛитРес.
Купить и скачать полную версию книги в форматах FB2, ePub, MOBI, TXT, HTML, RTF и других
4
Чэнь Цзинжунь известен тем, что доказал теорему Гольдбаха «1+2». Репортаж Сюй Цзи, «Гольдбаховская гипотеза», был опубликован в первом номере журнала «Народная литература» в январе 1978 года Чэнь Цзинжунем, имя которого в то время стало нарицательным.
5
За последние несколько лет нейросети научились понимать, что за объекты находятся на фотографии и как они взаимойдействуют друг с другом. Например, чашка стоит на столе, а ложка находится внутри чашки. В экспериментальных сетях достигнут и обратный эффект: по текстовому описанию нейросеть способна воссоздать изображение, например женщину, едущую на лошади по лугу. — Прим. науч. ред.
7
Великобритания запустила «геномную программу 100 000 человек» в 2014 году, а США и Китай объявили о завершении сбора геномных данных до 1 миллиона человек. Данные, полученные всемирно известной компанией по секвенированию генов Illumina Instruments sequencing, удваиваются каждые 12 месяцев. Это огромная «черная дыра данных», а также золотодобывающая шахта данных.