Компьютерное го

Компьютерное го — направление искусственного интеллекта по созданию компьютерных программ, играющих в го.

Препятствия на пути программ

В течение долгого времени считалось, что компьютерное го имеет существенные различия по сравнению с компьютерными шахматами, поскольку методы, основанные на быстром поиске по сравнению с человеческим опытом, объединённые с относительно низким знанием предметной области не будут эффективны для го. Поэтому большие усилия в области компьютерного го были потрачены на объединение экспертных знаний с локальным поиском для нахождения ответа на вопросы тактической природы игры. Результатом этих усилий были программы, способные находить хорошие решения в некоторых локальных ситуациях, но имевшие явные слабости в полной обработке игры. Кроме того, эти классические программы с увеличением мощности аппаратуры мало получали в плане силы игры и поэтому развитие этой области было в целом медленным. Поэтому считалось, что программа, хорошо играющая в го, может быть создана только в далёком будущем и только с помощью накопленных к тому времени общих знаний в области искусственного интеллекта. Даже написание программы, способной определить победителя в законченной игре, воспринималось как нетривиальная задача.

В 2006 году появились программы, основанные на поиске Монте-Карло. Сила игры искусственного интеллекта улучшилась. Но разрыв с уровнем игры профессиональных игроков в го оставался, и причём значительный.

Однако в 2015 году компьютерная программа (AlphaGo, компании DeepMind) впервые выиграла у профессионала (Фань Хуэя, 2 профессиональный дан) равный матч (со счётом 5—0)[1].

В марте 2016 года AlphaGo победила профессионала Ли Седола в первых трёх партиях из пяти игр.[2] Это был первый случай, когда профессионал 9 дана, один из сильнейших игроков мира, играл с компьютером без гандикапа.[3] В четвёртой игре Ли смог одержать победу, но пятую партию выиграл компьютер, таким образом матч закончился со счетом 4:1.[4][5] (см. подробно: Матч AlphaGo — Ли Седоль)

В мае 2017 года на саммите «Future of Go Summit» был сыгран мини-матч из 3 партий между AlphaGo и одним из сильнейших игроков в мире, лидером мирового рейтинга Эло Кэ Цзе, где все партии выиграла программа[6][7][8]. На этом же форуме AlphaGo обыграла команду из 5 профессионалов максимального 9 дана (Ми Ютин[англ.] (№ 3 в рейтинге сильнейших игроков, рейтинг перед матчем 3571 пункт), Чэнь Яое (№ 8, 3513)), Чжоу Жуйян (№ 10, 3509), Си Юэ[англ.] (№ 11, 3508), Тан Вэйсин[кит.] (№ 18, 3474))[9].

Слишком большая доска

Большая доска (19x19, 361 пересечение) часто отмечается как основное препятствие на пути создания сильных го-программ. Проблема большой доски в том, что она препятствует глубокому поиску методом альфа-бета-отсечения.

Пока самой большой доской, на которой к настоящему времени был осуществлён полный перебор позиций является доска 6x7[10].

Большое количество допустимых ходов

По сравнению с шахматами, ходы в го почти не ограничены правилами. В то время как первый ход в шахматах может быть осуществлён двадцатью способами, первый ход в го имеет 55 вариантов, с учётом симметрии доски. После нескольких первых ходов в разных углах доски симметрия игровой ситуации утрачивается и количество возможных ходов возрастает, достигая количества свободных пунктов на доске.

Отсутствие «точной» дебютной теории

Начальная стадия партии в го — фусэки — подчиняется определённым общим принципам развития конфигураций камней, но для неё характерно гораздо большее разнообразие ходов, чем в шахматах. Новинки могут встречаться не на 20-м ходу, а уже на третьем или четвёртом, и грамотная игра в дебюте невозможна без осмысления стратегических перспектив конструкций, возникающих на доске. Дзёсэки (типовые схемы розыгрыша позиции на ограниченной части доски, в частности, в углах), которые в определённом смысле можно считать аналогом разработанных шахматных дебютов, не допускают механического применения и не дают гарантированного результата, поскольку эффект от их использования зависит от общей позиции на всей доске, так что даже выбор подходящего для данной позиции дзёсэки в конкретном углу является сложной интеллектуальной задачей.

Ко-борьба

Правило ко часто приводит к резкому изменению характера борьбы, последствия которой трудно оценить даже опытному игроку. Фактически надо каждый раз соизмерять последствия от «неответа» на ко-угрозу (как свою, так и противника) с ценой проигрыша ко-борьбы. Человеку приходится опираться на свой опыт и интуицию, в то время как для компьютера эти понятия трудно формализуемы.

Аддитивная природа игры

В шахматах, как и во многих других играх, в течение партии фигур на доске становится меньше, что упрощает перебор ходов. В го каждый следующий ход, наоборот, добавляет на доску один камень (хотя возможны и снятия), создавая дополнительные игровые моменты.

Шахматная техника не может быть применена в го

Компьютерные го-программы долгое время были значительно более слабы, чем шахматные программы. Подходы, которые были применены в шахматных программах, показали себя посредственными в компьютерном го.

Шахматные правила легко формализуемы и могут быть представлены машине в удобной форме, которая позволит ей играть на высоком уровне.

Но простые позиционные правила, применяемые в шахматах, не будут эффективны в го[источник не указан 576 дней]. Для определения ценности камня необходим сложный анализ, хотя бы для определения того, жива ли группа, которой он принадлежит, как велико влияние группы и какие опасности ей грозят.

Функция оценки

Ещё одна проблема состоит в создании хорошей оценочной функции для го. На каждом ходу может существовать несколько хороших ходов и чтобы выбрать лучший ход, компьютер должен оценить различные возможные исходы. Это становится трудной задачей в го. Например, может представиться возможность захвата камней противника за счёт укрепления его группы в другом месте. Решение о том, является ли такой обмен выгодным, может показаться слишком тяжёлым даже для игрока-человека. Также может оказаться, что ход в другой части доски и построение там формы может оказаться более важным.

Комбинаторная сложность

Иногда упоминается, что некоторые трудные комбинаторные проблемы (фактически любая NP-полная задача) могут быть преобразованы применительно к го; однако то же верно и для других настольных игр, подобных шахматам, обобщённым для доски произвольной размерности. NP-полные задачи не могут решаться людьми быстрее, чем компьютерами: сомнительно, что человек в состоянии, например, решить Задачу коммивояжёра за время, сопоставимое с тем, за которое её решает компьютер. Следовательно, возможность применить методы решения NP-полных задач к компьютерному го не позволяет объяснить превосходства человека над компьютером в этой игре.

Завершение игры

Учитывая, что завершающая стадия игры го (ёсэ) содержит меньшее количество возможных ходов, чем начало или середина, можно было бы предположить, что компьютеру будет намного легче играть эту часть игры. Но и здесь нашлось место для проблем:

  • Окончание партии в го — самая «математическая» часть партии; в ней почти каждому ходу можно дать оценку с точки зрения количества приносимых ходом очков. Тем не менее, и эта стадия оказывается компьютеру не по зубам — во многом из-за ко-борьбы, неожиданно возникающей в вариантах тактики, а также вследствие трудностей, связанных с численной оценкой понятия инициативы. В отличие от шахмат, в го к концу игры доска не освобождается от фигур, а тесно заполняется камнями — что делает невозможным создание глобальных баз данных для окончаний.
  • Ёсэ может повлечь за собой рассмотрение таких аспектов го, как «жизнь и смерть», которые являются NP-полными.
  • Каждая область, рассматриваемая в ёсэ, может затрагивать другие области, или повлечь к изменениям в общей картине игры. Это приводит к таким непростым даже для человека ситуациям, как Тройное ко, учетверённое ко и им подобные.

Таким образом очень сложно запрограммировать эффективный алгоритм даже для игры завершающей стадии го, не говоря обо всей партии[11].

Почему люди играли в го лучше компьютера

Люди чувствуют, что играют в го лучше, чем компьютеры, потому что сравнивают их с людьми. «Возможно это не компьютеры играют в го плохо, а люди играют в него слишком хорошо»[12]. Го, по сравнению с другими играми с полной информацией, имеет особенности, которые делают её особенно лёгкой для людей. Камни не перемещаются, как фигуры в шахматах, не меняют цвет, как в реверси. Эти особенности позволяют людям просчитывать длинные цепочки ходов, что очень сложно для машины.

Однако в тех редких случаях, когда камни неоднократно захватываются и переигрываются на тех же самых пунктах, у людей есть проблемы, в то время как они лёгки для компьютеров.

Тактический поиск

Один очень важный раздел игры го, связанный с определением того, какие группы камней способны выжить, а какие могут быть захвачены, известен как «жизнь и смерть». Самая прямая стратегия для определения жизни и смерти — это построение дерева поиска ходов, которые затрагивают рассматриваемую группу и определение статуса группы в концевых вершинах этого дерева.

Однако в пределах временных ограничений и ограничений по доступной оперативной памяти невозможно определить с полной точностью, какие ходы затрагивают выбранную группу. Нередки, например, ситуации, когда жизнь одной группы может быть обеспечена только за счёт пленения другой. Это значит, что для решения поставленной задачи должны быть применены некоторые эвристики для определения ходов, требующих рассмотрения. Как результат у программ, играющих в го прослеживается зависимость между временными затратами на обдумывание и качеством определения жизнеспособности групп.

Проблема представления

Существует проблема представления позиции в го для программ. Если в процессе обдумывания хода происходит интенсивный поиск хода, то представление нуждается в малом размере данных, которые можно было бы легко скопировать и уничтожить. Если информация о позиции будет содержать сильно-структурированные данные, то их будет тяжело копировать и это приведёт к замедлению процесса поиска.

Самый простой способ представления — завести одно- или двухмерный массив, в котором будет содержаться информация о том, камни какого цвета стоят на каждой позиции поля и возможность хода на пустые позиции.

Большинство программ, однако, используют более сырую информацию о доске для представления позиции. Это может быть информация о том, как соединены камни в каждой строке и как строки ассоциируются между собой, информация о группах камней, которые рискуют быть захваченными и которые живы. И хотя эта информация может быть извлечена из прямого представления, будет намного быстрее изменять её на каждом ходе и передавать в готовом виде. Такие добавочные изменения требуют запоминания большего количества информации и могут понизить скорость копирования, поэтому проблема представления игровой ситуации также остро стоит перед создателями го-программ.

В качестве альтернативы можно хранить только одну копию доски, а, делая ход, запоминать сделанные изменения. Это позволяет сократить затраты памяти и скорость копирования и избавляет от копирования лишней информации снова и снова. Но следует учесть, что такая форма представления может требовать иных подходов к её интерпретации, нежели хранение полной информации о доске.

Использование представлений, отличных от прямого, сталкивается в го с ещё одним подводным камнем, связанным с самой структурой игры. Позиция в го состоит из одиночных камней, образующих изменяющиеся структуры (группы и наборы групп). С точки зрения стратегии и тактики игры, более полезны варианты представления, которые содержат в явном виде информацию о структурах и состояниях. Но такая информация может существенно меняться буквально на каждом ходе (например, единственный ход, создающий соединение между двумя группами, имеющими по одному глазу, фактически превращает эти две группы, находящиеся под угрозой, в одну, гарантированно живую, что должно отразиться в представлении как объединение этих групп). Задача адекватного изменения сложного представления в подобных случаях сама по себе весьма нетривиальна.

Системный дизайн

Новые подходы к проблемам

Исторически основным подходом к проблеме компьютерного го был «старый добрый ИИ». Позже в качестве альтернативы такому подходу стали рассматривать нейронные сети. Одной из программ, использующих алгоритм нейронных сетей для игры в го является WinHonte[13].

Результаты этих разработок в области компьютерного го используются в других областях: когнитивистика, распознавание образов и машинное обучение[14]. Теория игр, раздел прикладной математики, тоже применяется к компьютерному го[14].

Разработка системы ИИ

Единственное, что должна сделать программа в результате обдумывания хода — указать место, в которое следует поместить следующий камень. Однако даже такое простое решение трудно принять из-за неоднозначности позиций, к которым может привести эта постановка. Для решения этой проблемы были приспособлены различные архитектуры. Самые популярные основаны на использовании дерева поиска, применении методов Монте-Карло, создании экспертных систем и использовании машинного обучения. Немногие программы используют только что-то одно из перечисленного; большинство объединяют в себе несколько подходов.

Минимаксное дерево поиска

Одна из традиционных техник в области ИИ для создания программ, играющих в игры использует минимаксное дерево поиска. Для этого рассматривают все гипотетически возможные последовательности ходов до определённой глубины, а затем используют оценочную функцию, чтобы оценить ценность хода, с которого начиналась каждая последовательность. Ход, который приводит к наилучшему результату повторяется на доске и далее такая же процедура проводится для каждого хода компьютерного игрока. В то время, как способы, основанные на использовании дерева поиска давали хорошие результаты применительно к шахматам, они были менее успешны в применении к го.

Частично причина этого кроется в том, что тяжело создать эффективную оценочную функцию и частично из-за большого количества возможных ходов, которое приводит к большому коэффициенту ветвления. Это делает технику дерева поиска слишком ресурсоёмкой. Поэтому программы, интенсивно использующие деревья поиска могут хорошо играть только на маленькой доске 9x9, но не на большой 19x19.

Существуют методы, способные улучшить работу деревьев поиска как в отношении скорости, так и памяти. Методы альфа-бета-отсечения, Поиска основных отклонений, MDT-f могут уменьшить коэффициент ветвления практически без потери силы игры. Аналогично таблица перестановок позволяет уменьшить количество повторных вычислений, особенно когда она используется совместно с методом итеративного углубления. Для быстрого доступа к данным, расположенным в таблице перестановок, необходимо использовать хеширование. Хеширование Зобриста часто встречается в программах, играющих в го, так как обеспечивает малое количество коллизий и позволяет оперативно обновлять информацию о каждом ходе с использованием лишь двух операций XOR вместо полного вычисления.

Даже с использованием этих уменьшающих трудоёмкость методов дерево поиска на полной доске всё ещё является очень медленным. Поиск может быть ускорен, если ветвление ещё больше ограничить, не рассматривая варианты ходов в область влияния противника, или выбирать для рассмотрения в первую очередь группы камней, находящиеся в положении атари. Однако оба эти метода приводят к риску нерассмотрения жизненно важных ходов, которые могли бы изменить курс игры.

Результаты компьютерных соревнований показывают, что методы соответствия образца для выбора цепочки шагов, объединённые с быстрым ограниченным тактическим поиском (объяснённый выше), достаточны, чтобы произвести конкурентоспособную программу. Например, GNU Go конкурентоспособна, но она не использует поиск по всей доске.

Экспертные системы

Новички часто учатся, просматривая записи старых партий мастеров игры. Есть сильная гипотеза, что накопление знаний — ключ к созданию сильного ИИ. Например, Тим Кингер (Tim Kinger) и Дэвид Мичнер (David Mechner) говорят: «Мы верим, что, только используя инструменты накопления и поддержания знаний в области го, можно создать намного более сильные программы, чем есть сейчас.» Они предлагают два пути: рассмотрение общих форм и их использования, или рассмотрение местных противостояний. «…Программам для игры в го всё ещё недостаёт как качества, так и количества знаний.»[15]

После реализации использование опытных знаний показало себя очень эффективным. Сотни руководящих принципов и эмпирических правил для сильной игры были сформулированы и любителями высокого уровня и профессионалами. Задача программиста состоит в том, чтобы взять эти эвристики, формализовать их в машинном коде, и использовать сравнение с образцом (pattern matching) и распознавание образов (pattern recognition) для выявления того, когда их сто́ит применять. Также стоит разработать систему для выявления лучшего решения в случае, когда применимы сразу несколько принципов.

Большинство относительно успешных результатов получены на основе навыков игры в го программистов, которыми написаны программы, и их личными догадками по поводу игры мастеров, а не на основе формальных математических просчётов; они пытаются заставить компьютер подражать тем способам, которыми они сами играют в го. «Большинство конкурентоспособных программ потребовало 5-15 лет человеческих усилий и содержит 50-100 модулей, имеющих дело с различными аспектами игры.»[16]

Этот метод до недавнего времени был самой успешной техникой в производстве конкурентоспособных программ игры в го на полноразмерном поле. Примерами программ, которые положились в большей степени на опытное знание, является Handtalk (позже известный как Goemate), The Many Faces of Go, Go Intellect и Go++, каждую из которых в некоторый момент считали лучшей программой го в мире.

Однако добавление экспертных знаний иногда ослабляет программу, потому что просто поверхностное ориентирование в ситуации может привести к ошибкам. «Лучшие программы обычно делают хорошие ходы уровня мастера, однако, как знают все игроки, один плохой ход может разрушить хорошую игру.»[16]

Методы Монте-Карло

Одной из главных альтернатив использованию закодированных знаний и поиску ходов является метод Монте-Карло. Суть этого метода состоит в том, что сначала на текущей доске выбираются позиции, на которые можно пойти, а затем начиная последовательно с каждой из них разыгрывается большое количество случайных партий. Позиция, которая даёт наибольшее соотношение побед к поражениям, выбирается для следующего хода. Преимущества этого метода в том, что он требует очень небольших знаний проблемной области и не требует много памяти. Однако у этого метода есть и очевидные недостатки. Из-за того, что ходы генерируются наугад и рассматриваются не все возможные продолжения, какие-то ходы будут по ошибке оценены как хорошие. Даже несмотря на то, что случайная выборка продолжений будет благоприятной, у противника могут оказаться немногочисленные, но довольно очевидные ходы, которые позволят ему получить преимущество. Эти ходы либо не попадут в случайную выборку, либо количество хороших продолжений окажется больше. В результате получится программа, которая сильна в стратегическом, но слаба в тактическом плане. Эта проблема может быть смягчена путём добавления некоторых экспертных знаний и более глубокого поиска. В число программ, использующих метод Монте-Карло входят такие как Zen, The Many Faces of Go v12, Leela, MoGo, Crazy Stone[17], Olga и Gobble.

В 2006 году разработана новая методика upper confidence bounds applied to trees[18], использующаяся во многих программах для игры в го на доске 9х9 с превосходными результатами. Техника UCT совместно со многими другими техниками оптимизации для игры на доске 19х19 позволила MoGo стать одной из сильнейших программ. Технику UCT для игры на доске 19х19 используют следующие программы: MoGo, Crazy Stone, Mango. MoGo выиграла компьютерную олимпиаду в 2007 году и выиграла одну из трёх блиц-игр против Го Цзюань (Guo Juan)[19], 5-й профессиональный дан. В 2008 году The Many Faces of Go выиграла компьютерную олимпиаду после добавления UCT к её, основанному на экспертных знаниях, механизму.

В 2008 году MoGo выиграла одну из трёх игр[20] против Каталина Цэрану, 5 про-Дан, на доске 9х9 со стандартным временем (30 минут на игру каждому игроку). MoGo была запущена на кластерном компьютере (32 узла по 8 ядер частотой 3 ГГц). Эти результаты были одобрены Французской федерацией го[21]. MoGo также играла на доске 19х19 против того же Каталина Цэрану и проиграла имея фору в 9 камней. Однако, программа играла сильно и проиграла всего лишь из-за плохого выбора в ко-борьбе в конце игры, в которой компьютеры традиционно слабы.

7 августа 2008 года MoGo выиграла игру на доске 19х19 против Ким Мёнвана (Kim MyungWan), 8p имея фору в 9 камней с преимуществом в 1,5 очка. Ким использовал 13 минут на обдумывание, в то время как MoGo — около 55-ти, однако он чувствовал, что использование большего количества времени не поможет ему выиграть. MoGo был запущен из Нидерландов на суперкомпьютере из 800 узлов, содержащем по 4 ядра на узел, частотой 4,7 ГГц и производительностью 15 Терафлопс.[22]. Мёнхван и MoGo играли четыре игры с различным гандикапом и временными ограничениями и выиграли по две игры. Отчёты об играх доступны на КГС[23], где MoGo играла под ником MogoTitan.

В феврале 2009 года MoGo одержала ещё большую победу — с гандикапом в 7 камней она победила игрока 9 дана Чжоу Цзюньсюня (Jun-Xun Zhou), а с форой в 6 камней сломила сопротивление игрока первого дана Цзянь Личэня (Li-Chen Chien)[24].

К началу 2012 года СrazyStone[25], основанная на том же методе Монте-Карло, что и MoGo, имеет стабильный 5 дан на сервере КГС[26].

В декабре 2010 года компьютерная программа Zen достигла уровня 4 дан на сервере КГС. Создал программу Zen Японский программист Ёдзи Одзима (Yoji Ojima). В июне 2011 года компьютерная программа Zen19d достигла уровня 5 дан на сервере КГС, играя со скоростью 15 секунд на ход. Эта версия программы работала на 26-ядерном компьютере. В марте 2012 года компьютерная программа Zen19D достигла уровня 6 дан на сервере КГС, играя со скоростью 15 секунд на ход. Эта версия программы работала на 28-ядерном компьютере[27].

В марте 2012 года Zen19D выиграла у Такэмия, Масаки (Takemiya Masaki) 9 дан с 4 камнями форы. Для этого матча использовался кластер из 4 компьютеров (dual 6-core Xeon X5680/4.2 GHz, 6-core Xeon W3680/4 GHz и два 4-core i7 920/3.5 GHz) соединенных через GbE LAN. Такое же оборудование используется для Zen19S и Zen19D на КГС сервере[28].

Машинное обучение

Основанные на знаниях программы для игры в го являются очень эффективными, но всё же их уровень знаний близко связан с уровнем их программистов и связанных с ними специалистов в предметной области. Обойти эту проблему позволяет использование методов машинного обучения, которые позволяют программе генерировать шаблоны и стратегии поведения, не заложенные в неё заранее.

В основном такой подход реализуется с помощью нейронных сетей или генетических алгоритмов, которые позволяют либо найти нужную ситуацию в большой базе данных игр, либо сыграть множество игр против себя или других программ или людей. Известными программами, которые используют нейроные сети являются NeuroGo и WinHonte.

Соревнования среди компьютерных программ игры в го

Существуют несколько известных ежегодных соревнований среди компьютерных программ, играющих в го, самое известное из которых — Компьютерная олимпиада. Регулярные и менее формальные соревнования проводятся на КГС (ежемесячно) и CKS (непрерывно).

Наиболее известные играющие в го программы включают северокорейскую Silver Star KCC Igo, Handtalk (автор Чэнь Чжисин), GoPlusPlus (Michael Reiss) и Many Faces of Go Дэвида Фотланда (David Fotland). GNU Go — свободная программа, которая также выигрывала компьютерные соревнования.

История

Первые соревнования по компьютерному го спонсировались USENIX. Они проводились в 1984—1988 годах. Эти соревнования открыли Nemesis, первую конкурентоспособную программу, способную играть в го от Брюсо Вилькокса (Bruce Wilcox) и G2.5 Дэвида Фотланда, которая впоследствии разовьётся в Cosmos и The Many Faces of Go.

Одним из ранних поощрений разработок в области компьютерного го стал кубок Инга, соревнование с относительно большим денежным призом, спонсировавшееся тайваньским банкиром и основателем Кубка Инга Ин Чанци (Ing Chang-ki), которое проводилось с 1988 по 2000 раз в четыре года. Победителю этого турнира разрешалось бросить вызов молодым профессионалам в форовой игре с коротким временем. Если программа выигрывала, то её автору присуждался денежный приз и устанавливался новый приз за победу профессионала с меньшим гандикапом. Призы инга должны были закончиться 1) в 2000 году 2) когда программа обыграет игрока 1-го профессионального дана в равной игре (40.000.000 новых тайваньских долларов). Последним победителем был Handtalk в 1993 году, получил 250.000 NT$ за победу над 8-9 летними профессионалами с форой в 11 камней. К 2000 году остался невостребованным приз в 400.000 NT$ за победу над профессионалом с форой в 9 камней[29].

Удивительно, но Япония лишь недавно начала спонсировать свои собственные чемпионаты по компьютерному Го. Соревнования кубка FOST проводились ежегодно с 1995 по 1999 год в Токио. Его вытеснил Вызов Гифу, проводившийся ежегодно с 2003 по 2006 годы в Огаки, префектура Гифу.

В октябре 2015 года программа AlphaGo, разработанная компанией DeepMind выиграла у трехкратного чемпиона Европы Фань Хуэя (2 профессиональный дан) матч из пяти партий со счётом 4—1. Это первый в истории случай, когда компьютер выиграл в го у профессионала в равной игре[1][30][31].

В марте 2016 года AlphaGo победила профессионала 9 дана Ли Седола в четырёх партиях из пяти.[2]

В мае 2017 года на саммите «Future of Go Summit» AlphaGo выиграла три партии из трёх в мини-матче с одним из сильнейших игроков в мире, лидером мирового рейтинга Эло Кэ Цзе[6]

Проблемы игры компьютера с компьютером

Когда два компьютера играют в го друг с другом, то в идеале должна получиться картина игры, свойственная игре человека с человеком. Однако этого трудно добиться, особенно в конце игры. Основная проблема заключается в том, что программа не может вести диалог с противником. Так если есть какие-то разногласия в статусе групп, то для программ нет никаких способов решить их. Одним из способов решения этой проблемы может быть введение человека-судьи или высокоспециализированной программной среды для оценки финальной позиции. Альтернативный метод — позволить программам делать ходы до тех пор, пока окончательно не определятся статусы всех спорных групп. Главное препятствие к реализации этого решения состоит в том, что в некоторых вариантах правил го (например, японские правила) игроки штрафуются за лишние ходы, недополучая очки. Поэтому существует риск, что засомневавшись в своём преимуществе программа проиграет после доигрывания победной ситуации.

См. также

Примечания

  1. 1 2 David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre. Mastering the game of Go with deep neural networks and tree search (англ.) // Nature. — 2016-01-28. — Vol. 529, iss. 7587. — P. 484–489. — ISSN 0028-0836. — doi:10.1038/nature16961. Архивировано 24 сентября 2019 года.
  2. 1 2 Artificial intelligence: Google's AlphaGo beats Go master Lee Se-dol. BBC News Online (12 марта 2016). Дата обращения: 12 марта 2016. Архивировано 11 августа 2021 года.
  3. Google's DeepMind defeats legendary Go player Lee Se-dol in historic victory. www.theverge.com. Дата обращения: 9 марта 2016. Архивировано 11 августа 2021 года.
  4. Artificial intelligence: Go master Lee Se-dol wins against AlphaGo program. BBC News Online (13 марта 2016). Дата обращения: 13 марта 2016. Архивировано 5 мая 2021 года.
  5. Google's AlphaGo AI beats Lee Se-dol again to win Go series 4-1. The Verge. Дата обращения: 15 марта 2016. Архивировано 15 марта 2016 года.
  6. 1 2 "Программа AlphaGo со счетом 3-0 обыграла сильнейшего игрока в го". INTERFAX.RU. 2017-05-27. Архивировано 11 августа 2021. Дата обращения: 27 мая 2017.
  7. "Чемпион мира по игре в го проиграл три матча подряд компьютерной программе". интернет-издание «Лента.Ру». 2017-05-27. Архивировано 11 августа 2021. Дата обращения: 27 мая 2017.
  8. Антон Бабошин. Восстание машин. Детище Google обыграло лидера мирового рейтинга. «Спорт-Экспресс» (27 мая 2017). Дата обращения: 27 мая 2017. Архивировано 26 февраля 2019 года.
  9. Go Ratings. Дата обращения: 29 мая 2017. Архивировано 15 августа 2021 года.
  10. Сравнение форматов доски Го. Дата обращения: 24 июня 2009. Архивировано из оригинала 27 января 2011 года.
  11. См. Computer Go Programming Архивная копия от 15 августа 2006 на Wayback Machine pages at Sensei’s Library
  12. Raiko, Tapani: «The Go-Playing Program Called Go81» Архивная копия от 11 октября 2010 на Wayback Machine section 1.2
  13. WinHonte 2.01. Дата обращения: 24 июня 2009. Архивировано из оригинала 3 июля 2007 года.
  14. 1 2 Müller, Martin. Computer Go (недоступная ссылка), Artificial Intelligence 134 (2002): p150
  15. Müller, Martin. Computer Go (недоступная ссылка), Artificial Intelligence 134 (2002): p151
  16. 1 2 Müller, Martin. Computer Go (недоступная ссылка), Artificial Intelligence 134 (2002): p148
  17. Crazy Stone. Дата обращения: 24 июня 2009. Архивировано 29 октября 2007 года.
  18. UCT. Дата обращения: 24 июня 2009. Архивировано 7 июля 2021 года.
  19. Guo Juan at Sensei's Library. senseis.xmp.net. Дата обращения: 22 марта 2023. Архивировано 11 августа 2021 года.
  20. Архивированная копия. Дата обращения: 24 июня 2009. Архивировано из оригинала 28 мая 2009 года.
  21. Fédération Française de Go. Дата обращения: 24 июня 2009. Архивировано 13 августа 2021 года.
  22. Sensei’s Library: MoGo. Дата обращения: 24 июня 2009. Архивировано 15 мая 2021 года.
  23. KGS Game Archives. Дата обращения: 24 июня 2009. Архивировано 11 августа 2021 года.
  24. Машинный разум нанёс человеку удар в го. Дата обращения: 24 июня 2009. Архивировано из оригинала 19 июня 2009 года.
  25. CrazyStone at Sensei’s Library. Дата обращения: 30 июня 2012. Архивировано 16 июля 2009 года.
  26. KGS Go Server Rank Graph. Дата обращения: 30 июня 2012. Архивировано 11 августа 2021 года.
  27. Sensei’s Library KGS Bot Ratings. Дата обращения: 4 января 2013. Архивировано 6 мая 2021 года.
  28. Zen computer Go program beats Takemiya Masaki with just 4 stones! Дата обращения: 4 января 2013. Архивировано из оригинала 20 января 2013 года.
  29. World Computer Go Championships. Дата обращения: 24 июня 2009. Архивировано 24 сентября 2015 года.
  30. Искусственный интеллект впервые победил профессионального игрока в го. Meduza. Дата обращения: 27 января 2016. Архивировано 4 февраля 2016 года.
  31. AlphaGo: Mastering the ancient game of Go with Machine Learning. Research Blog. Дата обращения: 27 января 2016. Архивировано 1 февраля 2016 года.

Научные статьи (англ.)

Сайты, посвящённые компьютерному го

Компьютерные программы

  • AYA by Hiroshi Yamashita
  • Crazy Stone by Rémi Coulom
  • GNU Go, the strongest open source Go program
  • Go++ by Michael Reiss (sold as Strongest Go or Tuyoi Igo in Japan)
  • Go Intellect by Ken Chen
  • Handtalk/Goemate, developed in China by Zhixing Chen (sold as Shudan Taikyoku in Japan)
  • Haruka by Ryuichi Kawa (sold as Saikouhou in Japan)
  • Indigo by Bruno Bouzy
  • Katsunari by Shin-ichi Sei
  • KCC Igo, from North Korea (sold as Silver Star or Ginsei Igo in Japan)
  • Leela, the first Monte Carlo program for sale to the public
  • The Many Faces of Go by David Fotland (sold as AI Igo in Japan)
  • MoGo by Sylvain Gelly; parallel version [1] by many people.
  • Smart Go by Anders Kierulf, inventor of the Smart Game Format

Read other articles:

Airport located in Saint-Christophe Aosta, Aosta Valley, Italy Aosta Valley AirportAeroporto della Valle d'AostaAéroport de la Vallée d'AosteIATA: AOTICAO: LIMWSummaryAirport typePublicServesAostaLocationSaint-Christophe, ItalyTime zoneCET (+1) • Summer (DST)CEST (+2)Elevation AMSL546 m / 1,791 ftCoordinates45°44′18″N 007°22′07″E / 45.73833°N 7.36861°E / 45.73833; 7.36861Websitewww.avda-aosta.itMapAosta Valley AirportRunways Dir...

 

 

I Kissed a Girl Single de Katy Perryextrait de l'album One of the Boys Sortie 6 mai 2008 Durée 2:58 (chanson) 3:05 (vidéoclip) Genre Pop Auteur Katy Perry, Cathy Dennis Compositeur Lukasz Gottwald, Max Martin Producteur Dr. Luke Label Capitol Records, EMI, Virgin Singles de Katy Perry Trust in Me(2001) Hot 'n Cold(2008)Pistes de One of the Boys One of the Boys Waking Up in Vegasmodifier I Kissed a Girl est une chanson interprétée par Katy Perry et écrite par elle-même, Dr...

 

 

Lenny Pintor Pintor en 2020Datos personalesNombre completo Lenny Jean-Pierre Pintor[1]​Nacimiento París, Francia5 de agosto de 2000 (23 años)Nacionalidad(es) FrancesaAltura 1,79 m (5′ 10″)Carrera deportivaDeporte FútbolClub profesionalDebut deportivo 2017(S. C. Bastia II)Club LASK LinzLiga BundesligaPosición DelanteroGoles en clubes 17Trayectoria S. C. Bastia II (2017) Stade Brest 29 (2017-2018) Olympique de Lyon (2018-2022) → E. S. Troyes A. C. (2019-2020) → E. S....

Bandar SaktiKelurahanNegara IndonesiaProvinsiSumatera UtaraKotaTebing TinggiKecamatanBajenisKodepos20613Kode Kemendagri12.76.04.1005 Kode BPS1274021004 Luas... km²Jumlah penduduk... jiwaKepadatan... jiwa/km² Bandar Sakti adalah kelurahan di kecamatan Bajenis, Tebing Tinggi, Sumatera Utara, Indonesia. Gereja GKPS Bandar Sakti lbsKecamatan Bajenis, Kota Tebing Tinggi, Sumatera UtaraKelurahan Bandar Sakti Berohol Bulian Durian Pinang Mancung Pelita Teluk Karang Artikel bertopik kelurahan ...

 

 

Artikel ini bukan mengenai Bangil. Kabupaten BangliKabupatenTranskripsi bahasa daerah • Aksara Baliᬩᬗ᭄ᬮᬶ(Dari atas ke bawah: Danau Batur Kintamani, Pura Kehen, Desa Penglipuran) LambangMotto: Bhukti mukti bhakti(Sanskerta) Pengabdian dengan berbakti kepada Tuhan dan tanah air demi tujuan masyarakat adil dan makmur secara lahir (bhukti) maupun batin (mukti)PetaKabupaten BangliPetaTampilkan peta Kepulauan Sunda KecilKabupaten BangliKabupaten Bangli (Indonesia)Tam...

 

 

العلاقات اليونانية الليبية اليونان ليبيا   اليونان   ليبيا تعديل مصدري - تعديل   العلاقات اليونانية الليبية هي العلاقات الثنائية التي تجمع بين اليونان وليبيا.[1][2][3][4][5] مقارنة بين البلدين هذه مقارنة عامة ومرجعية للدولتين: وجه المقارنة اليو...

Pablo Held (2013) Pablo Held (* 27. Dezember 1986 in Herdecke) ist ein deutscher Jazzpianist und -komponist, der auch international erfolgreich ist. Er gilt als „Aushängeschild einer jungen Generation von Jazzmusikern aus Deutschland, die sich mit ihrem souveränen Zugriff auf die unterschiedlichsten Spielarten zeitgenössischer Musik zwischen Pop, Jazz und Klassik, zwischen Komposition und Improvisation eine enorme Freiheit erspielt haben.“[1] Inhaltsverzeichnis 1 Leben und Wirk...

 

 

Musicians and/or musical groups who have been inducted into the Rock and Roll Hall of Fame The Rock and Roll Hall of Fame The Rock and Roll Hall of Fame, established in 1983 and located in Cleveland, Ohio, United States, is dedicated to recording the history of some of the best-known and most influential musicians, bands, producers, and others that have in some major way influenced the music industry, particularly in the area of rock and roll.[1] Originally, there were four categories...

 

 

Historic district in New York, United States United States historic placeBrowncroft Historic DistrictU.S. National Register of Historic PlacesU.S. Historic district One of the historic street signposts at the corner of Ramsey Park and Corwin RoadShow map of New YorkShow map of the United StatesLocationRoughly bounded by Browncroft Blvd., Newcastle, Blossom, and Winton Rds., Rochester, New YorkCoordinates43°9′16″N 77°32′44″W / 43.15444°N 77.54556°W / 43.1544...

Lanchester Lanchester Mk.1 Jenis Pistol mitraliur Negara asal Britania Raya Sejarah pemakaian Masa penggunaan 1941–1960 Digunakan oleh Britania Raya Pada perang Perang Dunia IIRevolusi Nasional IndonesiaKedaruratan MalayaPemberontakan Mau MauPerang Semak RhodesiaKrisis Suez[1]Perang Saudara DominikaPerang Saudara Nigeria Sejarah produksi Perancang George Lanchester Tahun 1940 Produsen Sterling Armaments Company Diproduksi 1941–1945 Varian Mk.I, Mk.I* Spesifikas...

 

 

Cortes de Distrito de los Estados UnidosLocalizaciónPaís Estados UnidosOrganizaciónComposición palacio de justiciaDepende de Poder judicial federal de los Estados Unidos[editar datos en Wikidata] Mapa de los límites de los Tribunales de Distrito y las Cortes de Apelaciones de Estados Unidos. Las Cortes de Distrito de los Estados Unidos son los tribunales de primera instancia del poder judicial federal de los Estados Unidos. Hay un tribunal de distrito por cada distrito jud...

 

 

Counties covered by the Automobile Club of Southern California (red) and California State Automobile Association (blue) AAA California may refer to one of the following motor clubs associated with the American Automobile Association (AAA): Automobile Club of Southern California California State Automobile Association, in Northern California Index of articles associated with the same name This article includes a list of related items that share the same name (or similar names). If an internal ...

Punctuation mark () The symbol    redirects here. For other uses, see (disambiguation) and Quotation mark (disambiguation) \x22 redirects here. Not to be confused with X22. This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Quotation mark – news · newspapers · books · scholar · JSTOR (September 2014) ...

 

 

Korong GadangKelurahanPeta lokasi Kelurahan Korong GadangNegara IndonesiaProvinsiSumatera BaratKotaPadangKecamatanKuranjiKode Kemendagri13.71.09.1006 Kode BPS1371090006 Luas-Jumlah penduduk-Kepadatan- Korong Gadang adalah salah satu kelurahan di kecamatan Kuranji, Padang, Sumatera Barat, Indonesia. Pranala luar (Indonesia) Keputusan Menteri Dalam Negeri Nomor 050-145 Tahun 2022 tentang Pemberian dan Pemutakhiran Kode, Data Wilayah Administrasi Pemerintahan, dan Pulau tahun 2021 (Indonesi...

 

 

Montenegrin passportFront cover of a Montenegrin passportIntegrated biodata card of a Montenegrin passportTypePassportIssued by MontenegroFirst issued5 May 2008 (current version)[1]PurposeIdentificationEligibilityMontenegrin citizenshipCost€33[2] The Montenegrin passport (Montenegrin: crnogorski pasoš / црногорски пасош) is the primary document for international travel issued by Montenegro. The passport is issued by the Ministry of Internal Affairs ...

Species of legume Senna auriculata At Sindhrot near Vadodara, Gujarat Scientific classification Kingdom: Plantae Clade: Tracheophytes Clade: Angiosperms Clade: Eudicots Clade: Rosids Order: Fabales Family: Fabaceae Subfamily: Caesalpinioideae Genus: Senna Species: S. auriculata Binomial name Senna auriculata(L.) Roxb. Synonyms Cassia auriculata L. Cassia densistipulata Taub. Senna auriculata is a leguminous tree in the subfamily Caesalpinioideae. It is commonly known by its local names m...

 

 

Facultad de Ciencias Médicas Escudo de la FMSF-UNMSM Vista exterior del campus de Facultad de Ciencias Médicas (UNR)Forma parte de Universidad Nacional de RosarioFundación 9 de abril de 1920 (103 años)LocalizaciónDirección Av. Santa Fe 3100 Rosario, Santa Fe, ArgentinaCoordenadas 32°56′24″S 60°39′54″O / -32.93990556, -60.66507222AdministraciónDecano Prof. Dr. Jorge MolinasAcademiaDocentes 1.491Estudiantes 14.157Sitio web Sitio web oficial[editar dato...

 

 

Questa voce o sezione sull'argomento personaggi dei fumetti non cita le fonti necessarie o quelle presenti sono insufficienti. Puoi migliorare questa voce aggiungendo citazioni da fonti attendibili secondo le linee guida sull'uso delle fonti. Segui i suggerimenti del progetto di riferimento. PyroPyro interpretato da Aaron Stanford nel film X-Men - Conflitto finale UniversoUniverso Marvel Lingua orig.Inglese AutoriChris Claremont John Byrne EditoreMarvel Comics 1ª app.gennaio 19...

Bishop of Ilagan Most ReverendDavid William Valencia AntonioD.D.Bishop of the Diocese of IlaganChurchCatholic ChurchDioceseDiocese of Ilagan Apostolic Vicariate of San Jose in MindoroSeeIlaganPredecessorJoseph Nacua, OFM.Cap.SuccessorIncumbentOther post(s) North Luzon Regional Representative, CBCP Permanent Council (2023- present) Chairman, CBCP Episcopal Commission on Liturgy (2023- present) OrdersOrdination1 December 1988Consecration26 August 2011by Giuseppe PintoPersonal detailsBorn (...

 

 

Cet article est une ébauche concernant le jeu vidéo. Vous pouvez partager vos connaissances en l’améliorant (comment ?) (voir l’aide à la rédaction). Diablo IIIReaper of SoulsDéveloppeur Blizzard EntertainmentÉditeur Blizzard EntertainmentCompositeur Derek DukeJason HayesDate de sortie 25 mars 2014[1]Franchise DiabloGenre Hack 'n SlashMode de jeu Un joueur, multijoueurPlate-forme Windows, Mac OSSite web us.battle.net/d3/en/reaper-of-soulsmodifier - modifier le code - modifier ...

 

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!