У російському Брянську пролунали потужні вибухи в районі аеропорту Трампу імпічмент, Венсу – посаду: Маск продовжує підливати масла у вогонь Росія масовано атакувала Україну дронами і ракетами: є руйнування і постраждалі Нічний удар Росії по Україні: жителі деяких міст залишилися без світла Росія планує у 2026 році захопити дві області та відрізати Україну від Чорного моря, - ОП У США закликали видворити Маска з країни після сварки з Трампом, - The Hill Низка поїздів спізнюється через наслідки атаки на Київ Під час нічного удару росіян у Києві загинули рятувальники Порошенко залишив собі слона і причіп, а всі дохідні активи намагався переписати на дружину, - ЗМІ В Україні з'явиться військовий омбудсмен: Рада зробила перший крок Унікальна спецоперація: СБУ втретє вразила Кримський міст Британія готова судитися з Абрамовичем, щоб передати Україні гроші із продажу "Челсі" Ключовий союзник Трампа підтримав законопроект про пекельні санкції проти РФ Росіяни зберігають можливості для масованих авіаударів, але тепер вони обмежені, - експерт Олена Тополя відверто зізналася, що робила пластику грудей Як рясні дощі вплинуть на врожай картоплі в Україні: відповідь фермера "Це не просто епізод": Шмигаль заявив, що "Павутина" може повторитись Генштаб відзвітував про знищення 12 російських літаків Ігнат про "Павутину": Тривалий час РФ не зможе бити по Україні ракетами Переговори у Стамбулі провалились, РФ висунула свої "звичайні" вимоги", - FT Зеленский раскрыл, чего ожидает от нового президента Польши Эра Google прошла: на смартфонах Samsung будет новый ИИ по умолчанию вместо Gemini ЕС в мае увеличил импорт "голубого топлива" из РФ, - Reuters На главу Центробанка РФ давят из-за проблем в экономике, - Bloomberg Названа самая популярная версия Windows в 2025 году – что выбирают украинцы

Стартап Google Deep Mind продемонстрировал новые возможности искусственного интеллекта. Его система Deep-Q-Network смогла превзойти человека в 49 классических аркадных играх 1980-х, не имея доступа к исходному коду игр и без изучения практики игроков-людей. Об алгоритме работы системы рассказывается в журнале Nature, а коротко о новой технологии сообщил Science News.

Лондонскую фирму DeepMind, специализирующуюся в области искусственного интеллекта, в 2014 году приобрел Google. По данным СМИ сумма сделки составила около 400 миллионов фунтов стерлингов. После вхождения в состав американской корпорации один из основателей стартапа Демис Хассабис (Demis Hassabis) заставил компьютер самостоятельно обучаться опыту игры — и даже открывать эффективные ходы и стратегии, о которых не знали даже люди.

Система компьютерного самообучения получила название Deep-Q-Network (DQN). В ней используются две различные стратегии обучения. Во-первых, это глубинная нейронная сеть — система восприятия, принцип работы которой напоминает зрение животных: она делает ходы и замечает, как меняются пиксели на экране. «Q» в названии означает Q-learning: математический аналог обучения с подкреплением (или поощрением), благодаря которому люди и животные осваивают новые навыки: каждое новое эффективное действие вознаграждается. В случае DQN наградой являются очки в игре: пробуя различные действия, система запоминает те комбинации, которые приносят максимум очков.

Исследователи дали DQN порезвиться с 49 классическими аркадными играми на платформе Atari 2600. Эти игры, по мнению Хассабиса, представляют собой золотую середину с точки зрения сложности игрового процесса. DQN были предоставлены крайне ограниченные ресурсы: две недели на каждую игру и вычислительные мощности одного-единственного персонального компьютера.

Эффективность системы была далеко не очевидна: искусственный интеллект раньше всегда проигрывал человеку в играх наподобие Breakout или Space Invaders, где для получения рекордного счета необходимо искать сложные стратегии. Однако в итоге DQN обыграла живых экспертов в 60 процентах игр: она набрала на 20-30 процентов больше очков в Space Invaders и Pong, а в Breakout и Video Pinball — в 200 раз больше. Следующим этапом, по словам Хассабиса, станет трансфер знаний: перенос навыков из одной игры в другую (например, во вторую игру с летающими шариками система сможет играть быстрее, чем в первую).

По мнению экспертов, система DQN имеет все шансы найти применение в рекламной стратегии Google. Пиксели аркадных игр являются аналогом многочисленных данных, которые поисковик собирает об отдельных пользователях, а очки — аналогом прибыли от рекламы. Обучение с подкреплением пригодится для улучшения качества объявлений: чем чаще на них кликают, тем больше очков получает система. Тот факт, что DQN обучается, наблюдая за происходящим на экране, а не обрабатывая исходный код, говорит о том, что Google она нужна для анализа изображений и видео.