Este simpático autómata se vehemencia OP3 y es el protagonista de la investigación en formación mediante refuerzo profundo (Deep RL) en los laboratorios de DeepMind. En este primer vídeo se puede ver una de sus habilidades: resistir los embates y golpes de los adversarios, mateniéndose en pie o levantándose del suelo cueste lo que cueste. Cuesta no empatizar con su causa.
La forma en que se entrena a estos robots la cuentan en este trabajo de DeepMind: Learning Agile Soccer Skills for a Bipedal Autómata with Deep Reinforcement Learning. Allí se muestra cómo el círculo habitual es una simulación de partido uno-contra-uno y los protagonistas unos OP3 de Robotis con pequeñas modificaciones, que tienen 20 juntas entre brazos y piernas con las que realizar movimientos.
Tal y como puede encontrarse en el vídeo los robots aprenden cosas que son un tanto contrarias a lo que cabría esperar sin demasiada información, tales como como caerse y levantarse, divulgar un penalti o jugadas defensivas tales como rodear la pelota, que forman parte de la organización del gozne.