Cómo particionar en un robot de fútbol
Resumen Con el desarrollo de la tecnología informática, la teoría y la investigación de aplicaciones de sistemas multiagente (MAS Multi-Agent System) en inteligencia artificial distribuida se han convertido en un punto caliente en la investigación de inteligencia artificial, RoboCup (Robot World Cup), el Campeonato Mundial de Fútbol de Robots, es un problema de estudio de la toma de decisiones y la cooperación de múltiples agentes en un entorno de confrontación ruidoso y asincrónico. Este artículo presenta en detalle el diseño y la implementación de la ofensiva y la defensa en la competencia de robots de fútbol de simulación por computadora.
Palabras clave ofensiva; organización; precisión; defensa; flexibilidad
RoboCup (Robot World Cup), el Campeonato Mundial de Fútbol de Robots. Es una competencia internacional a gran escala y una actividad académica que se lleva a cabo para mejorar el nivel de educación e investigación en campos relacionados. Promueve la investigación y el desarrollo de inteligencia artificial distribuida, robótica inteligente y campos relacionados proporcionando una tarea estándar. El entrenamiento y la fabricación de robots para partidos de fútbol es uno de los focos de investigación actuales en el campo de la inteligencia artificial y la robótica. Durante el juego, una vez determinada la formación del equipo, a cada jugador se le asigna un rol correspondiente y comienza a discutir las tácticas ofensivas y defensivas generales y locales del equipo.
Tácticas ofensivas de equipo completo
Las tácticas ofensivas de equipo completo se refieren al método de coordinación utilizado por un lado para lograr el propósito de disparar a través de los pases y la cooperación entre los jugadores después de recibir el balón. durante el juego. En comparación con las tácticas ofensivas locales, las tácticas ofensivas de todo el equipo tienen una gama más amplia de ataques, incluida la participación en ofensiva y contraataques rápidos. Hay principalmente ataques laterales, ataques centrales, contraataques rápidos, etc.
1. Ataque lateral: El método de utilizar áreas a ambos lados de la cancha para lanzar un ataque se llama ataque lateral. El ataque lateral es una de las principales formas de táctica ofensiva del equipo. Su característica principal es que propicia ejercer velocidad ofensiva y romper la defensa del oponente para crear espacios.
2. Ataque central: El ataque central es un ataque organizado en la zona media de la cancha, aunque este ataque puede disparar directamente, es el más difícil porque la defensa central es la más cerrada y la más cerrada. El atacante delantero debe ser extremadamente receptivo. Jugadores entusiastas, conscientes y hábiles, dispuestos a asumir riesgos, rápidos y buenos en el posicionamiento.
3. Contraataque rápido: cuando el equipo atacante ataca durante el juego, la línea de fondo a menudo presiona cerca del medio campo y el número de defensores también se reduce relativamente debido al ataque y las asistencias. Cuando Yamato tarda en regresar a la defensa, es más conveniente aprovechar los huecos en la zona de defensa del oponente. Cuando pierde el balón, a menudo puede lograr buenos resultados lanzando un contraataque rápido. Puede lanzar efectivamente un contraataque rápido. Puede puntuar con eficacia, pero es algo arriesgado. Por tanto, debemos dominar el principio de precisión y velocidad. La cooperación debe estar organizada y tener un entendimiento tácito, lo que requiere múltiples prácticas. De lo contrario, sería difícil implementarlo en competición.
Tácticas defensivas de equipo
Las tácticas defensivas se pueden dividir en dos tipos básicos: defensa de presión hombre a hombre (defensa hombre a hombre), es decir, defensa hombre a hombre. hombre presionando dentro de un rango específico, sin intercambio de guardias: defensa de presión de zona (combinación de marcaje y zona), es decir, la defensa integral popular hoy, que combina presión y protección, presión en la propia zona de defensa y alternancia de guardias. En la defensa hombre a hombre, cada jugador tiene un objetivo claro que defender. Los principios más fundamentales de la defensa son presionar y proteger. Sólo presionando se puede tomar efectivamente la iniciativa de robar, suprimir las ventajas técnicas del oponente y ganar la iniciativa: la protección es presionar mejor y controlar los espacios, y preparar oportunidades para ganar el juego. La defensa puede interpretarse como un evento escenificado. En el equipo de diseño de Tsinghua, se utiliza un tipo de teoría de diseño estratégico basada en situaciones. El punto de colocación más importante está dentro de la formación básica, que determina la posición de un jugador mediante asignaciones de roles estándar, posición del balón y estado de control del balón. En este problema de defensa, la información básica se proporciona como estándar, denominación, un rol que es lo mismo que la asignación de roles y la evaluación de tareas. Otro hecho importante es la flexibilidad posicional en defensa, esto mide qué tan peligroso es un oponente si se encuentra en una posición determinada. Flexibilidad posicional defensiva porque cualquier punto del campo es conocido previamente entre todos los compañeros.
Cuatro tipos de acciones defensivas:
1. Bloqueo (obstrucción): cruzar la posesión del balón de un rival por el exterior de nuestra portería e impedir que avance.
2. Press (presión): correr, cuando un rival posee el balón y está cerca de nuestra portería, sigue siendo una amenaza para él.
3. Mark (marcaje): centrarse en un. oponente que no tiene el balón, por lo que sus compañeros no pueden pasarle el balón
4 Point Defend (defensa posicional): Estar en una posición de información básica, esto será beneficioso cuando un compañero cercano falla. en un 1vs1 o cuando el equipo recupera el control del balón.
Para simplificar este problema, establecemos la regla de que un jugador defensivo no puede defender a dos oponentes al mismo tiempo, y dos compañeros defensivos no deben defender al mismo oponente. Esta operación mutuamente excluyente se proporciona en las mismas condiciones. Esta operación conflictiva no se utiliza aquí. Hay una alternativa ahí, es decir, el bloqueo y la presión entran en conflicto, en lugar de exclusión mutua, proporcionando una estrategia defensiva diferente. Por lo tanto, el otro también es posible y no lo discutiremos más. Después de dividir una tarea defensiva en defender cada objeto ofensivo y situarse en los puntos de información básicos, se genera un cronograma vinculando a cada jugador defensivo con cada subtarea. En ese momento, el programa alcanza un efecto de evaluación individual.
Definimos una función de evaluación para cada tipo de acción. Estas variables se utilizan como entradas para cada función de evaluación: Intensidad, que mide el intervalo de tiempo desde la posición actual del jugador hasta la posición defensiva, Desviación, que mide la distancia desde el punto defensivo hasta la posición de formación básica del jugador, Amenaza, que es la flexibilidad de esta posición defensiva La posición actual del rival sexual. El resultado de esta función aumenta con la amenaza y disminuye con la distancia y la salida. Para la defensa puntual, sólo se utilizan amenazas como entrada. Para obtener el valor real de cada función, configuramos algunos escenarios típicos, extraemos los valores de entrada de ellos y luego asignamos el valor de salida a la función. Este valor se carga cuidadosamente para preservar ligeras variaciones. De esta forma se genera una lista de datos de entrada y salida.
En Tsinghua Design, utilizan la red neuronal BP para codificar la función de evaluación. Esta lista se genera para usarse como configuración para entrenar la red neuronal. Después de la capacitación, las redes se prueban para garantizar que se ajusten a los requisitos de la sección anterior, por lo que se determina la función de evaluación, pero nuestro equipo aún la está mejorando. El resto de la planificación de un procedimiento estándar ya está arriba y no requiere más discusión. También deja la elaboración de un plan de remediación. A veces el equipo no logra mantener la coherencia. Por ejemplo, cuando un oponente se posiciona a la misma distancia de dos defensores y al mismo tiempo. Punto de formación. Los dos acuerdos tendrán calificaciones similares y los dos defensores pueden entrar en conflicto. Nuestro diseño aprovecha esta retroalimentación absoluta en el sistema. Debido a que la pelota seguirá moviéndose en este juego y el oponente debe avanzar para atacar, además esta posición de información básica o punto defensivo cambiará en el próximo ciclo. Hay un pequeño cambio que permite que ambos arreglos sigan teniendo la misma calificación. Una vez que las dos disposiciones son diferentes, es lo suficientemente obvio para que ambos defensores noten la diferencia. El pre-defensa realizará esta acción defensiva, acercándose al oponente. Entonces el otro se moverá en la otra dirección. Así, el contraste aumenta y el sistema extrae una separación estatal del dilema anterior. De esta manera se puede volver a lograr la coherencia.
Implementación del algoritmo defensivo
1. Idea inicial del algoritmo defensivo
Paso 1: Encuentra la posición del balón y actualízala en tiempo real
Paso 2: Determina si el balón está dentro del rango de pateo:
Si se puede patear, realiza las acciones correspondientes según tu posición, específicamente:
Si el tiro libre va hacia adentro, patea el balón inmediatamente e intenta pasárselo a tus compañeros de equipo, si está fuera del área penal, puedes driblar el balón adecuadamente y enviarlo al medio campo;
Si es así, no se puede patear, ingresa al tercer paso;
p>
Paso 3: Determina si tienes la responsabilidad de robar el balón:
Si lo haces, entonces roba el balón Sin dudarlo, robar el balón también debe dividirse en áreas. En el área de penalti, debes correr con todas tus fuerzas para robar el balón. Si hay un compañero detrás de ti, puedes considerar placarlo. (me ha pasado), debes atacar inmediatamente por detrás;
Si no, debes ayudar en la defensa y entrar en el cuarto paso;
Paso 4: Ayudar en la defensa. Creo que este paso es el más difícil, porque hay demasiadas situaciones de este tipo y ahora solo hay unas pocas. Pensamiento general: todavía tenemos que dividir la segunda mitad y adoptar varias estrategias de marcación para cada zona.
Paso 5: Ajusta tu posición según la formación
2 El proceso de implementación del algoritmo defensivo:
|-->Si no hay saque inicial: p>
|-->Si es nuestro propio saque de salida y el jugador es el número 9:
|->Si el balón está dentro del alcance del tiro: entonces patear el saque el balón con la máxima fuerza;
| |->Si el balón no se puede patear: entonces roba;
|Si la formación actual no es la inicial o la posición real de los jugadores se desvía de la posición prescrita de la formación (en adelante, la posición estratégica) en más de 1 m: la formación inicial se importará y los jugadores se moverán directamente a su propia posición estratégica
|-->Si es el No. 7 o el No. 8: Prepárate para moverte al punto de patada del No. 9 y gira tu cabeza hacia la pelota;
| >En otros casos: Gira el cuerpo hacia (0 , 0), y gira la cabeza hacia el balón;
|-->Si el balón ha sido expulsado: introduce primero la formación defensiva 433,
|-->Si la información de la pelota no es la más reciente: busque la pelota y gire la cabeza para ayudar a encontrarla;
| rango de tiro:
| |-->Si está dentro del área de penalti del jugador: entonces use la fuerza máxima para patear el balón fuera del área de penalti en un ángulo relativamente seguro. | |-->Si está a 5 m delante de él, el ángulo es (-80, 80) Si hay un jugador oponente en el área en forma de abanico: transfiere la pelota con la máxima fuerza, es decir, ClearBall;
| |-->Si no hay ningún jugador en el área en forma de abanico a 5 m frente a ti y el ángulo es (-80, 80) Jugador contrario: patea el balón con poca fuerza;
| |-->Otros: driblar el balón hacia adelante;
|-->Si el jugador es el jugador entre sus compañeros que puede alcanzar el balón más rápido, ese es decir, el propio jugador es el mayor responsable de interceptar el balón:
|-->Si el balón es dirigido hacia la portería:
| -->Si la distancia entre el jugador y el balón es inferior a 2,5 m: tacklear;
|-->En caso contrario: acelerar hacia el balón;
| |-->En caso contrario: robar;
| |-->Si la posición actual del jugador se desvía de su posición estratégica (1,5+(distancia entre el jugador y el balón)/10 .
0) m: luego ajusta su posición inmediatamente;
|-->Si el jugador está en su propio campo: entonces ingresa al estado de marca,
| Si el jugador está en su propia área de penalti: utilice el método de marca MARK_GOAL (para evitar que el jugador defendido atrape el balón y lance);
| lados de su propia área de penalti: use el método de marca MARK_BISECTOR (evitando que el jugador defendido atrape el balón y lance);
| (evitando que el jugador defendido atrape la pelota) ;
|-->Si el ángulo relativo entre el jugador y la pelota es mayor que 1: gira su cuerpo hacia la pelota y su cabeza hacia la ball;
| |-->Otras situaciones: darse la vuelta (observar);
Nota: el proceso anterior regresa cuando encuentra ";", obtiene un soc (comando) y finalmente regresa soc.
Referencias
[1] Editado por Li Shi, Xu Xuming, Ye Zhen y Sun Zengqi, "Revisión: Competencia internacional de fútbol de robots y tecnologías relacionadas", Departamento Nacional de Tecnología Inteligente de Ciencias de la Computación, Universidad de Tsinghua y Laboratorio de Sistemas Clave, 1999.
[2] Sun Zengqi y Li Shi, "RoboCup and Intelligent Automation", Departamento de Informática y Tecnología, Universidad de Tsinghua, 1999.