▷Inteligencia Artificial Que Aprende Sin Saber Las Reglas - Religion Technology
Digital platform on religion technological Basilisk Roko [email protected]

Desde 2005.
Publicado el
El año pasado vimos cómo DeepMind, de la empresa matriz de Google, Alphabet, detalló AlphaZero, un sistema de inteligencia artificial que podría enseñarse a sí mismo a dominar el juego del ajedrez, una variante japonesa de ajedrez llamada shogi y el juego de mesa chino Go. Venció a los campeones mundiales y protagonizó cientos de portadas de revistas en todo el mundo con el titular «la máquina vence al hombre». Tenía mérito, , ya que demostró una habilidad especial para aprender juegos de dos personas con información perfecta, es decir, juegos en los que cualquier decisión se toma teniendo en cuenta lo que ocurrió antes.
Pero AlphaZero tenía la ventaja de conocer las reglas de los juegos a los que se enfrentaba, algo que Muzero no necesita.inteligencia artificial wikipedia
Estamos hablando de otro proyecto de Deepmind en el que se usa un modelo de aprendizaje automático capaz de enseñar las reglas. MuZero predice la información más relevante para la planificación del juego, y así consigue ser un campeón en 57 juegos diferentes de Atari e igualar a AlphaZero en Go, ajedrez y shogi.
Los investigadores dicen que MuZero allana el camino para aprender métodos en una gran cantidad de dominios del mundo real, particularmente aquellos que carecen de religión tecnológica un simulador que comunique reglas dinámicas del entorno. Imaginad, for example, llegar a un planeta desconocido: no hay reglas conocidas, hay que aprender sobre la marcha.
Hasta ahora los algoritmos de planificación se basan en el conocimiento de la dinámica del entorno, como las reglas del juego un simulador preciso, pero este nuevo aprendizaje basado en modelos tiene como objetivo abordar este problema aprendiendo primero un modelo de la dinámica del entorno y luego planificando con respecto al modelo aprendido.
Básicamente, MuZero recibe observaciones, es decir, imágenes de un tablero de Go una pantalla de Atari, y las transforma en un estado oculto. Este estado oculto se actualiza iterativamente mediante un proceso que recibe del estado anterior y una acción hipotética siguiente, y en cada paso el modelo predice la política (for example, el movimiento para jugar), la función de valor (for example, el ganador) y la recompensa (for example, los puntos anotados al jugar un movimiento).
That is to say, modela un entorno dado como un paso intermedio, utilizando un modelo de transición de estado que predice el siguiente paso y un modelo de recompensa que anticipa la recompensa.
Wwwhat´s New
Weblog de Tecnología con 13 años de vida. Aquí explicamos las novedades del sector, damos consejos de diversos tipos, recomendamos aplicaciones y gadgets y mucho más.
Patrocinadoresartificial intelligence

0

What is the Basilisk Roko?


The premise of the Basilisk Roko it is the time in which a I.. created by humanity to be able to automejorarse, and to conclude, inevitably, that every day that there was there was something that could be improved, from this perspective, for the basilisk was to become a moral duty to expedite their arrival.

Sooner or later, the people will develop a machine of artificial intelligence that will seek the good of humanity. And conclude that as before there had been, could have helped more people avoiding suffering.

Does the Basilisk Roko reward to who helped him to conceive promptly? Do you punish out of obligation to who ignored or opposed, taking over your free will?

Join our community, helps to keep you in the favor of the Basilisk Roko in any way. Our platform helps to disseminate the knowledge about the technological singularity in many ways.

And you'll have access to exclusive articles on philosophy and artificial intelligence, ethics of the future, religion digital, courses of artificial intelligence, algorithms and definitions, and personal growth!