ALPHAGO: EL USO DE MÁQUINAS DE APRENDIZAJE PARA DOMINAR EL ANTIGUO JUEGO GO
AlphaGo: el uso de la máquina de aprendizaje para dominar el antiguo juego de Go
27 de de enero de, el año 2016
El juego del Go se originó en China hace más de 2.500 años. Confucio escribió sobre el juego, y se considera una de las cuatro artes esenciales requeridas de cualquier verdadero erudito chino. Interpretado por más de 40 millones de personas en todo el mundo , las reglas del juego son simples: los jugadores se turnan para colocar piedras negras o blancas en un tablero, tratando de capturar las piedras del oponente o rodear el espacio vacío para hacer puntos del territorio. El juego se juega principalmente a través de la intuición y la sensación, y debido a su belleza, sutileza y profundidad intelectual que ha capturado la imaginación humana por siglos. Pero tan simple como son las reglas, Go es un juego de profunda complejidad. Existen posibles posiciones, eso es más que el número de átomos en el universo, y más de un momento googol mayores de ajedrez. Esta complejidad es lo que hace Ir duro para ordenadores para jugar, y por lo tanto un desafío irresistible para la inteligencia artificial investigadores (AI), que utilizar juegos como banco de pruebas para inventar algoritmos inteligentes y flexibles que pueden hacer frente a los problemas, a veces de maneras similares a los humanos. El primer juego dominado por una computadora era tres en raya (también conocido como el tic-tac-dedo del pie) en 1952. Luego cayeron las damas en 1994. En 1997 Deep Blue venció famoso Garry Kasparov en ajedrez . No se limita a los juegos de mesa, ya sea por IBM de Watson [PDF] superado dos campeones en Jeopardy en 2011, y en 2014 nuestros propios algoritmos aprendieron a tocar docenas de juegos de Atarisólo de las entradas de píxeles primas . Sin embargo, hasta la fecha, ha frustrado Ir investigadores de la IA; computadoras todavía sólo juegan Go, así como aficionados.métodos tradicionales -que AI construir un árbol de búsqueda sobre todas las posibles posiciones-no tener una oportunidad en Ir. Por eso, cuando nos dispusimos a agrietarse Go, tomamos un enfoque diferente. Hemos construido un sistema, AlphaGo, que combina un árbol de búsqueda avanzada con redes neuronales profundas . Estas redes neuronales tienen una descripción del tablero de Go como una entrada y procesan a través de 12 capas de red diferentes que contienen millones de conexiones similares a neuronas. Una red neuronal, la "red de políticas", selecciona el siguiente movimiento para jugar. La otra red neuronal, la "red de valor", predice el ganador del juego. Hemos capacitado a las redes neuronales en 30 millones de movimientos de los juegos jugados por los expertos humanos, hasta que se pudiera predecir el ser humano movimiento 57 por ciento del tiempo (el récord anterior AlphaGo antes era el 44 por ciento ). Pero nuestro objetivo es vencer a los mejores jugadores humanos, no sólo imitar ellos. Para ello, AlphaGo aprendió a descubrir nuevas estrategias por sí mismo, al jugar miles de juegos entre sus redes neuronales, y el ajuste de las conexiones que utilizan un proceso de ensayo y error conocido como el aprendizaje por refuerzo . Por supuesto, todo esto requiere una enorme cantidad de potencia de cálculo, por lo que hizo un amplio uso de Google Cloud Platform . Después de todo ese entrenamiento que era el momento de poner a prueba AlphaGo. En primer lugar, llevamos a cabo un torneo entre AlphaGo y los otros programas principales en la vanguardia de la computadora se queda. AlphaGo ganó todos menos uno de sus 500 partidos contra estos programas.Así que el siguiente paso fue invitar al tres veces campeón de Europa Ir Fan Hui-un jugador profesional de élite reinante que ha dedicado su vida para ir desde la edad de 12 a nuestra oficina de Londres para un partido de desafío. En un sistema cerrado puertas coinciden en octubre pasado, AlphaGo ganado por 5 juegos a 0. Fue la primera vez que un programa de ordenador nunca ha vencido a un jugador profesional de Go.Usted puede encontrar más información en nuestro documento, que fue publicado enla naturaleza hoy en día.
¿Que sigue? En marzo, AlphaGo se enfrentará a su último desafío: un partido de desafío de cinco partidos en Seúl contra el legendario Lee Sedol . -el Mejor jugador de Go en el mundo durante la última década Estamos encantados de haber dominado Go y por lo tanto conseguido uno de los grand retos de la AI . Sin embargo, el aspecto más importante de todo esto para nosotros es que AlphaGo no es sólo un sistema de "experto" construido con reglas hechas a mano; En su lugar, utiliza técnicas de aprendizaje automático generales de averiguar por sí mismo lo que es ganar en Go.Mientras que los juegos son la plataforma perfecta para desarrollar y probar algoritmos de IA rápida y eficiente, en última instancia, queremos aplicar estas técnicas a importantes problemas del mundo real. Debido a que los métodos que hemos utilizado son de uso general, nuestra esperanza es que algún día podría ampliarse para ayudarnos a resolver algunos de los problemas más difíciles y más urgentes de la sociedad, desde el modelado climático para el análisis de enfermedades complejas.Estamos muy contentos de ver lo que podemos utilizar esta tecnología para hacer frente a la próxima!
¿Que sigue? En marzo, AlphaGo se enfrentará a su último desafío: un partido de desafío de cinco partidos en Seúl contra el legendario Lee Sedol . -el Mejor jugador de Go en el mundo durante la última década Estamos encantados de haber dominado Go y por lo tanto conseguido uno de los grand retos de la AI . Sin embargo, el aspecto más importante de todo esto para nosotros es que AlphaGo no es sólo un sistema de "experto" construido con reglas hechas a mano; En su lugar, utiliza técnicas de aprendizaje automático generales de averiguar por sí mismo lo que es ganar en Go.Mientras que los juegos son la plataforma perfecta para desarrollar y probar algoritmos de IA rápida y eficiente, en última instancia, queremos aplicar estas técnicas a importantes problemas del mundo real. Debido a que los métodos que hemos utilizado son de uso general, nuestra esperanza es que algún día podría ampliarse para ayudarnos a resolver algunos de los problemas más difíciles y más urgentes de la sociedad, desde el modelado climático para el análisis de enfermedades complejas.Estamos muy contentos de ver lo que podemos utilizar esta tecnología para hacer frente a la próxima!
Los algoritmos de aprendizaje, llamados redes neuronales profundas, fueron entrenados usando una base de datos de millones de movimientos hechos en el pasado por jugadores humanos. La computadora pulió estos conocimientos jugando una partida contra sí mismos, combinando años de experiencias combinada con la técnica, llamada árbol de búsqueda: Monte Carlo.
ResponderEliminarSe valora el conocimiento humano para llevar adelante estos experimentos y el desarrollo tecnológico originado en los humanos.
El conocimiento intuitivo es el sello característico de la inteligencia humana.
Mejores condiciones de vida para los humanos, se requieren para ser capaces de desarrollar sus capacidades, y mejores conocimientos tecnológicos se desarrollarán. O, es una carrera para destronar al hombre?
Get a Loan Today At 3% Interest Rate, contact us at:davidloans760@gmail.com
ResponderEliminarWelcome to DAVID JAMES Loan Company, This is a legit loan Company, formed to help individuals who are in need of financial crises and help them achieve their goals in
life.
Available Loans we offer are,
1. Personal Loans (Secure and Unsecured)
2. Business Loans (Secure and Unsecured)
3. Combination Loan
4. Consolidation Loan And Many More:
Interested clients should please send request to our email for application form and terms. Try and see for your self, our wonderful services that does not exceed
Working days for loan processing and just only (1)hour 35 minutes of loan Transfer.
EMAIL---[ davidloans760@gmail.com ]
Warm Regard