Treffer 161 - 180 von 507

161

Reinforced learning based bot for 'starcraft ii' / ; Skatinamuoju mokymusi paremtas botas žaidimui 'StarCraft II'.
Drungilas, Gabrielius

Reinforced learning AI StarCraft II macro-management Python python-sc2
Dissertation
Zu den Favoriten
162

pgeon applied to Overcooked-AI to explain agents' behaviour
Universitat Politècnica de Catalunya. Doctorat en Intel·ligència Artificial ; Universitat Politècnica de Catalunya. Departament de Ciències de la Computació ; Universitat Politècnica de Catalunya. IDEAI-UPC - Intelligent Data sciEnce and Artificial Intelligence Research Group ; et al.

E-Ressource
Zu den Favoriten
163

Creación de tareas competitivas multi-agente en Minecraft
Hernández Orallo, José ; Universitat Politècnica de València. Departamento de Sistemas Informáticos y Computación - Departament de Sistemes Informàtics i Computació ; Universitat Politècnica de València. Escola Tècnica Superior d'Enginyeria Informàtica ; et al.

E-Ressource
Zu den Favoriten
164

Automated Image Pre-Processing for Optimized Text Extraction Using Reinforcement Learning and Genetic Algorithms
Rohoullah, Rahmat ; Joakim, Månsson

BRISK YOLO Reinforcement learning Evolutionary algorithm OCR Image pre-processing
Dissertation
Zu den Favoriten
165

Quadrotor path following and reactive obstacle avoidance with deep reinforcement learning
Rubí Perelló, Bartomeu ; Morcego Seix, Bernardo ; Pérez Magrané, Ramon ; et al.

Àrees temàtiques de la U... Drone aircraft Deep learning (Machine l... Unmanned aerial vehicles Obstacle avoidance Path following
Fachzeitschrift
Zu den Favoriten
166

MotorNet, a Python toolbox for controlling differentiable biomechanical effectors with artificial neural networks
Olivier Codol ; Jonathan A Michaels ; Mehrdad Kashefi ; et al.
eLife, Vol 12 (2024)

motor control motor learning computational model neural network muscle model biomechanical model
Fachzeitschrift
Zu den Favoriten
167

Creación de tareas competitivas multi-agente en Minecraft
Martínez Pedrón, Carlos Javier ; Hernández Orallo, José ; Departamento de Sistemas Informáticos y Computación ; et al.
RiuNet. Repositorio Institucional de la Universitat Politécnica de Valéncia
Universitat Politècnica de València (UPV)
instname

Artificial intelligence reinforcement learning aprendizaje por refuerzo multi-agent Malmo multiagente
Dissertation
Zu den Favoriten
168

my Human Brain Project (mHBP)
Salvador, José António Guerreiro Nunes Sanches ; Breternitz Jr, Maurício ; Silva, João Pedro Afonso Oliveira da

Reinforcement learning Sensorial data Actions as output Aprendizagem por reforço... Dados de sensores Ações como output
Dissertation
Zu den Favoriten
169

Creació del Joc Snake i Implementació d'una IA Bàsica
Valero Carrasco, Víctor ; Universitat Autònoma de Barcelona. Escola Tècnica Superior d'Enginyeria ; Antens, Coen Jacobus

Python Aprenentatge per Reforça... Pygame Pytorch Deep Q-Learning Intel·ligència Artificia...
Dissertation
Zu den Favoriten
170

XAITK: The explainable AI toolkit.
Hu, Brian ; Tunison, Paul ; Vasu, Bhavan ; et al.
Applied AI Letters; Dec2021, Vol. 2 Issue 4, p1-10, 10p

ARTIFICIAL intelligence NEURAL circuitry NATURAL language process... COMPUTER software COMPUTER systems
Fachzeitschrift
Zu den Favoriten
171

Training a simulated drone with deep reinforcement learning
Joos, Andri

Testing and Simulation Academic and Education Python
Dissertation
Zu den Favoriten
172

Teaching Data Science with Literate Programming Tools.
Birkenkrahe, Marcus
Digital; Sep2023, Vol. 3 Issue 3, p232-250, 19p

DATA science LITERATE programming WORKFLOW management PYTHON programming langu... STUDENT attitudes
Fachzeitschrift
Zu den Favoriten
173

PROCES IZRADE UMJETNE INTELIGENCIJE PODRŽANIM UČENJEM : Diplomski rad ; CREATION PROCESS OF AN ARTIFICIAL INTELLIGENCE USING REINFORCEMENT LEARNING : Graduate paper
Garmaz, Petar ; Jelić, Slobodan

umjetna inteligencija podržano učenje strojno učenje DQN artificial intelligence reinforcement learning
Dissertation
Zu den Favoriten
174

Seguimiento de líneas con técnicas de aprendizaje por refuerzo en robótica móvil
López Delmás, Eduardo ; Lope Asiaín, Javier de

Informática
Dissertation
Zu den Favoriten
175

Aprendizaje por refuerzo para control de sistemas dinámicos
Díaz Latorre, Andrés Steven ; López Sotelo, Jesús Alfonso
Universidad Autónoma de Occidente
Repositorio Institucional UAO
Barto, A. G. Sutton, R. S. Anderson, C. W. (2013). Neuronlike Adaptive Elements That Can Solve Difficult Learning Control Problems. (IEEE Transactions on Systems, Man, and Cybernetics). Recuperado de http://www.derongliu.org/adp/adp-cdrom/Barto1983.pdf Boada, M. J. Boada, B. López, V. (2015). Algoritmo de aprendizaje por refuerzo continúo para el control de un sistema de suspensión semi – activa. Revista: Iberoamericana de Ingeniería Mecánica. Chandra, A. (2018). Perceptron: The Artificial Neuron (An Essential Upgrade To The McCulloch-Pitts Neuron). Recuperado de https://towardsdatascience.com/perceptron-the-artificial-neuron-4d8c70d5cc8d Cuaya, G. (2015). Procesos de decisión de Markov aplicados en la locomoción de robots hexápodos. (Tesis de maestria) Tonantzintla. México. Recuperado de https://inaoe.repositorioinstitucional.mx/jspui/bitstream/1009/588/1/CuayaSG.pdf Covantec. (2014). Ventajas y desventajas. Recuperado de https://entrenamiento-python-basico.readthedocs.io/es/latest/leccion1/ventajas_desventajas.html#ventajas García, E. O. (2015). Aprendizaje por refuerzo mediante transferencia de conocimiento cualitativo. Recuperado de http://ccc.inaoep.mx/~jemc/blog/wp-content/uploads/2016/09/tesisOmar.pdf Github. (s.f). Openai/gym. Recuperado de: https://github.com/openai/gym/wiki/CartPole-v0 Gym.openai. (s.f). Getting Started with Gym. Recuperado de https://gym.openai.com/docs/ Gym. (s.f). CartPole-v0. Recuperado de https://gym.openai.com/envs/Cart-v0/ Gym. (s.f). MountainCar-v0. Recuperado de https://gym.openai.com/envs/MountainCar-v0/ Gym. (s.f). Pendulum-v0. Recuperado de https://gym.openai.com/envs/Pendulum-v0/ Hassabis, D. (2016). AlphaGo: using machine learning to master the ancient game of Go. Recuperado de https://blog.google/technology/ai/alphago-machine-learning-game-go/ Jaderberg, M. Wojciech, M. Czarnecki. Dunning, I. Marris, L. Lever, G. Garcia, A, Beattie, C. Rabinowitz, C. Morcos, A. Ruderman, A. Sonnerat, N. Green, T. Deason, L. Leibo, J. Silver, D. Hassabis, D. Kavukcuoglu, K. Graepel, T. (2019). Human-level performance in 3D multiplayer games with population-based reinforcement learning. Recuperado de https://science.sciencemag.org/content/364/6443/859 Lopez, R. (2015). Q-learning: Aprendizaje automático por refuerzo. Recuperado de https://rubenlopezg.wordpress.com/2015/05/12/q-learning-aprendizaje-automatico-por-refuerzo/ McCulloch, W. Pitts, W .(1943). A logical calculus of the the ideas immanet in nervous activity. Bulletin of mathematical biology, Vol 52, Recuperado de: https://link.springer.com/article/10.1007%2FBF02459570 McDonal, C. (2018). Solving multiarmed bandits: A comparison of epsilon-greedy and Thompson sampling. Recuperado de https://towardsdatascience.com/solving-multiarmed-bandits-a-comparison-of-epsilon-greedy-and-thompson-sampling-d97167ca9a50 Mnih, V. Kavukcuoglu, K. Silver, D. Graves, A. Antonoglou, L. Wierstra, D. Riedmiller, M. (2013). Playing Atari with Deep Reinforcement Learning. Recuperado de https://arxiv.org/pdf/1312.5602.pdf Moor, A. W. (1990). Efficient memory-based Learning for robot control. Recuperado de: https://www.cl.cam.ac.uk/techreports/UCAM-CL-TR-209.pdf Moor, J. (2003). The Turing test: The elusive standard of artificial intelligence. EE.UU: Science & Business Media. Nieto, J. (2018). La Inteligencia Artificial del Huawei P20 Pro, ¿cómo te afecta en el día a día? Recuperado de https://andro4all.com/huawei_ia/como-funciona-inteligencia-artificial-huawei-p20-pro Nº 171: IA Grafos-Aprendizaje por Refuerzo 03 (Activo, Q-Learning). (2017)Recuperado de https://www.youtube.com/watch?v=ZoRMKs8XLSA Ortego, D. (2017).Qué es Tensorflow? Recuperado de https://openwebinars.net/blog/que-es-tensorflow/ Pastor, J. (2017). AlphaGo aplasta al mejor jugador del mundo de Go, la inteligencia artificial es imbatible. Recuperado de https://www.xataka.com/robotica-e-ia/alphago-aplasta-al-mejor-jugador-del-mundo-de-go-la-inteligencia-artificial-es-imbatible Printista, A. M, Errecalde. M. L, Montoya, C. I. (2000). Una implementación paralela del algoritmo Q-Learning basada en un esquema de comunicación con caché. San Luis, Argentina. Recuperado de http://sedici.unlp.edu.ar/bitstream/handle/10915/23363/Documento_completo.pdf?sequence=1 RSTOPUR. Disponible en: https://rstopup.com/es-posible-la-creacion-de-un-nuevo-gimnasio-medio-ambiente-en-openai.html Ruiz, S. Hernández, B. (2014). Procesos de decisión de Markovy microescenarios para navegacióny evasión de colisiones para multitudes. Research in Computing Science. Recuperado de http://www.rcs.cic.ipn.mx/rcs/2014_74/Procesos%20de%20decision%20de%20Markov%20y%20microescenarios%20para%20navegacion%20y%20evasion%20de%20colisiones.pdf Simonini, T. (2018). An intro to Advantage Actor Critic methods: let’s play Sonic the Hedgehog!. Recuperado de https://www.freecodecamp.org/news/an-intro-to-advantage-actor-critic-methods-lets-play-sonic-the-hedgehog-86d6240171d/ Siembro, G. C. (2007) Procesos de decisión de Markov aplicados a la locomoción de robots hexápodos. Recuperado de http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/588 Sutton, R. S. Barto, A. G. (1998). Reinforcement learning: An introduction. Sutton, R. S. Barto, A. G. (1998). Introduction to reinforcement learning. Londres, Inglaterra. Recuperado de http://incompleteideas.net/book/bookdraft2017nov5.pdf Tensorflow. (s.f). An end-to-end open source machine learning platform. Recuperado de https://www.tensorflow.org/ Parra, S. (2013). La emergencia del buen juego en un tablero de damas de 1950 https://www.xatakaciencia.com/computacion/la-emergencia-del-buen-juego-en-un-tablero-de-damas-de-1950 Yoon, C. (s.f). Understanding Actor Critic Methods and A2C. Recuperado de https://towardsdatascience.com/understanding-actor-critic-methods-931b97b6df3f

Aprendizaje automático (... 4. Education Reinforcement learning Machine learning Ingenería Mecatrónica Algoritmos (Computadores...
Dissertation
Zu den Favoriten
176

Análisis sobre enfoques de Deep Learning para la generación de resúmenes
Pascual Núñez, Álvaro ; Díaz Esteban, Alberto

004(043.3) Resumen Información Deep learning NLP Redes neuronales
Dissertation
Zu den Favoriten
177

More by stick than by carrot: A reinforcement learning style rooted in the medial frontal cortex in anorexia nervosa.
Bernardoni, Fabio ; King, Joseph A. ; Geisler, Daniel ; et al.
Journal of Psychopathology and Clinical Science; The Journal of Abnormal and Social Psychology; The Journal of Abnormal Psychology; The Journal of Abnormal Psychology and Social Psychology

Fachzeitschrift
Zu den Favoriten
178

Disseny, configuració i validació d'algorismes de Machine Learning aplicats la gestió automatitzada d'encaminament per a vehicles autònoms amb descàrregues de continguts en un entorn controlat
García Cantón, Sergi ; Cervelló Pastor, Cristina ; Universitat Politècnica de Catalunya. Departament d'Enginyeria Telemàtica
UPCommons. Portal del coneixement obert de la UPC
Universitat Politècnica de Catalunya (UPC)

DRL Offloading Federat i centralitzat Vehicles autònoms Àrees temàtiques de la U... Vehicle autònom
Dissertation
Zu den Favoriten
179

Implementation of an AI-enhanced unmanned traffic management system using BlueSky simulation for urban air mobility
Bertran Cañellas, Guillem ; Universitat Autònoma de Barcelona. Escola d'Enginyeria ; Çetin, Ender

Gestió del tràfic aeri Mobilitat aèria urbana Gestió de tràfic no trip... Vehicles d'enlairament i... Aprenentatge per reforç.... Simulador bluesky
Dissertation
Zu den Favoriten
180

RL-pendulum: Passive Control Policy for Simple Pendulum
University of Twente

robotics Reinforcement Learning Control Policy Passivity Energy Tanks Microcontroller Deployme...
E-Ressource
Zu den Favoriten

Filter