Treffer: Implementing Deep Reinforcement Learning for Robotic Control in CoppeliaSim at MANULAB
Weitere Informationen
Dette prosjektet består av tre hovedkomponenter: implementasjon av ROS2 ved MANULAB, bruk av CoppeliaSim, og utføring av Reinforcement Learning ved hjelp av PyRep på IDUN høy-ytelses databehandlingsklynge (HPC). I forbindelse med ROS2 har det blitt etablert en kommunikasjonslink mellom Kuka LBR iiwa 14 R820 robotarmen og to grensesnitt: RVIZ2 og CoppeliaSim. For å legge til rette for denne kommunikasjonen, er det nøye konstruert et ROS2- arbeidsområde. Når det gjelder CoppeliaSim, er det laget en scene som etterligner den virkelige MANULAB-oppsettet. Denne scenen danner grunnlaget for både invers kinematikk og banestyring, som er implementert via egendefinert scripting. Innen området Reinforcement Learning er det utviklet et Python-skript for å legge til rette for anvendelsen av Proximal Policy Optimization (PPO)-algoritmen innenfor den nevnte CoppeliaSim-scenen, ved hjelp av PyRep. Dette skriptet tilbyr et bredt spekter av funksjonaliteter relatert til og nødvendige for RL-trening. For å videre utvide prosjektets kapabiliteter er det laget en container og databehandlingsmiljø for å utnytte databehandlingskraften til IDUN HPC-klynge for utførelse av RL-simuleringer i CoppeliaSim. Effektiviteten og funksjonaliteten til dette oppsettet er bekreftet gjennom en serie tester som involverer mange kjøringer, hvor 13 av disse spenner mellom 13 000 og 20 000 episoder. Prosjektets kodebase og ROS2-arbeidsområdet er åpent tilgjengelige på følgende GitHub-repositorium: https://github.com/EdvardBM/Edvard3. Detaljert overvåking av RL-kjøringene kan fås via følgende WandB-link: https://wandb.ai/mastersthesis/ End_game?workspace=user-ortnevik. ; The present project encompasses three core components: the implementation of ROS2 at MANULAB, the utilization of CoppeliaSim, and the execution of Reinforcement Learning using PyRep on the IDUN High-Performance Computing (HPC) cluster. In the context of ROS2, a communication link has been established between the Kuka LBR iiwa 14 R820 robot arm and two interfaces: RVIZ2 and CoppeliaSim. ...