單元摘要

<aside> 💡

這個單元包含什麼?

此單元會實際使用 PAIA Desktop 3D 開始訓練遊戲AI,也會從各種練習中,愈來愈了解強化式學習的細節。

</aside>

<aside> 🔥

需要哪些先備知識?

  1. 了解 05-強化式學習基礎概念介紹 </aside>

<aside> ⏰

大概需要花多少時間?

閱讀與操作約90~120 分鐘

</aside>

基礎實作

<aside> 🎓

範例程式說明

</aside>

<aside> ✍️

基礎實作:閃躲泥坑

</aside>

<aside> ✍️

基礎實作:避開水坑

</aside>

<aside> ✍️

基礎實作:過濾資料

</aside>

<aside> 🎓

範例程式說明:推論模式

</aside>

<aside> 💭

RL情境練習

</aside>

進階實作

<aside> ✍️

客製化獎勵:通過時間的獎勵

<aside> 🦾

更上層樓

更細緻的話,需要考慮到兩個檢查點之間的距離,再給一個合理的時間來作加減分

</aside>

</aside>

<aside> 📝

PPO 的參數分別代表哪些意義?

</aside>

<aside> ✍️

客製化獎勵:計算水坑

</aside>

<aside> 📝

提供獎勵的要訣

</aside>

<aside> 📝

訓練的要訣

</aside>