單元摘要

<aside> 💡

這個單元包含什麼？

此單元會實際使用 PAIA Desktop 3D 開始訓練遊戲AI，也會從各種練習中，愈來愈了解強化式學習的細節。

</aside>

<aside> 🔥

需要哪些先備知識？

了解 05-強化式學習基礎概念介紹 </aside>

<aside> ⏰

大概需要花多少時間？

閱讀與操作約90~120 分鐘

</aside>

基礎實作

<aside> 🎓

範例程式說明

</aside>

<aside> ✍️

基礎實作：閃躲泥坑

</aside>

<aside> ✍️

基礎實作：避開水坑

</aside>

<aside> ✍️

基礎實作：過濾資料

</aside>

<aside> 🎓

範例程式說明：推論模式

</aside>

<aside> 💭

RL情境練習

</aside>

進階實作

<aside> ✍️

客製化獎勵：通過時間的獎勵

<aside> 🦾

更上層樓

更細緻的話，需要考慮到兩個檢查點之間的距離，再給一個合理的時間來作加減分

</aside>

</aside>

<aside> 📝

PPO 的參數分別代表哪些意義？

</aside>

<aside> ✍️

客製化獎勵：計算水坑

</aside>

<aside> 📝

提供獎勵的要訣

</aside>

<aside> 📝

訓練的要訣

</aside>