Mountain Car 環境包含一輛被困在山谷中的車子。你的目標是跳出山谷並到達旗幟的位置。你可以執行的動作包括向左加速、向右加速,或者什麼都不做。你可以觀察車子在 x 軸上的位置以及速度。
通過打開 MountainCar.ipynb 開始這個實驗。
在這個實驗中,你應該學到將強化學習 (RL) 演算法應用到一個新環境通常是相當直接的,因為 OpenAI Gym 為所有環境提供了相同的介面,而演算法本身並不會過多依賴於環境的特性。你甚至可以重新結構化 Python 程式碼,以便將任何環境作為參數傳遞給 RL 演算法。
免責聲明:
本文件已使用 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們努力確保翻譯的準確性,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵信息,建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或誤釋不承擔責任。