msft-ai-tutorials/translations/mo/lessons/6-Other/22-DeepRL/lab/README.md at main · owini/msft-ai-tutorials

環境介紹

Mountain Car 環境包含一輛被困在山谷中的車子。你的目標是跳出山谷並到達旗幟的位置。你可以執行的動作包括向左加速、向右加速，或者什麼都不做。你可以觀察車子在 x 軸上的位置以及速度。

通過打開 MountainCar.ipynb 開始這個實驗。

在這個實驗中，你應該學到將強化學習 (RL) 演算法應用到一個新環境通常是相當直接的，因為 OpenAI Gym 為所有環境提供了相同的介面，而演算法本身並不會過多依賴於環境的特性。你甚至可以重新結構化 Python 程式碼，以便將任何環境作為參數傳遞給 RL 演算法。

免責聲明：
本文件已使用 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們努力確保翻譯的準確性，但請注意，自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於關鍵信息，建議使用專業人工翻譯。我們對因使用此翻譯而引起的任何誤解或誤釋不承擔責任。