ものづくりのブログ

うちのネコを題材にしたものづくりができたらいいなと思っていろいろ奮闘してます。

機械学習-強化学習

ChatGPT で遊んでみる

ChatGPTとは ChatGPT は OpenAI によって開発された、人間の発話をシミュレートしてユーザーと自然なやり取りをするチャットボットのモデルです。 ChatGPT は、OpenAI の GPT-3.5 モデルを採用し、AI設計チームが強化学習(RLHF)を用いて学習させ、中国語、…

強化学習でマリオに挑戦 #4

家のゲーム用パソコンのGPUを使ってスーパーマリオの強化学習の続きをやってみました。 これまでの取り組み a1026302.hatenablog.coma1026302.hatenablog.coma1026302.hatenablog.com GPUに切り替えて苦労したところ GPUメモリ不足 現象 学習中に以下のメッ…

強化学習でマリオに挑戦 #3

スーパーマリオの1-1をクリアさせたかったのですが、自分の低スペックパソコンだと「episodes」を500以上に設定すると処理が途中で落ちてしまう。 チュートリアルをみると「episodes」を40000ぐらいにすればクリアできるかもよとあるけど。。。(*´з`) いろい…

強化学習でマリオに挑戦 #2

今日は、チュートリアルを参考に強化学習の処理部分が手元の環境で動くようにセットアップしました。コードは少しずつ勉強していこうと思います。 昨日までの取り組み 今日やったこと 本日の進捗 プログラム 学習させた マリオでプレイ 動画出力部分(mp4) …

強化学習でマリオに挑戦 #1

何かAIっぽいことがやってみたくて強化学習の勉強をはじめてみました。 初めから本とか読むと自分の場合。。。難しくて眠くなっちゃうので、ゲームっぽい面白そうなところからやってみようと思います。 ちょうど、PyTorchチュートリアルにスーパーマリオのプ…