機械学習
RAGとは「Retrieval-Augmented Generation」の略です。 日本語にすると「検索強化生成」となり、AI が賢く文章を作り出す方法の一つです。 通常のAIは、あらかじめ学んだことを元に文章を作るだけですが、RAG は、実際にインターネットやデータベースから必…
ポインコ兄弟やピカチューの画像を dream-machineで画像を動画にしてみました。 www.youtube.com
Waifu Labs で作成した画像を PIKA LABS で動かしてみました。 Waifu Labs で作成した画像 a1026302.hatenablog.com サンプル PIKA LABS www.pika.art PIKA LABS で作成した動画 www.youtube.com
Waifu Labs で遊んでみました。 Waifu Labs 制約 実際に生成したキャラクター Waifu Labs Waifu Labs は美少女キャラクターのイラストを自動生成してくれるサービスです。 waifulabs.com 簡単に作成できるのでびっくりしました。 制約 商用利用不可 ロゴ改変…
FUTUREPEDIA というサイトに日々、新しいAIツールが紹介されているという記事があったので閲覧してみました。 FUTUREPEDIA www.futurepedia.io Magic Studio www.futurepedia.io ねこといちご ねこのお皿にいちごを入れた画像を準備して画像を変換させてみま…
「Scribble Diffusion」でお絵描きしてみました。 このツールは、ブラウザ上で描いた落書きとテキスト入力から自分の希望に近い絵を「Stable Diffusion」で生成することができます。 ツール Results ドラえもん 絵:「ドラえもん」 テキスト: 「ねこ」 絵:「…
ChatGPTとは ChatGPT は OpenAI によって開発された、人間の発話をシミュレートしてユーザーと自然なやり取りをするチャットボットのモデルです。 ChatGPT は、OpenAI の GPT-3.5 モデルを採用し、AI設計チームが強化学習(RLHF)を用いて学習させ、中国語、…
スプラトゥーン3の前夜祭のプレイ動画を物体検知してみました。 発売日の9/9が楽しみです。www.youtube.com
いろいろな動画を使って物体検出をしてみました。 猫とおもちゃ 飛行機① 飛行機② ねこ食事 猫とおもちゃ マイコンカーがうろうろしているところを眺めるねこの様子です。 www.youtube.com 飛行機① 飛行機は、対象が小さいと鳥や凧と間違わるようです。 www.y…
fast-style-transfer を使ってうちのネコを題材に絵画風の動画を作成してみました。 www.youtube.com www.youtube.com www.youtube.com www.youtube.com www.youtube.com
うちにいる動物たちの動画を絵画風に変換してみました。 ハムスター ハムスターが回し車で走っているところを絵画風の動画に変換してみました。 ねこ ねこがおもちゃに戸惑っているところを絵画風の動画に変換してみました。 www.youtube.com
なんとなく暇だったので、機械学習の勉強というお題目でうちのネコの写真を変換して遊んでみました。 a1026302.hatenablog.com うちのねこ 階段まえで座っているねこ 座布団の上で寝ているねこ 窓を眺めるねこ 階段にいるねこ ローソファーで寝るねこ 廊下で…
前回に引き続き、Google Colab で「YOLO v5」を使って物体検出で遊んでみました。 (おまけでハムスターも...) 今回は動画編です。a1026302.hatenablog.com階段を降りているところの動画ですが、以下のコマンドで検出処理を実行させます。 !python detect.py …
今回はうちのネコの写真を使って物体検出をしてみました。 方法は、Google Colab で「YOLO v5」を使用すといった感じです。 Google Colab Google Colab は以下のサイトから使用します。 colab.research.google.com YOLO v5 を Google Colab にインストール g…
Google ColaboratoryでTPUというものが使えるらしいので、使ってみました。 TPUとは Google Colaboratory とは 使い方 Google Colab で TPU を使ってみる TPU でスクリプトを実行 GPU でスクリプトを実行 参考 TPUとは テンソル・プロセッシング・ユニット(…
今回はkaggleについて調べてみました。 kaggle とは 初心者はどこから手を付けるか? アカウント開設 タイタニックのコンペに参加 コードを書いてみる タイタニックのコンペに参加 コードを書いてみる タイタニックのサンプルファイルを提出 参考にしたサイ…
家のゲーム用パソコンのGPUを使ってスーパーマリオの強化学習の続きをやってみました。 これまでの取り組み a1026302.hatenablog.coma1026302.hatenablog.coma1026302.hatenablog.com GPUに切り替えて苦労したところ GPUメモリ不足 現象 学習中に以下のメッ…
GPT-3(Generative Pretrained Transformer)はOpenAIが開発している1750億個のパラメータを使用した「文章生成言語モデル」のことで、1つ前のバージョンであるGPT-2がオープンソースで公開されています。github.comGPT-3はサンフランシスコを拠点とする非営…
スーパーマリオの1-1をクリアさせたかったのですが、自分の低スペックパソコンだと「episodes」を500以上に設定すると処理が途中で落ちてしまう。 チュートリアルをみると「episodes」を40000ぐらいにすればクリアできるかもよとあるけど。。。(*´з`) いろい…
今日は、チュートリアルを参考に強化学習の処理部分が手元の環境で動くようにセットアップしました。コードは少しずつ勉強していこうと思います。 昨日までの取り組み 今日やったこと 本日の進捗 プログラム 学習させた マリオでプレイ 動画出力部分(mp4) …
何かAIっぽいことがやってみたくて強化学習の勉強をはじめてみました。 初めから本とか読むと自分の場合。。。難しくて眠くなっちゃうので、ゲームっぽい面白そうなところからやってみようと思います。 ちょうど、PyTorchチュートリアルにスーパーマリオのプ…
今回は「fast style transfer」という画風変換手法を用いて、過去にYouTubeにアップロードしたスプラトゥーン2のプレイ動画やダンス動画について、画像のスタイルの変換を試みてみました。///////////もくじ//////////// 「fast-style-transfer」とは どん…
機械学習についてちょっとした勉強といういうことで、むかし作成したYouTubeにアップロードした動画で姿勢推定を行ってみました。///////////もくじ//////////// 姿勢推定 HRNetとは 元ネタ 作業ログ 「ffprobe」でエラー ffmpeg追加インストール エラーなく…
YOLOv5 でダンス動画やスプラトゥーンのようなゲームを物体検出するとどうなるか実験してみました。 YOLO YOLOとは 物体検出の準備 インストール NVIDIAドライバインストール OpenCVインストール YOLOv5インストール 追加ライブラリインストール モデルファ…
うちのネコが「darknet nightmare」でなかなかおもしろい変身をとげました。こんなねこが。。。 こんな変身をとげました! 画像変換面白いです。 darknetの準備 darknetの準備方法は以下のブログに記載してます。 a1026302.hatenablog.com
前回手応えがあったので。。。a1026302.hatenablog.comマルコフ連鎖で試行錯誤していれば、オリジナルの昔話ができることを期待したのですが。。。 結果は以下の通りただただ混沌とた話になってしまいました。。。 別な手法で再挑戦したい。。。とおもいまし…
マルコフ連鎖でいろいろな昔話を混ぜてオリジナル昔話を作ってみました。 いろいろパンチの効いた昔話になって後から笑いがこみあげてくる。。。今回使用した昔話 桃太郎 浦島太郎 金太郎 一寸法師 さるかに合戦 わらしべ長者 teke:0 昔、昔あるところにカニ…
2020年もあともう少し、 今年は世界中が大変な1年でした。今年は新型コロナウィルスとかあつもりとかアマビエとか鬼滅の刃とかいろいろあるけど、 これらの言葉がどんな言葉と類似しているかちょっとだけ興味深いです。 fasttext の準備 作業内容 wikipedia …
ふと、桃太郎に似た昔話ってなんだろうと思いコサイン類似度を使って桃太郎に似た昔話を探してみました。今回は mecab にneologd 辞書を使ってます。 昔話の取得先 文章の類似度の計算 コサイン類似度 環境準備 類似度の算出 事前準備(追加インストール) m…