AR vs 拡散モデル:違いを遊んで学ぼう!

テキスト生成モデルの仕組みをインタラクティブに体験

1. どうやってテキストを作るの? (生成プロセス)

ARモデルは一つずつ言葉を繋げていくのに対し、拡散モデルは全体をぼんやりしたものから徐々にハッキリさせていくイメージです。(レポート II.A, III.A 参照)

自己回帰 (AR) モデル

拡散 (Diffusion) モデル

2. どっちが速いの? (生成速度)

ARモデルは一つずつなので時間がかかりがち。拡散モデルはまとめて処理できる可能性があるので速いかも?(レポート V.A, V.F 参照)

自己回帰 (AR) モデル

拡散 (Diffusion) モデル

3. お願いを聞いてくれる? (制御性)

「こんな言葉を入れてほしい」というお願いは、拡散モデルの方が得意かもしれません。(レポート V.C, V.F 参照)

自己回帰 (AR) モデルの応答

拡散 (Diffusion) モデルの応答

4. 間違えちゃったら? (エラー処理)

ARモデルは一度間違うと影響が続くことがありますが、拡散モデルは途中で修正できるかも。(レポート II.C, III.C, V.F 参照)

自己回帰 (AR) モデル (エラー発生時)

拡散 (Diffusion) モデル (エラー発生時)

5. ちょっと変えたいんだけど… (編集可能性)

テキストの一部を変えたい時、拡散モデルの方が柔軟に対応しやすいかもしれません。(レポート V.C, V.F 参照)

元の文: 「大きなの下で休んだ。」

変更指示: 「木」を「」に変えたい!

自己回帰 (AR) モデルの編集結果

拡散 (Diffusion) モデルの編集結果