生成AIは「人間の脳を模したニューラルネットワーク」をベースにしています。
主な技術は次の通りです:
- Transformer
Googleが2017年に発表。従来のRNNやLSTMよりも長い文脈を処理できる。GPTやBERTなどの基盤。 - LLM(大規模言語モデル)
数十億〜数千億のパラメータを持つモデル。大量のテキストを学習して「次に来る単語」を予測し、文章を生成する。 - GAN(敵対的生成ネットワーク)
「生成モデル」と「判別モデル」を競わせることで、リアルな画像や音声を生成。Deepfake技術もここから。 - 拡散モデル(Diffusion Models)
ノイズを加えたデータを少しずつ復元していく仕組み。Stable DiffusionやDALL·E 2に使われ、超高精細画像を実現。
つまり生成AIは「次に来るものを予測する」力をベースに、データを再構築して新しい表現を作り出しています。
コメント