「顔出しなしYouTube」はAIエージェントで作る時代になった

5月 17, 2026

「動画を毎回撮るのは大変だけど、YouTubeで発信は続けたい」。AIで仕事をしている人ほど、この板挟みに頻繁にぶつかります。2026年5月16日（土）の夜、その答えのひとつを見せてくれたのが、フリーランスのぱんちゃんさん（@panchaaan_2）をゲストに迎えたウェビナー「Codex × ElevenLabs × HeyGenでアバターYouTube動画を自動化！」でした。

私（けいたろう）はモデレーター席からの参加でしたが、終わったときの率直な感想は、「顔出しなしYouTube」というジャンルが、もうAIエージェントで組み立てるフェーズに入った、というものでした。本記事ではその90分の中身を、参加者アンケートと一緒に振り返ります。

当日の流れと、登場した4つのツール

ハンズオン中心のセミナーで、ぱんちゃんさんが組み合わせたのは次の4つでした。

Codex：OpenAI のAIエージェント。今回は司令塔として、画像生成・HTML編集・API連携をすべて担当。
HeyGen：AIアバター生成サービス。テキスト・写真・録画からアバターを作成でき、声と組み合わせて動画化までこなす。
ElevenLabs：音声AI。V3モデルなら日本語の精度が高く、デジタル透かしや権利配慮も評価されている。
Hyperframes：HeyGen社が2026年4月中旬にローンチしたばかりの動画フレームワーク。HTMLベースで、オープンソース・商用利用無料。

ぱんちゃんさんが強調していたのは、「動画編集の世界では Remotion が先行しているが、Hyperframes は HTML ベースでAI学習データが多く、しかも完全無料」という点。Remotion は4人以上の利用で月100ドル＋シート課金がかかる一方、Hyperframes は個人開発から商用利用まで無料で踏み込める。ここに「AIで動画を量産する」想定のしやすさがあります。

ハンズオン①：Hyperframes Devで「他人のテンプレ」を再現する

ハンズオン1本目は、コミュニティサイト Hyperframes Dev にアップロードされている既存テンプレを、自分のローカルで再現する、というものでした。

手順は驚くほど短く、次の3ステップだけです。

Hyperframes Dev で気に入った動画テンプレのURLをコピー
Codex に「これを手元で再現できるようにしてほしい」と投げる
しばらく待ち、Hyperframes Studio で開く

ぱんちゃんさんは「Codexの上位モデルで13分かかった」と話していて、確かに待ち時間は長め。ただし、出来上がってしまえば、動画の長さ・配色・字幕・差し替えるアバターまで、自然言語で指示するだけで編集できる状態が手に入ります。

実演画面では、参加者から「ローカルで起動できました」という報告がチャットに流れ込み、**「他人が作った動画の構造をそっくり借りて、自分仕様に塗り替える」**という新しい体験が成立しているのが見えました。

ハンズオン②：画像→HTML→アバター連携で「ゼロから1本」

2本目は、テーマだけ決めて1本の動画を一から作る流れでした。ぱんちゃんさんが提案するワークフローは明確で、

画像を作る（GPT Image / Codex プラグイン経由）
HTML骨格を作る（Hyperframes プラグインで、字幕・帯・あしらいまで含めて）
アバターを差し込む（HeyGen でアバターIDとボイスID を取得して API 連携）
音声を当てる（HeyGen の声 or ElevenLabs を連携）
修正してスキル化し、量産する

という5段階。ポイントは、アバターと骨格を同時に作らないことでした。「同時にやると、わけわかんない感じになる」と本人が言う通り、まずHTMLの動画テンプレを作り切ってから、後でアバターを差し替える方が、AIエージェントが混乱しません。

アバター作成は HeyGen の Web 画面から行い、年齢・民族・服装・アングル・スタイル（リアリスティック等）を入力するだけ。ただしテキスト生成だと「東アジア」のくくりで意図と違う顔が出やすく、ぱんちゃんさんも当日「ちょっと微妙ですね」と苦笑い。精度を上げるなら、Nano Banana や GPT Image で先にアバター用の写真を作り、それを HeyGen にアップロードする方がコントロールしやすい、というのが本人のおすすめでした。

つまずきポイントと、最大の気づき「スキルを渡す」

ハンズオンが進む中で、ぱんちゃんさんが特に強調していたのが「API経由でHeyGenを使うときは、必ずスキルを渡すこと」でした。

スキルとは、HeyGen が用意している「APIで動画を生成するための作法集」のこと。これを渡さずに動画生成を投げると、

という、ちょっと不気味な結果になります。実際に当日も、スキルなしで生成した動画と、スキルありで生成した動画を並べて見せてくれて、後者は明らかに自然な発話・口元の動きになっていました。料金感は HeyGen API が5秒で約0.2ドル、最低5ドルからチャージできるので、個人で試すハードルも低い水準です。

もうひとつのつまずきは、Windows環境のプラグインまわり。「Codex / Claude Code のプラグインはまずMacから対応し、Windowsはそのあと」という壁があり、当日もWindowsユーザーからエラー報告が出ていました。「プラグイン経由がダメなら、AIエージェントに口頭で頼んで設定してもらう」――今のAIエージェント時代らしい逃げ道も用意されていました。

「顔出ししない発信」のこれから

このイベントを振り返ると、AIアバターというジャンルが、ここ半年で「触ってみる」から「業務に組み込む」へ急速にシフトしているのを感じます。

去年の今ごろは、アバター動画と言えば「不自然な口パク」と「合成感の強い声」が当たり前で、私自身も「業務に使うのはまだ早い」と参加者によく話していました。それが今回、Hyperframes が出てから1ヶ月強、HeyGen と ElevenLabs がハッカソンを共催し、APIスキルが整備されていく中で、「テキストから1本のYouTube動画を組み立てる」が現実的なワークフローとして成立しています。

「顔出しはしたくないけど、発信は続けたい」「忙しくて動画を毎回撮れない」――そんな本音を抱えている方には、Hyperframes Dev から1本テンプレを落としてくる、というところから始めるのが、いちばん近道だと思います。

来月もぱんちゃんさんとは別テーマでイベントをご一緒する予定です。よかったら、シンシアリーのコミュニティでお会いしましょう。

書籍のお知らせ

私が著者として執筆した『AIで作るプレゼン資料入門ガイド』（SBクリエイティブ）が好評発売中です。

ChatGPT・Claude・各種AIツールを使った資料作成のワークフローを、初心者の方でも再現できる手順で解説しています。今回のような「AIエージェントで動画を組み立てる」発想と地続きの内容ですので、AIで業務をスマートにしたい方は、ぜひお手にとってみてください。

Amazonで詳細を見
る

けいたろう

このポストについてのディスカッション

もっと続けますか？