「顔出しなしYouTube」はAIエージェントで作る時代になった
「動画を毎回撮るのは大変だけど、YouTubeで発信は続けたい」。AIで仕事をしている人ほど、この板挟みに頻繁にぶつかります。2026年5月16日(土)の夜、その答えのひとつを見せてくれたのが、フリーランスのぱんちゃんさん(@panchaaan_2)をゲストに迎えたウェビナー「Codex × ElevenLabs × HeyGenでアバターYouTube動画を自動化!」でした。
私(けいたろう)はモデレーター席からの参加でしたが、終わったときの率直な感想は、「顔出しなしYouTube」というジャンルが、もうAIエージェントで組み立てるフェーズに入った、というものでした。本記事ではその90分の中身を、参加者アンケートと一緒に振り返ります。
当日の流れと、登場した4つのツール
ハンズオン中心のセミナーで、ぱんちゃんさんが組み合わせたのは次の4つでした。
Codex:OpenAI のAIエージェント。今回は司令塔として、画像生成・HTML編集・API連携をすべて担当。
HeyGen:AIアバター生成サービス。テキスト・写真・録画からアバターを作成でき、声と組み合わせて動画化までこなす。
ElevenLabs:音声AI。V3モデルなら日本語の精度が高く、デジタル透かしや権利配慮も評価されている。
Hyperframes:HeyGen社が2026年4月中旬にローンチしたばかりの動画フレームワーク。HTMLベースで、オープンソース・商用利用無料。
ぱんちゃんさんが強調していたのは、「動画編集の世界では Remotion が先行しているが、Hyperframes は HTML ベースでAI学習データが多く、しかも完全無料」という点。Remotion は4人以上の利用で月100ドル+シート課金がかかる一方、Hyperframes は個人開発から商用利用まで無料で踏み込める。ここに「AIで動画を量産する」想定のしやすさがあります。
ハンズオン①:Hyperframes Devで「他人のテンプレ」を再現する
ハンズオン1本目は、コミュニティサイト Hyperframes Dev にアップロードされている既存テンプレを、自分のローカルで再現する、というものでした。
手順は驚くほど短く、次の3ステップだけです。
Hyperframes Dev で気に入った動画テンプレのURLをコピー
Codex に「これを手元で再現できるようにしてほしい」と投げる
しばらく待ち、Hyperframes Studio で開く
ぱんちゃんさんは「Codexの上位モデルで13分かかった」と話していて、確かに待ち時間は長め。ただし、出来上がってしまえば、動画の長さ・配色・字幕・差し替えるアバターまで、自然言語で指示するだけで編集できる状態が手に入ります。
実演画面では、参加者から「ローカルで起動できました」という報告がチャットに流れ込み、**「他人が作った動画の構造をそっくり借りて、自分仕様に塗り替える」**という新しい体験が成立しているのが見えました。
ハンズオン②:画像→HTML→アバター連携で「ゼロから1本」
2本目は、テーマだけ決めて1本の動画を一から作る流れでした。ぱんちゃんさんが提案するワークフローは明確で、
画像を作る(GPT Image / Codex プラグイン経由)
HTML骨格を作る(Hyperframes プラグインで、字幕・帯・あしらいまで含めて)
アバターを差し込む(HeyGen でアバターIDとボイスID を取得して API 連携)
音声を当てる(HeyGen の声 or ElevenLabs を連携)
修正してスキル化し、量産する
という5段階。ポイントは、アバターと骨格を同時に作らないことでした。「同時にやると、わけわかんない感じになる」と本人が言う通り、まずHTMLの動画テンプレを作り切ってから、後でアバターを差し替える方が、AIエージェントが混乱しません。
アバター作成は HeyGen の Web 画面から行い、年齢・民族・服装・アングル・スタイル(リアリスティック等)を入力するだけ。ただしテキスト生成だと「東アジア」のくくりで意図と違う顔が出やすく、ぱんちゃんさんも当日「ちょっと微妙ですね」と苦笑い。精度を上げるなら、Nano Banana や GPT Image で先にアバター用の写真を作り、それを HeyGen にアップロードする方がコントロールしやすい、というのが本人のおすすめでした。
つまずきポイントと、最大の気づき「スキルを渡す」
ハンズオンが進む中で、ぱんちゃんさんが特に強調していたのが「API経由でHeyGenを使うときは、必ずスキルを渡すこと」でした。
スキルとは、HeyGen が用意している「APIで動画を生成するための作法集」のこと。これを渡さずに動画生成を投げると、
という、ちょっと不気味な結果になります。実際に当日も、スキルなしで生成した動画と、スキルありで生成した動画を並べて見せてくれて、後者は明らかに自然な発話・口元の動きになっていました。料金感は HeyGen API が5秒で約0.2ドル、最低5ドルからチャージできるので、個人で試すハードルも低い水準です。
もうひとつのつまずきは、Windows環境のプラグインまわり。「Codex / Claude Code のプラグインはまずMacから対応し、Windowsはそのあと」という壁があり、当日もWindowsユーザーからエラー報告が出ていました。「プラグイン経由がダメなら、AIエージェントに口頭で頼んで設定してもらう」――今のAIエージェント時代らしい逃げ道も用意されていました。
「顔出ししない発信」のこれから
このイベントを振り返ると、AIアバターというジャンルが、ここ半年で「触ってみる」から「業務に組み込む」へ急速にシフトしているのを感じます。
去年の今ごろは、アバター動画と言えば「不自然な口パク」と「合成感の強い声」が当たり前で、私自身も「業務に使うのはまだ早い」と参加者によく話していました。それが今回、Hyperframes が出てから1ヶ月強、HeyGen と ElevenLabs がハッカソンを共催し、APIスキルが整備されていく中で、「テキストから1本のYouTube動画を組み立てる」が現実的なワークフローとして成立しています。
「顔出しはしたくないけど、発信は続けたい」「忙しくて動画を毎回撮れない」――そんな本音を抱えている方には、Hyperframes Dev から1本テンプレを落としてくる、というところから始めるのが、いちばん近道だと思います。
来月もぱんちゃんさんとは別テーマでイベントをご一緒する予定です。よかったら、シンシアリーのコミュニティでお会いしましょう。
書籍のお知らせ
私が著者として執筆した『AIで作るプレゼン資料入門ガイド』(SBクリエイティブ)が好評発売中です。
ChatGPT・Claude・各種AIツールを使った資料作成のワークフローを、初心者の方でも再現できる手順で解説しています。今回のような「AIエージェントで動画を組み立てる」発想と地続きの内容ですので、AIで業務をスマートにしたい方は、ぜひお手にとってみてください。

