# SHIFT AI Instagram AX v1.1 スタッフ共有・環境構築マニュアル

## 1. この環境でできること

v1.1は、v1の企画・台本・画像・運用・分析機能に、Instagramリール動画の自動制作を追加した共有環境です。

- AIニュース・ベンチ投稿の収集
- 投稿企画、フック、CTAの設計
- リール台本、キャプション、DM資料の生成
- Codex GPT Images 2.0による縦型キーフレーム生成
- Higgsfield MCP / Seedance 2.0による動画カット生成
- 設定済みTTS APIによる日本語男性ナレーション（サンプル実装はOpenAI Speech API）
- 字幕、強調ワード、動画結合、書き出し
- 投稿前ブランドチェック
- d1 / d7実績分析と改善提案

## 2. 必要なアカウント・権限

| 項目 | 用途 | 必須 |
|---|---|---|
| Codex | スキル実行・画像生成・ファイル作業 | 必須 |
| Higgsfield | Seedance 2.0動画生成、Virality Predictor | 動画制作時必須 |
| TTS API | ナレーション音声生成。現サンプルはOpenAI Speech API | 音声制作時必須 |
| Cloudflare | 共有サイト更新 | 管理担当のみ |
| Google Sheets | 投稿・実績管理 | 運用担当必須 |
| Slack / Notion | 共有・承認・手順確認 | 運用担当必須 |

Higgsfield連携の詳細は、以下のNotion資料を参照してください。

https://vion-lab.notion.site/Codex-Higgsfield-379cb7400f5d805cb51ccdc25304f8ab?source=copy_link

## 3. インストール

配布ファイル：

`staff-codex-setup-package-v1-1.zip`

展開後、ターミナルで実行します。

```bash
cd /展開先/staff-codex-setup-package-v1-1
chmod +x install_shift_ai_instagram_ax_v1_1_skills.sh
./install_shift_ai_instagram_ax_v1_1_skills.sh
```

完了後、Codexを再起動します。

## 4. 必要ソフト

```bash
brew install ffmpeg
```

確認：

```bash
ffmpeg -version
```

## 5. TTS API設定（音声生成）

v1.1のサンプル動画では、暫定的にOpenAI Speech APIを使っています。ただし、これは固定仕様ではありません。TTSは品質進化が速いため、運用では「その時点で最も自然で、商用利用条件・コスト・安定性が合うモデル」へ都度切り替える前提で管理します。

### 5-1. 現サンプル実装

- サンプル実装：OpenAI Speech API
- 例：`gpt-4o-mini-tts` / `onyx`
- 注意：Codex / ChatGPTへのログインだけではAPIは実行できません。OpenAI PlatformのAPIキー、Billing、有効な利用枠が別途必要です。

OpenAIを使う場合：

- API Keys: https://platform.openai.com/api-keys
- Billing: https://platform.openai.com/settings/organization/billing/overview
- Usage: https://platform.openai.com/usage

macOS GUI版Codexへ渡す場合：

```bash
read -s OPENAI_API_KEY
launchctl setenv OPENAI_API_KEY "$OPENAI_API_KEY"
unset OPENAI_API_KEY
osascript -e 'quit app "Codex"'
open -a Codex
```

作業終了後にOSから削除する場合：

```bash
launchctl unsetenv OPENAI_API_KEY
```

### 5-2. 一般的なTTS API設定手順

OpenAI以外のTTSを使う場合も、基本手順は同じです。

1. **TTSプロバイダーを選定**する
   - 日本語の自然さ、男性声の親しみやすさ、発音制御、商用利用可否、料金、遅延、API安定性、データ保持条件を確認する。
2. **プロジェクトと課金を有効化**する
   - API利用は多くの場合、無料ログインとは別にBilling設定が必要。
3. **APIキーまたはサービスアカウントを発行**する
   - 例：`OPENAI_API_KEY`、`ELEVENLABS_API_KEY`、`GOOGLE_APPLICATION_CREDENTIALS`、`AZURE_SPEECH_KEY`など。実際の変数名は各社ドキュメントに合わせる。
4. **Codex実行環境へ環境変数として渡す**
   - APIキーをSlack、Notion、チャット、Git、共有zipへ直書きしない。
5. **モデル・声・速度・感情指定・出力形式を決める**
   - 例：モデルID、voice ID、話速、スタイル指示、WAV/MP3/AACなど。
6. **短文で疎通確認**する
   - 10〜15秒のテスト音声を生成し、認証、課金、発音、音量を確認する。
7. **制作スキルのTTSアダプターに反映**する
   - スクリプトやコマンドを差し替え、`scene_manifest.md`に使用モデル・声・設定を記録する。
8. **人間が音声QAを行う**
   - 「本人の発言に見える表現」「不自然な読み」「誇張感」「権利上の問題」がないか確認する。

### 5-3. TTSモデルの見直しルール

- 月1回または主要モデル更新時に、同じ15秒台本で2〜3モデルを比較する。
- 評価観点：日本語自然度、親しみやすさ、発音、聞き疲れ、Instagramでのテンポ、商用利用条件、コスト。
- より良いモデルへ切り替える場合は、日次運用資料、スキル設定、コスト管理シート、セキュリティチェックリストを同時に更新する。
- 木内翔大氏の声をクローンまたは模倣する場合は、明示的な許可と利用範囲の管理がない限り禁止。

キーをチャット、Slack、Notion、Gitへ貼らないでください。

## 6. Higgsfield MCP

CodexからHiggsfield MCPを利用できる状態にします。認証・接続手順はNotion資料を正とします。

https://vion-lab.notion.site/Codex-Higgsfield-379cb7400f5d805cb51ccdc25304f8ab?source=copy_link

接続後に確認する機能：

- `models_explore`
- `media_upload` / `media_confirm`
- `generate_video`
- `job_display`
- `virality_predictor`

Seedance 2.0は1本あたり4〜15秒です。約60秒のリールは5〜8本のカットに分けます。

## 7. スキル一覧

v1の12スキルに、動画制作スキルと投稿文生成スキルを追加した14スキル構成です。

1. `news-content-sourcer-v1`
2. `bench-post-collector-v1`
3. `instagram-strategy-planner-v1`
4. `reel-script-writer-v1`
5. `story-script-writer-v1`
6. `feed-to-story-repurposer-v1`
7. `dm-content-generator-v1`
8. `instagram-image-generator-v1`
9. `instagram-brand-voice-checker-v1`
10. `notion-slack-ops-assistant-v1`
11. `instagram-performance-analyst-v1`
12. `ops-retrospective-updater-v1`
13. `instagram-reel-video-generator-v1-1`
14. `instagram-caption-writer-v1-1`

## 8. 動作確認

通常制作：

```text
$reel-script-writer-v1 を使って、AI業務効率化をテーマに60秒リール台本を作って
```

動画制作：

```text
$instagram-reel-video-generator-v1-1 を使って、
SHIFT AIのDESIGN.mdに従い、
約60秒・9:16・男性音声・字幕付きのInstagramリールを作って
```

## 9. 動画制作の標準成果物

```text
final_reel_9x16.mp4
cover_9x16.png
subtitles_ja.srt / subtitles.ass
narration_tts_male.wav
narration_script.md
scene_manifest.md
generation_prompts.md
qa_virality_report.md
```

## 10. 人間の承認が必要な項目

- 木内翔大氏本人の発言・顔・声・推薦表現
- ニュース、数値、提供地域、料金、製品仕様
- 競合比較
- CTA、ManyChatキーワード、LINE遷移先
- 著作権・音源・人物素材の利用権
- 最終公開


## 11. スキルの継続アップデート方針

v1.1のスキル群は、一度導入して固定するものではありません。運用者自身が、d1 / d7実績、月次レビュー、CTA成果、ManyChat反応、炎上・誤認リスク、デザイン改善に応じて更新します。

更新対象の例：

- 伸びた投稿文・冒頭フックの型
- 反応が良いCTA、ManyChatキーワード、DM資料導線
- ハッシュタグ、禁止表現、注記ルール
- 画像・動画・字幕・TTSの制作基準
- 投稿前チェックリスト
- KPIしきい値、d1 / d7レポート形式

原則として、v0は保全し、v1.1側のスキルと配布ZIPを更新します。運用ルールの変更は、該当スキル、資料、ハブサイト、配布パッケージを同時に更新してください。