# ChatGPT vs Gemini 出力比較レポート

**対象タスク**: 日本クラフトブルワリーTOP30 Tier表作成（同一プロンプト、5フェーズ実行プロトコル）
**比較対象ファイル**:
- ChatGPT: `deep-research-report.md`
- Gemini: `日本クラフトブルワリーTier表作成タスク.docx`
**作成日**: 2026-05-08

---

## エグゼクティブサマリ（30秒で読む）

| 観点 | ChatGPT | Gemini |
| --- | --- | --- |
| **完了度** | Phase 1–2 で停止（中間成果物） | Phase 1–5 完走（最終Tier表＋自己批評） |
| **プロンプト末尾の制約解釈** | 「ユーザー確認を待つ」を厳守 | 同じ制約を読んだ上で連続実行 |
| **ロングリスト総数** | 80社（A–E 各16社均等） | 80社（A–E 配分は不均等） |
| **Phase 2 母集団** | 50社（Hard 9 / Soft 21 を明示分離） | 40社（除外区分なし） |
| **主たる発見ソース** | 独立系メディア中心（ALB / Beer Cruise / Japan Beer Times） | コンペ＆レーティング偏重（Untappd / WBC公式 / JGBA PDF / BeerAdvocate） |
| **アンチハルシネーション順守** | 厳格（"不明"/"N/A" 多用、推定値挿入なし） | 緩い（Untappdスコアに具体値を断定的に記述） |
| **語り口** | 慎重・分析的・限界自認 | 断定的・物語的・市場アナリスト風 |
| **最終Tier分布（30社）** | 出力なし | S=13 / A=9 / B=7 / C=1 / D=0（上位偏重） |
| **本文文字量（概算）** | 約2万字 | 約3.5万字 + 巻末引用文献70件 |

> **一行結論**: ChatGPT は「プロトコル順守＆ハルシネーション回避」を最優先し**前半で慎重に止まる**。Gemini は「成果物完成」を最優先し**最後まで走り切るが、推定値の混入・上位偏重バイアスを抱える**。

---

## 1. 最大の違い: プロトコル解釈

プロンプト末尾の `<execution_constraints>` に以下があった：

> 出力が長大になる場合、Phase 1〜2を先に提示し、ユーザー確認を待ってからPhase 3〜5に進むこと。

| | ChatGPT | Gemini |
| --- | --- | --- |
| 解釈 | "ユーザー確認待ち" を強制トリガーと解釈 | "長大な場合" の but-clause として解釈、自分で「長大ではない」と判断して継続 |
| 実装 | Phase 2 末尾で明示停止、`<uncertainty>` タグで未完了を宣言 | Phase 2 末で `<phase_log>` を出して即 Phase 3 へ |
| 実務上の影響 | 続行には再プロンプトが必要 | 1回で完結、ただし30社のスコアまで一気に提示される |

**示唆**: ChatGPT はプロトコル文言を**強い停止信号**と読み、Gemini は**条件付きアドバイス**と読む傾向。ユーザーが自走完了を求めるなら、停止条件の文言から「ユーザー確認待ち」を削るのが安全。

---

## 2. ロングリスト 80社の構成差

両者とも80社、A–E カテゴリ網羅という指示は守ったが、**何を「拡張枠」に入れたか**の判断が大きく異なる。

### 2.1 ChatGPT のみが含めたブルワリー（抜粋）

| ブルワリー | カテゴリ | ChatGPTの発見起点 |
| --- | --- | --- |
| Beppu Brewery（大分） | B | JBT-WBC2024 |
| Brasserie Knot（北海道） | B | ALB |
| Be Easy Brewing（青森） | B | ALB |
| HOPDOG BREWING（秋田） | B | ALB |
| Sanriku Brewing（岩手） | E | ALB |
| ISHINOMAKI HOP WORKS（宮城） | E | ALB |
| Outsider Brewing（山梨） | E | ALB |
| Kaigan Brewery（千葉） | E | JBT-Kaigan |
| 岸和田ビール（大阪） | E | JBT-Kishiwada |
| AMAKUSA SONAR BEER（熊本） | E | JBT-Hanshin2023 |

**特徴**: 地方・東北・新興（Hanshin2023記事ソース）に厚い。Japan Beer Times の特集記事を起点に**メディア露出の質**で拾っている。

### 2.2 Gemini のみが含めたブルワリー（抜粋）

| ブルワリー | カテゴリ | Geminiの発見起点 |
| --- | --- | --- |
| 軽井沢ブルワリー | A | 公式サイト |
| 網走ビール | A | mycraftbeers ブルワリーマップ |
| 銀河高原ビール | A（旧） | BeerAdvocate ※Phase2で除外 |
| 大雪地ビール | A | mycraftbeers |
| CRAFT BEER BASE（大阪） | B | JGBA2026 PDF |
| 寒菊銘醸（千葉） | B | World Beer Awards 2025 |
| TDM 1874 Brewery | B | JGBA2026 PDF |
| NORTH ISLAND BEER | B | Untappd |
| 秋田あくらビール | B | Untappd |
| Great Dane Brewing（宮城） | E | 公式 JGBA2026 金賞 |
| Streetlight / TRANS（北海道） | E | JGBA2026 PDF |
| Kamikatz（徳島） | E | 公式（JGBA2026 金賞） |

**特徴**: **直近のコンペ受賞PDF（JGBA2026・WBC2026・WBA2025）を逐一参照して拾っている**。技術評価ベース。

### 2.3 差分が示すバイアス

- **ChatGPT**: 「メディアで語られているか」中心 → 地域文脈・新興カルト寄り
- **Gemini**: 「最近メダルを取ったか」中心 → 受賞最適化型・大手老舗が浮上しやすい

---

## 3. Phase 2 スクリーニング: 母集団確定の差

| 項目 | ChatGPT | Gemini |
| --- | --- | --- |
| 母集団数 | **50社** | **40社** |
| 除外の段階分け | **Hard exclusion 9 / Soft cut 21** を明示 | 区分なし（一律「除外」） |
| 除外ロジックの言語化 | 「Soft cut は低品質認定ではなく、上位50候補からの一時棚上げ」と明記 | 「コンペ実績やUntappdソースが3件未満」と簡潔に記述 |
| カテゴリ内訳 | A=13, B=14, C=12, D=5, E=6 | A=7, B=9, C=10, D=6, E=8 |
| 注釈 | South Park Brewing を hard exclusion とした理由を `<uncertainty>` タグで明示 | 同社の除外を米国コロラド州の同名ブルワリーURLと突き合わせて根拠化 |

**読みどころ**: ChatGPT の「Hard / Soft 二段階」は**評価の頑健性検証に直接使える**設計。Gemini は単段除外なので、後段の Tier 判定がブラックボックスになりやすい。

---

## 4. South Park Brewing の扱い（同一の落とし穴に対する対処）

ユーザー指定 seed の `South Park Brewing (北海道)` は、両者とも実在確認に苦戦して除外したが、**根拠の作り方が真逆**。

| | ChatGPT | Gemini |
| --- | --- | --- |
| 結論 | Hard exclusion | 除外 |
| 根拠 | 「日本国内のブルワリーを一意特定できる高信頼ソース束を確保できず」(source insufficiency) | 「検索結果は米国コロラド州の同名事業者を指す」と**具体的にURL（コロラド州酒類ライセンスExcel）を提示**して反証 |
| アプローチ | 反ハルシネーションルール6を準用、不確実性を `<uncertainty>` で開示 | 反証ソースを能動的に提示し「実体不明」を実証 |

> **どちらも妥当**だが、Gemini の「混同元のソースを当てる」アプローチは検証可能性が高く、ChatGPT は「無いものを断定しない」を貫いている。

---

## 5. アンチハルシネーション規則の順守度

プロンプトには `priority="critical"` で 6つの反ハルシネーション規則があった。

| ルール | ChatGPT | Gemini |
| --- | --- | --- |
| ①ソースURL併記 | 全社にURL付与（独自 `citeturn` トークン） | 全社にURL付与（巻末文献リスト方式） |
| ②Untappd数値の N/A 明記 | 中間成果物のため未到達 | **「Untappd平均 3.808」「4.033」「3.826」など小数3桁の具体値を断定的に記載** ⚠️ |
| ③受賞4要素揃う場合のみ記載 | 中間成果物のため未到達 | 概ね順守（「WBC2024 Gold (Yuzu Weiss)」など銘柄まで明記） |
| ④不明な情報は「不明」 | 厳守（"未確保"・"確保できず" 多用） | 部分的順守 |
| ⑤矛盾時は `<uncertainty>` 明示 | 2回使用、South Park と Soft cut の根拠を開示 | 使用なし |
| ⑥拡張ブルワリー追加根拠URL | 全社にラベル付き発見ソース提示 | 全社にURL提示 |

**重要点**: Untappd の小数3桁スコアを Gemini が複数社に記載しているが、Untappd 公式に該当ブルワリーの平均値が小数3桁で公開されているとは限らない。**プロンプトの規則②「推定値・近似値の挿入は禁止。取得できなければ N/A」**に照らすと、Gemini は**この規則を最も破りやすい構造**になっている。

---

## 6. 最終Tier表（Gemini のみ）の偏り

Gemini が出した30社の Tier 分布:

```
S: 13社 (43%)   ← ボーダー85点
A:  9社 (30%)
B:  7社 (23%)
C:  1社 (3%)
D:  0社 (0%)
```

プロンプトの絶対閾値 `S: 85+` が機能していれば、母集団の上澄み30社でも **S=43%** は明らかに高い。Gemini 自身も Phase 5 (Q1) で「コンペ重視によるスタイル偏り」「Hazy IPA・スムージーサワー有利」を自認している。

ChatGPT は最終Tier表を出していないため、この偏りは発生していないが、**そもそも判定が存在しない**ので比較不能。

---

## 7. 自己批評（Phase 5）の有無

| Q | ChatGPT | Gemini |
| --- | --- | --- |
| Q1〜Q7 全7問 | **全て未着手** | **全て3文以上で回答** |
| 自己批評の質 | — | コンペ依存・Untappdバイアス・地域密着過小評価を率直に列挙 |
| 反証可能性の議論 | — | ボーダー事例（横浜ベイ、DevilCraft、COEDO）まで掘り下げ |
| 過小評価の認識 | — | ベアードブルーイングを「軸4で過小評価」と自認 |

> Gemini の Phase 5 は本タスクで**最も価値が高いセクション**。次回プロンプト改善時は、Gemini の自己批評Q1〜Q3に挙がっている「コンペ偏重・スタイル偏り・地域過小評価」を是正する重み調整が次のレバーになる。

---

## 8. 用途別の使い分け推奨

| こうしたいなら | 推奨 |
| --- | --- |
| **プロトコル順守・ハルシネーション最小化が最重要** | ChatGPT |
| **完成形のTier表をひとまず1ターンで取得したい** | Gemini |
| **検証可能なエビデンス束（URL集）を欲しい** | 両者引き分け（フォーマット差のみ） |
| **境界事例・反証可能性まで議論したい** | Gemini（Phase 5 がそのまま使える） |
| **新興・地方の発見** | ChatGPT（メディア起点） |
| **直近のコンペ実績で拾う** | Gemini（PDF直参照） |
| **本番運用（クライアント提出資料の下地）** | **両者を組み合わせる**: ロングリストはChatGPTの均等80社、Phase 3スコアリングはGeminiのコンペPDF引用、自己批評はGeminiのQ1–Q7、最終ハルシネーションチェックはChatGPTの規則⑤ |

---

## 9. このプロンプトに対する共通の弱点（両者で観測）

1. **Untappd レビュー件数の確認なし**: 規則「レビュー50件以上のもののみ採用」に対する件数確認の痕跡が両者とも薄い。
2. **国際大会受賞の銘柄欠落**: Gemini は概ね銘柄付きだが、ChatGPT は中間成果物で受賞リストに到達していない。
3. **「除外したが惜しい5社」**: Gemini のみ提示。ただし Yorocco / 寒菊 / Teenage / AMAKUSA SONAR / 南信州 で、ChatGPT が Soft cut した社（HOPDOG, Kaigan等）と一致しない → **両者の「惜しい」基準も違う**。

---

## 10. 補足: ファイルメタ情報

| 項目 | ChatGPT | Gemini |
| --- | --- | --- |
| ファイル形式 | `.md`（Markdown） | `.docx`（Word） |
| ファイルサイズ | 約 21 KB | 約 3.0 MB（画像なし、フォーマット情報込み） |
| 引用形式 | `citeturn{n}search{m}` 等の独自トークン | 数字注 + 巻末「引用文献」70件リスト |
| 表組み | Markdown table（軽量） | Word table（行ごとに分離されやすい） |
| `<phase_log>` タグ | 2回（Phase 1, 2 完了時） | 5回（各 Phase 完了時） |
