「バーチカルAI」という言葉を最近よく見かけませんか。2026年、AIへの投資は汎用(ホリゾンタルAI)から業界特化(バーチカルAI)へ急速にシフトしています。ただしバーチカルAIの実装は、「全部ローカルにする」か「全部クラウドAPIで済ます」かの二択ではありません。本記事では、バーチカルAIを作る中で本サイトが扱う「ローカルAI」をどう位置づけるか——ローカルとクラウドを組み合わせて最適化する考え方を、当サイト自前のQLoRA実例も交えて整理します。

バーチカルAIとは?ホリゾンタルAIとの違い

バーチカルAI(Vertical AI)とは、医療・法務・製造・公共といった特定の業界・業務に特化して設計・学習されたAIのことです。対してChatGPTやGeminiのように幅広い話題に対応するAIはホリゾンタルAI(Horizontal AI)=汎用AIと呼ばれます。

ホリゾンタルAI(汎用)と バーチカルAI(業界特化)の違い

ホリゾンタルAI(汎用)

ChatGPT・Geminiなど幅広い汎用LLM

  • ・どんな話題にも「広く浅く」対応
  • ・学習データはWeb全般(一般知識)
  • ・提供形態は主にクラウドAPI
  • ・強み: 汎用性・すぐ使える手軽さ

バーチカルAI(業界特化)

特定の業界・業務に絞ったAI

  • ・特定業務を「狭く深く」高精度でこなす
  • ・学習データは業界固有のプロプライエタリデータ
  • ・提供形態はクラウドに限らずローカル/エッジも現実的
  • ・強み: 精度・ROI・規制対応のしやすさ

どちらが優れているかではなく、汎用的な下調べ・雑談はホリゾンタル、業務の中核(診断・審査・判定など)はバーチカル、という役割分担が実務的(経験則・要検証)。

「広く浅く」の汎用AIに対し、バーチカルAIは対象を絞る分、その業務では高い精度・ROIを狙えます。どちらが優れているという話ではなく、役割が違います。

2026年、バーチカルAIはなぜ急伸しているのか

海外のVC(ベンチャーキャピタル)投資は、汎用AIスタートアップから業界特化AIスタートアップへ急速にシフトしています。VC投資額に占めるバーチカルAIのシェアは2025年の1年で53%から60%へ上昇し、バーチカルAI導入企業は汎用LLMのみの導入企業に比べて平均ROIが2.3倍、導入6か月後も価値を出し続けている割合が71%(汎用のみは32%)と報告されています(The Recursive の分析・海外VC市場の集計・経験則・要検証)。

① 国内 生成AI市場全体(億円・IDC Japan予測)
  • 2024年1,016億円
  • 2028年(予測)8,028億円

2023〜2028年のCAGRは84.4%と予測。バーチカル/ホリゾンタルを問わない生成AI市場全体の数値(出典: IDC Japan・要検証)。

② VC投資額に占める「バーチカルAI」のシェア(%・海外データ)
  • 2025年 Q153%
  • 2025年 Q460%

1年で53%→60%に上昇し、ホリゾンタル(汎用)からバーチカル(業界特化)へ投資資金がシフトしている(主に米国VC市場の集計・経験則・要検証)。①とは別の指標・別の出典である点に注意。

国内でも生成AI市場全体が急拡大しており、IDC Japanの予測では2024年に1,016億円、2028年には8,028億円に達するとされています(2023〜2028年のCAGRはIDC発表で84.4%。2023年を起点とした5年間の値で、2024年の1,016億円から単純に4年で計算した値ではありません)。ただしこの数値はバーチカル/ホリゾンタルを問わない市場全体の予測である点に注意してください。その中で「特定の業界・業務にどれだけ刺さるか」を競う流れが強まっているのがバーチカルAIの実態です。

バーチカルAIの実装は「ローカル×クラウド」の組み合わせが基本

バーチカルAIを実装する時、「モデルをどこで動かすか」も重要な設計判断です。答えは全部ローカルでも全部クラウドAPIでもなく、タスクごとに使い分けるハイブリッド構成が現実的です。

タスクの仕分け(機密 × 反復 × 定型 で振り分ける)

ローカル優先(日常の約8割)

  • ・社外秘文書の要約・分類
  • ・コード補助(未公開コード)
  • ・議事録の文字起こし
  • ・定型の問い合わせ対応

クラウド併用(難所だけ)

  • ・最高難度の推論
  • ・最新の超長文コンテキスト
  • ・たまにしか使わない高度タスク

機密性・反復性・定型度が高いものからローカル化すると効果が大きい。経験則(要検証)。

このうち、ハイブリッド構成の中でローカル側の比重を上げる動機になりやすいのが、次のような業界・タスクです。

「データを外に出せない」業界ほど、ローカル/エッジ寄せの動機になりやすい
業界扱うデータ外に出しにくい理由ローカル/エッジでの対応例
医療診療記録・検査画像個人情報保護法・医療広告ガイドライン院内サーバーで完結する推論
法務契約書・訴訟資料秘匿特権・守秘義務事務所内のオンプレAI
金融取引記録・与信情報金融分野ガイドライン・機密保持契約オンプレ/プライベートクラウド
公共・防災位置情報・住民データ個人情報保護条例・安全保障上の配慮エッジ推論(本サイトの妖怪QLoRA例)
製造図面・製造ノウハウ営業秘密・技術流出防止工場内エッジ推論

業界ごとの一般的な傾向の整理であり、個別の法規制・社内規程は業界・組織で異なります。実際の適否は各業界の一次情報・専門家に確認してください(経験則・要検証)。

とはいえ「機微なデータ=すべてローカル」である必要もありません。個人情報を伏せ字化・要約してからクラウドへ渡す、一次判定はローカルで完結させ最終レポートの生成だけクラウドの高性能モデルに任せる、といった部分的な使い分けも現実的な選択肢です。バーチカルAIの設計とは、業界・タスクごとに「ローカルでやる部分」と「クラウドに任せる部分」の境界線を引く作業とも言えます。

ローカルのみでバーチカルAIをやる場合:妖怪QLoRAの実例

「クラウドに一切データを出したくない」など、ローカルのみでバーチカルAIを完結させたい場合の実例が、当サイトの妖怪QLoRAケーススタディです。防災という業界・業務に特化し、Qwen2.5-14BをQLoRAで14万件学習、構造化JSON生成99.97%(テスト14,200件)を達成し、学習済みモデルをGGUFでローカル配信しています(妖怪ハザードマップのケーススタディ)。

妖怪QLoRAケースの実績(自前実測)
14万件学習データ(QLoRA)
99.97%構造化JSON生成成功率
14,200件評価テスト件数

一度配置すれば推論時にクラウドへの通信は発生しませんが、現場でのオフライン運用そのものの実測・検証はまだ行っていません。学習データも公開の一般知識ではなく、自然災害伝承碑・自治体ハザードマップ・気象庁の警戒レベルなどを踏まえて設計した、防災という業界に固有のプロプライエタリなデータでした。

このケースは「クラウド依存ゼロ」を狙う場合の一つのやり方であり、バーチカルAIが必ずこの形を取るべきという話ではありません。業界固有のデータで、業界固有の振る舞いを固めることがバーチカルAIの本質で、ローカルかクラウドか・あるいはその組み合わせかは実装手段の選択に過ぎません。運営者自身、南極観測隊参加・内閣府QZSS実績・測量士補・QGIS公式プラグイン作者という測量・GISの実務知識を持っており、この記事・ケーススタディ自体が「特定分野を深く知る人間がAI実装まで行う」というバーチカルAIの体現でもあります。

バーチカルAIの作り方:まずRAG、必要ならファインチューニング

ローカル・クラウドどちらで動かす場合でも、いきなりファインチューニング(FT)に飛びつくのは遠回りです。プロンプト→RAG→FTの順に試すのが定石です(詳細は最適化の順序を参照)。

何を増やしたいかで選ぶ

知識を増やしたい

規程・マニュアル・過去事例など

→ RAG(検索拡張)

振る舞い・形式を揃えたい

判定の言い回し・出力スキーマ・トーンなど(RAGだけでは揃わない)

→ ファインチューニング(FT)

妖怪QLoRAの例も、リスクスコアや避難所情報という「知識」は外部(API・GeoJSON)に持たせ、FTは口調とJSONスキーマという「振る舞い」だけに使っています。

ハイブリッド構成でローカル側を担う機材

ハイブリッド構成の中でローカル側を担う機材の目安です。小さめのバーチカルAI(3B〜8B程度の分類・要約系)なら、Raspberry PiやMac miniでも実用になります。10B超のモデルでFTまで行う、あるいは複数モデルを常時運用するなら、VRAMに余裕のある自宅GPUが現実的です。

生成速度 tok/s(Qwen3.5 4B・Q4_K_M・自前実測)
  • RTX A6000 48GB124
  • Mac mini M4 16GB29.3
  • Jetson Orin Nano 8GB12.6
  • Raspberry Pi 5 8GB2.2

実用ライン 10 tok/s(黙読に追いつく目安)

「動く」と「快適」は別物。Pi5は4Bだと実用ラインを下回り、2Bモデルなら改善する。

よくある質問

バーチカルAIとは何ですか?
特定の業界・業務(医療・法務・製造・防災など)に特化して設計・学習されたAIのことです。ChatGPTのような幅広い話題に対応する汎用AI(ホリゾンタルAI)と対比される概念で、対象を絞る分、その業務では汎用AIより高い精度を狙えます。
なぜ2026年、バーチカルAIが注目されているのですか?
VC投資の資金配分が汎用(ホリゾンタル)から業界特化(バーチカル)へ急速にシフトしているためです。海外VC市場ではバーチカルAIへの投資シェアが2025年の1年で53%から60%に上昇したと報告されています(経験則・要検証)。国内の生成AI市場全体も2024年の1,016億円から2028年に8,028億円へ拡大予測(出典: IDC Japan)で、追い風の中にあります。
バーチカルAIは全部ローカルにすべきですか?
いいえ。実際は業務ごとにローカルとクラウドを使い分けるハイブリッドが基本です。医療の診療記録、法務の訴訟資料、公共の住民データなど「データを外部に出しにくい」業務はローカル/エッジの比重を上げる動機になりますが、それ以外の定型作業や最高難度の推論はクラウドを併用する方が現実的なことも多いです。クラウド依存ゼロを狙う場合は全部ローカルという選択肢もあります。
バーチカルAIは自分(自社)でも作れますか?
作れます。まずプロンプト→RAGで足りるか試し、業界固有の「振る舞い・形式」を揃えたい時だけファインチューニング(FT)を足すのが定石です。当サイトでは実際にQLoRAで14万件学習し、構造化JSON生成99.97%を達成した自前の実例(妖怪ハザードマップ)を公開しています。
ホリゾンタルAI(ChatGPT等)を使ってはいけないのですか?
そんなことはありません。幅広い話題の下調べや雑談、汎用的な要約などはホリゾンタルAIが手軽で十分です。業務の中核(診断・審査・判定など)でデータの機微性や精度が問われる場面にバーチカルAIを充てる、という役割分担が実務的です。
バーチカルAIの導入にはどんな機材が必要ですか?
モデルの大きさ次第です。数Bクラスの軽量モデルならRaspberry PiやMac miniでも実用になりますが、10B超のファインチューニングや高精度な推論には自宅GPU(VRAM 24GB〜)が現実的です。手元の機材で動くかは「動くか診断」、GPU選びは「自宅GPUでローカルAI」を参照してください。

まとめ

  • バーチカルAI=業界特化AI。何でも屋のホリゾンタルAIと役割が異なり、対象業界の精度・ROIで優位に立ちやすい。
  • 2026年はVC投資が急速にバーチカルAIへシフト(海外データでシェア53→60%・要検証)。国内の生成AI市場全体も拡大基調(IDC Japan予測)。
  • バーチカルAIの実装は全部ローカルでも全部クラウドでもなく、タスクごとのハイブリッドが基本。データを外に出しにくい業務ほどローカル比重を上げる動機になる。
  • クラウド依存ゼロを狙う場合の実例が妖怪QLoRAケーススタディ。これは選択肢の一つであり、必須の形ではありません。
  • 作り方はプロンプト→RAG→FTの順、ローカル側の機材はGPU選び動くか診断から。

精度等について(まだ検証余地があるもの)

  • 「VC投資シェア53→60%」「ROI2.3倍」「継続率71% vs 32%」は海外VC市場を対象とした民間メディアの集計であり、国内市場やバーチカルAI全般に一般化できるとは限りません。
  • IDC Japanの市場予測(1,016億円→8,028億円)はバーチカル/ホリゾンタルを問わない国内生成AI市場全体の数値で、「バーチカルAI市場」単独の規模を示すものではありません。
  • 業界別の「データを外に出しにくい理由」は一般的傾向の整理であり、個別の法規制・契約・社内規程は業界・組織ごとに確認が必要です。「ローカル比重を上げる動機になる」という表現も経験則(要検証)です。
  • 妖怪QLoRAの事例は防災という単一ドメイン・単一プロジェクトの実測であり、医療・法務・金融など他業界のバーチカルAIにそのまま一般化できるとは限りません(元記事にも同様の限界注記があります)。