Granite Embedding Multilingual R2は無料で始められますか？

はい、モデル本体はApache 2.0ライセンスで完全無料です。Hugging Faceからダウンロードしてローカル環境で実行する場合、追加費用は発生しません。Hugging Faceの有料ホスティングサービスを利用する場合のみ、別途料金が発生します。

解約は簡単ですか？

モデル本体はオープンソースのため解約という概念はありません。Hugging FaceのPro/Teamプランを契約した場合、公式ページによると解約はいつでも可能と記載されています。Stripe等の安全な決済システムを採用しているため、契約管理も透明性が確保されています。

日本語で使えますか？

公式ブログによると、Granite Embedding R2は200以上の言語に対応し、52言語で強化サポートが提供されています。日本語はこの強化サポート対象に含まれており、実用レベルの精度で日本語検索を実行できます。ただしモデルカード等のUIは英語表記です。

OpenAIのEmbedding APIと何が違いますか？

最大の違いは「オープンソースか否か」「オンプレ運用が可能か否か」の2点です。Granite R2はApache 2.0ライセンスで商用利用・改変が自由で、自社サーバーで完全閉域運用が可能です。一方OpenAIはAPI経由のみで、データを外部送信する必要があります。エンタープライズ用途ではこの差が大きな選定基準になります。

97Mモデルと311Mモデル、どちらを選ぶべきですか？

コスト・速度を重視するなら97M、精度を最優先するなら311Mを推奨します。公式ベンチマークでは、97MがMTEB Multilingual Retrievalで60.3点、311Mが65.2点を記録しています。CPU推論で運用する場合や、エッジデバイスでの利用なら97Mが現実的です。GPU環境＋高精度が必要なら311Mを検討してください。

LangChainやLlamaIndexで使えますか？

はい、公式ブログによるとLangChain、LlamaIndex、Haystack、Milvusとドロップイン置き換え可能と明記されています。モデル名を1行変更するだけで既存のEnglish-onlyパイプラインを多言語対応化できます。APIの変更や新規依存関係の追加は不要です。

32Kトークンの長文脈は本当に実用的ですか？

ModernBERTアーキテクチャとRotary Position Embeddings（RoPE）の採用により、長文脈でも精度劣化が起きにくい設計となっています。実際に長文RAGで検証した範囲では、チャンク分割を粗くしても文脈保持が良好で、検索品質が安定していました。

商用利用に制限はありますか？

Apache 2.0ライセンスで提供されているため、商用利用・改変・再配布が自由です。公式ブログによると、IBMはMS-MARCO訓練データや非商用ライセンス制限のあるデータセットを意図的に避け、エンタープライズ展開を想定したデータガバナンス処理を実施しているとのことです。

Granite Embedding R2を試した正直レビュー【32K対応・Apache2.0】

2026年6月7日2026年6月11日

クイックサマリー：結局OpenAI Embeddingと比べて買いなの？

結論からお伝えします。Granite Embedding Multilingual R2が優れている人：商用利用可能なオープンソース埋め込みモデルを社内環境（オンプレ・閉域網）で動かしたい方、APIコスト削減を狙いたい方、32Kトークンの長文脈RAGを構築したい開発者の方です。一方で、APIで完結させたい・運用工数をかけたくない方には、OpenAIのtext-embedding-3シリーズの方が手軽と考えられます。実際に試した結果、技術力のあるチームならGranite R2は十分に「自社運用する価値あり」と感じました。

導入：多言語RAG構築で「精度」と「コスト」の板挟みになっていませんか？

「日本語を含む多言語のRAGを社内構築したいけれど、OpenAIのAPI料金が想定よりも膨らんでしまう」「ChromaDBやMilvusで動く軽量な日本語対応埋め込みモデルが見つからない」――そんな課題を抱えていませんか？

この課題を放置すると、API利用料が月数十万円規模に膨らんだり、データ主権の観点から本番投入できなかったりという事態に陥りやすくなります。特にエンタープライズ環境では、社外APIに業務データを送信できないという制約から、PoCで止まってしまうケースも少なくありません。

そこで2026年5月14日に公開されたのが、IBMによるGranite Embedding Multilingual R2です。Apache 2.0ライセンスで商用利用可能、200以上の言語に対応し、32Kトークンの長文脈を扱えるオープンソース埋め込みモデルです。サイズと精度のバランスが非常に優れており、自前運用の現実解になり得ると感じました。

この記事でわかること

Granite Embedding Multilingual R2の主要機能と他モデルとの違い
日本語環境での実際の挙動・利用可能性
料金体系（モデル自体は無料、Hugging Faceホスティング費用の目安）
OpenAI Embeddingやmultilingual-e5との比較ポイント

▶ Granite Embedding R2でApache 2.0の多言語埋め込みを今すぐ試す（無料・クレジットカード不要）

Granite Embedding Multilingual R2の概要：IBMが手掛ける商用利用OKの多言語モデル

Granite Embedding Multilingual R2は、IBMのGraniteチームが2026年5月にHugging Face上で公開した、エンタープライズ向けの多言語埋め込みモデルファミリーです。公式ブログによると、今回のリリースでは以下の2つのモデルが提供されています。

granite-embedding-311m-multilingual-r2：3億1,100万パラメータのフルサイズモデル。768次元の埋め込みを生成し、Matryoshka表現学習に対応
granite-embedding-97m-multilingual-r2：9,700万パラメータのコンパクトモデル。384次元の埋め込みを生成

実際に触ってみてわかったのは、「200以上の言語サポート」「52言語での強化サポート」「9つのプログラミング言語のコード検索対応」という三本柱で構成されている点です。公式ブログでは「ModernBERTアーキテクチャをベースに、R1世代から64倍の文脈長拡張（512→32,768トークン）を実現した」と説明されています。

個人的に好印象だったのは、Apache 2.0ライセンスでの提供です。商用利用・改変・再配布が自由で、ライセンス的な懸念なく社内導入を検討できます。OpenAIのEmbeddingではAPIロックインが避けられない一方、Granite R2はモデルウェイトをそのままダウンロードしてオンプレや閉域網で動かせる点が、エンタープライズ用途では大きな差別化要因と感じました。

主要機能の詳細：ModernBERT基盤と32K長文脈対応

Granite Embedding Multilingual R2の主要機能を、公式ブログの情報を基に整理します。

1. ModernBERTアーキテクチャによる長文脈対応

R1世代がXLM-RoBERTaベース（512トークン文脈）だったのに対し、R2はModernBERTで再設計されています。公式ブログによると、ModernBERTは「交互アテンション長による長系列処理の効率化」「Rotary Position Embeddings（RoPE）による32Kトークン対応」「Flash Attention 2.0サポート」という特徴を持ちます。長文RAGでチャンク分割を粗くできるため、文書全体の文脈を保持しやすい印象を受けました。

2. サブ100Mクラス最強のリトリーバル精度

公式ベンチマークでは、97MモデルがMTEB Multilingual Retrievalで60.3点を記録。同クラス（100M未満）の競合であるmultilingual-e5-smallの50.9点に対して、+9.4ポイントの差をつけています。311Mモデルは65.2点で、500M未満のオープンモデル中2位（公式発表時点）とのことです。

3. Matryoshka表現学習（311Mモデルのみ）

311Mモデルは、768次元の埋め込みを512、384、256、128次元に切り詰めて使用できるMatryoshka対応です。ベクトルDBのストレージコストを大幅に削減できる一方、精度劣化は最小限という結果でした。大規模インデックスのコスト最適化に直結する機能と言えます。

4. コード検索対応（9言語）

テキストだけでなく、9つのプログラミング言語のコード検索にも対応しています。社内のコードベース検索やドキュメント＋コード横断RAGに使えるため、開発者向けツールとしての応用範囲が広いと感じました。

5. ONNX/OpenVINO対応によるCPU推論

両モデルともONNXとOpenVINOの重みが同梱されており、GPUなしのCPU環境でも実用的な速度で動作します。検証したところ、軽量な97MモデルならノートPCのCPUでも十分実用範囲でした。

日本語ユーザー向け評価：実際の挙動と注意点

日本のビジネスユーザーが気になる4つのポイントを、実際に検証して確認しました。

日本語対応：強化サポート対象の52言語に日本語が含まれていることを公式ブログで確認しました。日本語クエリ→日本語文書のリトリーバル精度は十分実用レベルでした。ただしモデルカードのUI自体は英語表記です
日本円決済：モデル自体はApache 2.0で完全無料のため決済不要です。Hugging FaceのProプラン（月額9米ドル＝約1,350円、1ドル150円換算）を契約する場合はクレジットカード払い・為替リスクあり
日本語サポート：IBM公式やHugging Faceのサポートは英語が中心です。日本語での問い合わせは公式サイトで要確認
日本語出力品質：埋め込みモデルのため「出力テキスト」は生成しません。日本語の意味的類似度検索の品質を検証した範囲では、翻訳調の違和感はなく自然に機能しました

個人的な感想として、日本語の検索精度は実用レベルですが、英語と完全に同等とは言えない印象です。社内文書のRAG構築で「日本語クエリで日本語文書を検索」する用途であれば十分に機能すると考えられます。一方で、専門用語が極端に多い分野（法律・医療など）では、検索結果を人間が確認する運用フローを併用することをおすすめします。

料金プラン：モデルは無料、Hugging Face利用は段階制

Granite Embedding Multilingual R2自体はApache 2.0で完全無料です。一方、Hugging Face上でホスティング・推論を利用する場合は、以下の料金が発生します（公式料金ページに基づく、1ドル150円換算）。

プラン	月額料金	主な特徴
Free（モデルDL）	0円	モデル本体のダウンロード・ローカル実行は完全無料
HF Pro	9ドル/月（約1,350円）	個人向け。高度な機能・優先サポート
HF Team	20ドル/ユーザー/月（約3,000円）	チーム向け。組織管理機能あり
Inference Endpoints	0.033ドル/時〜（約5円〜）	専用推論エンドポイント。CPU/GPUインスタンス選択可
Spaces GPU	0.40ドル/時〜（約60円〜）	Nvidia T4等のGPU時間課金

公式ページによると、決済はStripe等の安全な決済システムを採用しており、解約はいつでも可能と記載されています。日本人にありがちな「契約したら抜けられないのでは」という心配は不要です。

個人的な判断としては、まずモデル本体を無料で試して、本番運用時にInference EndpointsかセルフホストかをROIで判断するのが現実的だと感じました。

▶ Granite Embedding R2を無料でダウンロードして検証する（無料・クレジットカード不要）

競合との比較：OpenAI Embedding・multilingual-e5との対決

主要な競合モデルとの比較を整理します。

モデル	主な機能	価格帯	日本語対応	特徴
Granite Embedding R2	多言語＋コード・32K文脈・Matryoshka対応	無料（Apache 2.0）	○（52言語強化）	商用利用可・オンプレ運用可
OpenAI text-embedding-3-large	高精度多言語・3,072次元	0.13ドル/100万トークン	○	API完結・運用工数低
multilingual-e5-large	多言語埋め込み・512トークン文脈	無料（MIT）	○	Granite R1世代の主要競合

使ってみて感じた選び方の基準は以下の通りです。

API完結で運用工数を最小化したい→OpenAI text-embedding-3-largeが最適
オンプレ・閉域網で動かしたい／長文脈が必要→Granite R2の独壇場
R1世代から移行検討中→multilingual-e5よりGranite R2の方が精度面で優位（MTEBで+9.4ポイント差）

こんな人におすすめ／こんな人には向かない

こんな人におすすめ

商用利用可能なオープンソース埋め込みモデルを探している企業の開発者の方
社内データを外部APIに送れないエンタープライズ用途の方（金融・医療・公共系）
32Kトークンの長文RAGを構築したいエンジニアの方
OpenAI Embeddingの月額コストが想定を上回っており、削減策を検討中の方

こんな人には向かない

運用工数をかけたくない方→OpenAI Embedding APIまたはCohere Embed APIをおすすめします
埋め込みモデルの仕組みに馴染みがない方→まずはChatGPT等のRAG機能で十分かもしれません
専門業界の固有名詞検索が中心の方→Granite R2＋追加ファインチューニングが必要。即時導入は困難

正直に申し上げると、「すぐに動く便利ツールが欲しい方」には不向きです。一定の技術力と運用体制が前提条件になります。

総合評価：★★★★☆（4.3／5.0）

「サブ100Mクラスでは現時点の最強候補。Apache 2.0と32K対応がエンタープライズ向け要件にハマる」というのが実際に試した上での評価です。OpenAI Embeddingと比べて運用工数は増えますが、コスト削減効果と商用利用ライセンスの安心感は唯一無二と感じました。

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

この記事を書いた人

abyssnexy

Granite Embedding R2を試した正直レビュー【32K対応・Apache2.0】

クイックサマリー：結局OpenAI Embeddingと比べて買いなの？

導入：多言語RAG構築で「精度」と「コスト」の板挟みになっていませんか？

Granite Embedding Multilingual R2の概要：IBMが手掛ける商用利用OKの多言語モデル