岡大徳のメルマガ
岡大徳のポッドキャスト
さくらの生成AIプラットフォーム×miibo×cotomi|日本語特化型LLMで実現する高精度RAG構築の実践ガイド
0:00
-6:51

さくらの生成AIプラットフォーム×miibo×cotomi|日本語特化型LLMで実現する高精度RAG構築の実践ガイド

亀田治伸氏が解説する、完全閉域網での日本語対話システム構築の最新手法とその実装方法

亀田治伸氏が、日本語特化型LLMであるNEC製cotomiとノーコード会話型AI構築プラットフォームmiiboを組み合わせた実践的なRAG構築方法を「さくらのナレッジ」で公開しました。この技術記事では、さくらの生成AIプラットフォームを活用して、さくらのクラウドマニュアルを対話的に検索できるシステムの構築プロセスが詳細に解説されています。

本記事の最大の特徴は、プログラミング知識なしで高度な対話システムを構築できる点にあります。cotomiの日本語処理能力の高さと、miiboの直感的な操作性を組み合わせることで、企業の技術文書やマニュアルを効率的に検索・活用できる仕組みを実現しています。さらに、完全閉域網での運用が可能なため、機密性の高い情報を扱う企業にとって理想的なソリューションとなっています。

さくらの生成AIプラットフォームがもたらす革新

さくらの生成AIプラットフォームは、アプリケーション開発からホスティング、モデル学習まで、生成AI活用に必要な機能を包括的に提供するサービスです。従量課金モデルによる初期投資の削減と、通信料金の無償化により、トークン消費の予測に集中できる環境を実現しています。

この環境において、NECが開発したcotomiは日本語に特化した大規模言語モデル(LLM)として機能します。日本語の文脈理解や専門用語処理において高い正確性を誇り、完全閉域網での独立運用が可能な点が大きな特徴です。企業の業務効率化や自動化を支援する上で、情報の独立性が求められる領域での活用が期待されています。

miiboとcotomiの連携による実装プロセス

記事では、実際の構築手順が詳細に解説されています。まず、miiboのアカウント開設から始まり、cotomiをLLMモデルとして選択する手順が示されています。現時点では、cotomiの利用にはさくらインターネットへの連絡が必要ですが、有効化後はmiiboの管理画面から簡単に選択できるようになります。

エージェント作成においては、システムプロンプトの設定が重要なポイントとなります。miiboでは専門知識なしでも直感的に設定できるインターフェースが用意されており、対話システムの人格や挙動を容易にカスタマイズできます。作成後はすぐにテストが可能で、実際の動作を確認しながら調整を進められます。

RAG構築の核心:ナレッジデータストアの活用

RAG(Retrieval-Augmented Generation)の実装において、miiboのナレッジデータストア機能が中心的な役割を果たします。外部ドキュメントを検索し、その結果を踏まえて回答を生成するこの技術により、特定ドメインの知識を持った対話システムを迅速に構築できます。

記事では、さくらのクラウドマニュアルを例に、URLを指定してクローラーがHTMLを自動収集する過程が説明されています。クローラーは階層をたどってリンク先を探索し、HTMLを発見して学習します。無償版では10ページまでという制限がありますが、基本的な動作検証には十分な容量です。収集されたHTMLは1000文字単位のチャンクに分割され、ベクトル化されてデータストアに保存されます。

HTMLからの情報抽出における技術的優位性

生成AIにとってHTMLの解釈は大きな課題となります。人間が見る整形されたWebページと、実際のHTMLコードには大きな差があり、タグやスクリプトなどのノイズが含まれています。通常はHTMLをmarkdown形式に変換する外部ツールが必要ですが、miiboはこの処理を自動化しています。

この自動化により、開発者は外部ツールの管理や追加課金を気にすることなく、純粋な対話システムの構築に集中できます。HTMLの構造を適切に解析し、意味のある情報のみを抽出してベクトル化する処理が、miiboのプラットフォーム内で完結する点が大きな利点となっています。

実践的な活用シナリオと今後の展望

亀田氏の記事は、単なる技術解説にとどまらず、実際のビジネスシーンでの活用を見据えた内容となっています。企業の技術文書やマニュアルを対話的に検索できるシステムは、業務効率化に直結する実用的なソリューションです。完全閉域網での運用が可能なため、機密情報を扱う企業でも安心して導入できます。

さくらの生成AIプラットフォームは「AIの力をすべての人に届ける」というコンセプトのもと、今後も連携可能なモデルやアプリケーションを拡充していく予定です。記事の最後では、個別相談の申し込みも受け付けており、実際の導入を検討する企業へのサポート体制も整っています。詳細な実装手順や技術的な背景については、ぜひ元記事をご覧ください。

記事の詳細はこちら:さくらの生成AIプラットフォームを活用したRAG構築 : NEC製 LLMモデル cotomi によるさくらのクラウドマニュアルを解説するチャットボット(https://knowledge.sakura.ad.jp/45017/)

Discussion about this episode

User's avatar