miiboDesigner の岡大徳です。
会話型AIの品質を決める最大の要素は「正確な知識を持っているかどうか」です。いくら優れた言語モデルを使っても、専門知識がなければ的確な回答はできません。今回は、miiboでAIに専門知識を与える「ナレッジデータストア」機能の活用法を徹底解説します。データの追加方法から検索モードの選び方まで、AIの応答精度を向上させるテクニックをご紹介します。
ナレッジデータストアとは?会話型AIに専門知識を与える基盤
ナレッジデータストアは、AIに与える専門知識を保持するためのデータベースです。このデータベースに情報を入れることで、AIは質問に対して一般的な回答ではなく、あなたの会社や製品に特化した正確な回答ができるようになります。
ナレッジデータストアに情報を登録すると、RAG(Retrieval-augmented Generation)の仕組みが適用されます。RAGとは検索拡張生成と呼ばれる技術で、ユーザーの質問に関連する情報をデータベースから検索し、その情報を基にAIが回答を生成する仕組みです。
ナレッジデータストアが解決する3つの課題
最新情報の反映: 言語モデルの学習済みデータに含まれていない最新情報や社内情報を回答に含められます
専門知識の補強: 特定分野の深い専門知識をAIに与えることで、質の高い回答が可能になります
AIのハルシネーション軽減: 情報源がある回答のみを提供することで、AIが事実と異なる回答をするリスクを低減できます
miiboのナレッジデータストアの特徴
miiboのナレッジデータストアには以下の特徴があります:
情報登録の効率性: ドラッグ&ドロップでファイルをアップロード、URLの入力だけでもデータ追加が可能
多様なデータ形式対応: PDF、テキスト、Excel、URLなど様々な形式のデータを登録可能
自動ベクトル化: 登録した情報は自動的にベクトル化(Embedding)され、意味検索に最適化
検索結果の可視化: 登録したデータがどのように検索されるか簡単に確認可能
API連携: プログラムからデータを自動で追加・更新する仕組みも用意
これらの特徴により、効率的にAIの知識基盤を整備できます。
ナレッジデータストアの基本設定手順
ナレッジデータストアの設定は以下の手順で行います:
作成: 「会話の設定」→「ナレッジデータストア」から「ナレッジデータストアを作成する」をクリック
データ追加: 右下の「データを追加する」から情報を登録
検索設定: 「AIによる応答の設定」画面で検索モードや採用数を調整
検索精度を高める3つのテクニック
1. チャンク制御でデータの区切りを最適化
長い文章は自動的に約1,000文字ごとの「チャンク」に分割されます。この区切りを最適化するために、[CHUNK]
マーカーを使って明示的に区切りを指定できます。
チャンク制御のポイント:
意味のまとまりごとに区切る(関連情報は同じチャンクに)
[CHUNK]
を挿入すると、その位置で強制的に区切られる文章の区切りが不適切だと検索精度が大幅に下がる可能性がある
適切なチャンク分割の例:
会話型AIとは
本書では、人間が話しかけた言葉に対してAIが自動で応答するシステムを「会話型AI」と総称しています。
...(内容省略)...
代表的な活用例といえば「チャットボット」が有名です。
[CHUNK]
会話型AIの意義
会話型AI構築の方法をご紹介する前に、会話型AI開発の意義をご説明させてください。
...(内容省略)...
このように意味のあるセクションごとに区切ることで、関連情報が適切にまとまり、検索精度が向上します。
2. カスタムフィールドで検索ヒットを増やす
カスタムフィールドは、データの属性情報やタグ、キーワードを追加できる機能です。これを活用することで検索ヒット率を高められます。
カスタムフィールドの効果:
関連キーワードを追加することで、検索スコアが上昇しやすくなる
最大5件までキーワードを設定可能
プロンプトの最上部に確実に情報が追加される
設定方法:
データ追加時に「カスタムフィールドを追加」をクリック
キーとなる項目名(例:「カテゴリ」)と値(例:「料金」)を入力
本文に直接記述する場合は
@{custom_field_key=カテゴリ&custom_field_value=料金}
の形式で追加
カスタムフィールドに重要なキーワードを設定しておくことで、ユーザーが様々な表現で質問してきても適切な情報が検索されやすくなります。
3. 検索モードで目的に合った情報検索を実現
miiboには3つの検索モードがあり、用途に合わせて最適なものを選べます:
全文検索モード:
特徴:キーワードベースの検索、単語や語句の完全一致を重視
適したケース:製品名、型番、法令など固有名詞や専門用語を含む質問
メリット:正確なキーワードマッチングに優れる
デメリット:言い換えや類似表現に弱い
ミックス検索モード:
特徴:全文検索とベクトル検索を交互に採用
適したケース:複合的な質問や多角的な情報提供が必要な場合
メリット:多様な表現への対応力が高い
デメリット:特定情報の絞り込みが難しい場合もある
ハイブリッド検索モード(デフォルト):
特徴:全文検索とベクトル検索をスコア順に採用
適したケース:一般的な問合せや様々な表現で来る質問
メリット:精度と再現率のバランスが良い
デメリット:両方の弱点を部分的に持ち込む可能性
設定方法: 「AIによる応答の設定」画面の「検索モード」で選択できます。テスト会話で効果を確認し、目的に合わせて調整することをお勧めします。
例えば、製品の型番や部品番号など正確な情報検索には「全文検索モード」、概念や抽象的な質問には「ミックス検索モード」が適しています。一般的な用途では「ハイブリッド検索モード」のバランスの良さが活きることが多いでしょう。
Q&A
Q: ナレッジデータストアに登録できるデータ量に制限はありますか?
A: はい、登録できるデータには制限があります。1ファイルあたり10万文字まで、ファイル容量は1GBまで、合計データ量はプランによって異なります。基本プランでは1ファイルあたり10MB、合計100MBまで登録可能です。
Q: ナレッジデータストアを使う際、プロンプトに特別な設定は必要ですか?
A: より効果的に活用するには、以下のような指示をプロンプトに追加することをお勧めします:
前提データに基づいて回答してください。
前提データにない情報については、「現在の私の知識では、応答をすることができません」と回答してください。
参考とした前提データのURLがあれば、必ず出力してください。
Q: 検索結果の精度が低い場合、どのように改善できますか?
A: 以下の方法で改善できます:
データの分割サイズを調整([CHUNK]マーカーで最適な区切りを指定)
カスタムフィールドに関連キーワードを追加
検索モードを目的に合わせて変更
検索クエリー生成プロンプトを最適化
miiboの詳細なFAQについては、以下のURLをご覧ください: https://daitoku0110.net/faq/
まとめ
ナレッジデータストアは、会話型AIの応答精度を向上させる効率的なRAG実装です。その主な利点は:
多様なデータ形式に対応した情報登録方法
自動的なデータ構造化と意味検索の実現
チャンク制御による最適なデータ分割
カスタムフィールドによる検索精度の向上
3つの検索モードによる目的別最適化
特に重要なのは、チャンク制御、カスタムフィールド、検索モードの3つの精度向上テクニックです。これらを適切に活用することで、一般的な回答ではなく、あなたの会社や製品に特化した正確な情報提供が可能になります。
【今すぐ行動】
まずは簡単なテキストデータをナレッジデータストアに登録して、AIの回答がどのように変化するか確認してみましょう。次に、チャンク制御を意識したデータ登録を試み、検索精度の違いを体感してください。カスタムフィールドに重要キーワードを追加することで、さらなる精度向上も期待できます。
→ 詳しい設定方法はこちら:ナレッジデータストアの利用
それでは、また次回のニュースレターでお会いしましょう! miiboを楽しんでください!
miiboDesigner岡大徳:https://daitoku0110.net/
miiboガイドページ:https://daitoku0110.net/miibo-guide/
miiboDesigner岡大徳が徹底解説、「miibo」の全貌と描く未来:https://miibo.site/