ChatGPTの登場以降、日本国内の企業でも生成AIの導入が進む一方で、ハルシネーション※1などのへの懸念から実務における生成AIの定常利用に至っておりません。
ハルシネーションを抑止する有効な手段としてRAG(Retrieval-Augmented Generation)が挙げられますが、企業のデータの約9割は様々な形式で作成された非定型なドキュメントであり、このままRAGシステムに組み込むと正確な検索ができず、結果的に高い頻度でハルシネーションを起こしてしまいます。
そのような中、昨今注目されている、非定型ドキュメントを検索可能なデータ形式に変換するプロセス「データ構造化」について、当社の谷本が執筆した記事がEnterpriseZINEにて掲載されました。
※1:人工知能が学習したデータからは正当化できないはずの回答を堂々とする現象
記事内では、生成AIのハルシネーション克服に向けた RAG構築における「データ構造化」の4つのポイントを紹介しております。
詳しくは下記のURLよりご覧いただけます。
https://enterprisezine.jp/article/detail/20720
※全文をご覧いただくには会員登録が必要です。
参考
企業における生成AIの「日常的な利用」は約4割未満
幅広い用途の中でも「社内情報を活用」できると利用者は7割まで上昇
https://stockmark.co.jp/news/20240418
本件に関する報道関係者のお問合せ
ストックマーク株式会社
担当:畑中、平澤(ハタナカ、ヒラサワ)
MAIL:pr_stockmark@stockmark.co.jp