news シナモンAIからのお知らせ

  • プレス

生成AIを活用し、複雑な非構造ドキュメントを読み込める「Super RAG」を実用化

社内ドキュメントをそのまま取り込むことでDX推進。
日本語ドキュメントによくある、複雑なレイアウト、複雑な表、チャート図、棒グラフ、ダイアグラム、手書きも自動読み取り

 
 当社は、社内文書活用で、企業の業務効率改善やナレッジ活用を大幅に推進するドキュメントLLM「Super RAG」を発表しました。「Super RAG」を活用することで、複雑な表、チャート図、棒グラフ、ダイアグラム、手書きを含む複雑な帳票からの情報抽出を実現しながらもハルシネーションを抑制し、LLM利用におけるあらゆる文書活用を支援します。

Super RAG: https://cinnamon.ai/ai_model/super-rag/
Super RAG資料DLフォーム: https://go.cinnamon.ai/WP_SuperRAG_DL_LP.html

*下部にアウトプット例の詳細を掲載しております。

■ ドキュメントLLM「Super RAG」開発の背景と概要

 企業の中での活用が進む大規模言語モデル(以下、LLM)の実業務への導入を促進する方法として、Retrieval Augmented Generation(以下、RAG)が注目されています。RAGは、LLMによるテキスト生成に、外部情報の検索を組み合わせることで、回答精度を向上させる技術のことで、「検索拡張生成」、「取得拡張生成」などと訳されます。外部情報の検索を組み合わせることで、最新の正確な情報に基づいてLLMに回答を生成させる効果や、出力結果の根拠が明確になり、事実に基づかない情報を生成する現象(ハルシネーション)を抑制する効果などが期待されています。

 RAGの登場以来、多く企業がRAGを活用することでLLMの活用可能性を拡張しようと取り組んでおりますが、企業が保有する様々なデータを扱う際に、文書が複雑、高度または独自の専門知識を要する、プロンプト入力の難易度が高いなど、ドキュメントの解析や理解、意味抽出の観点で、RAGにデータを取り込むプロセスにおける多くの課題が認識されており、それらの課題がRAGの実務利用の推進を阻害しております。また、RAGそのものは多くの企業からアプリケーションとして提供されており、技術検証は容易となっておりますが、前述した課題を根本的に解決するソリューションが登場していないのが実態です。

 これまでシナモンAIは、AI-OCR、自然言語処理、音声認識など、非構造化データを扱う技術資産を蓄積し、それらをインテリジェント・ドキュメント・プロセシング(文書を解析し情報を抽出・整理するための先進技術、以下、IDP)として統合することにより、高度なドキュメント解析・意味抽出技術を提供してまいりました。これらのIDP技術に加え、ドメインナレッジの活用、プロンプト自動生成といった独自技術を組み込むことで、シナモンAI独自のRAGシステムである「Super RAG」の開発に至りました。ドキュメント解析、ナレッジ注入、プロンプト自動生成の3つの独自技術により、RAGの課題(文書の複雑性、ドメイン知識の不足、あいまいなプロンプトによる精度低下)を克服し、企業のLLM活用を大幅に促進いたします。

■ ドキュメントLLM「Super RAG」の特徴

 シナモンAIが提供するドキュメントLLM「Super RAG」は、LLMが提供する全ての機能が利用可能であることを基本とし、ドキュメント解析、ナレッジ注入、プロンプト自動生成といった3つの独自技術を活用することで、あらゆる社内文書の取り込みを実現しております。特に、これまで解析が難しいとされていた、複雑な表、チャート図、棒グラフ、ダイアグラム、手書きを含む複雑な帳票からの情報抽出を実現しております。

 以下に、一般のRAGシステムでは読み取り難易度が高い図表のサンプルと、シナモンAI「Super RAG」による情報抽出結果をご紹介いたします。なお、読取対象とした元データは弊社で独自に作成したサンプルデータですが、読取結果は実際に各データをインプットとして「Super RAG」に投入した出力結果です。

「Super RAG」 による情報抽出例

■ エンドユーザー企業、パートナー企業との連携を推進

 ドキュメントLLM「Super RAG」は、LLMの自社活用を検討されるエンドユーザー企業、既存のアプリケーションやカスタマイズを通じたエンドユーザーのLLM利用を支援するパートナー企業向けに販売を推進いたします。

 シナモンAIでは、これまで国内大手企業に多くのAIソリューションを提供してまいりました。生成AIは、各社の提供するソリューションを、対話型のチャット形式で使える容易さがあり、エンドユーザー企業で独自にテスト利用が開始されています。一方で、ハルシネーションの制御や、社内のドキュメント・ナレッジ活用で実用化への課題が多く認識されています。

 パートナー企業においては、提供されるアプリケーション内で「Super RAG」を組み込んで共同提供を行うパートナーシップや、カスタマイズによるエンドユーザーのLLM利用を支援する際に「Super RAG」を採用いただくパートナーシップについて、パートナー企業各社との連携を開始しております。

 今後、シナモンAIは、エンドユーザー企業、パートナー企業向けにドキュメントLLM「Super RAG」を積極的に推進してまいります。