news シナモンAIからのお知らせ

  • プレス

製造業・建設業の技術文書デジタル化とナレッジ活用をワンストップで実現する『ぜんぶよむもん LLMオプション』を提供開始

 「 ぜんぶよむもん LLMオプションPowered by Azure OpenAI Service 」
企業向け無料トライアル版を9月29日まで提供します

シナモンAIは、手書きと活字いずれの書類でも文字を自動認識し、テキスト抽出することができる当社オリジナルのAI-OCR「Flax Scanner」を、製造業、建設業の技術文書画像の文字読み取りに特化させたAIモデルとして「ぜんぶよむもん」を提供してまいりました。

この度、大規模言語モデルをオプションとして連携する「ぜんぶよむもんLLMオプションPowered by Azure OpenAI Service」(以下、「ぜんぶよむもん LLMオプション」)を、2023年8月1日より提供開始します。

「ぜんぶよむもんLLMオプション」による、OCR結果テキストから情報を抽出する画面イメージ

メンテナンスレジリエンスTOKYO2023(7月26日~7月28日/東京ビッグサイト)で実演デモをします。
ぜひシナモンAIブースにお立ち寄りください。
https://www.jma.or.jp/mente/exhibit/index.html

「ぜんぶよむもん」は、製造業、建設業における紙文書のデジタル化をサポートし、ナレッジ資産化を推進するシナモンAIのAI-OCRです。業界用語を含む、仕様書、報告書、点検記録、図面、実験・試験データ、取扱説明書、マニュアル、専門誌、調査資料、契約書など各種文書に幅広く対応しています。漢字、ひらがな、カタカナ、英数字、記号・単位を読み取ることが可能で、手書きと活字いずれの文字においても 91%以上*という高い読み取り精度を実現しています。
*当社テストデータ値。

今回リリースする「ぜんぶよむもん LLMオプション」は、「ぜんぶよむもん」をAzure OpenAI Serviceと連携させることで、チャットを通じて技術文書の内容について様々な情報処理サポートを行い、文書ナレッジの活用が可能です。代表的なユースケースとして、従来では個別開発が必要とされた、「文書内容からの特定情報の抽出」を簡易的に実行できます。また、ブラウザ経由でChatGPTを使用する場合、入力データが学習に利用されることによる情報漏洩がセキュリティ面での課題となりますが、「ぜんぶよむもん LLMオプション」ではAPI経由でChatGPTと連携されるため、入力データが学習に利用されることがありません。そのため、入力データを学習に利用されない環境で大規模言語モデルを業務利用することが可能となります。

シナモンAIではこれまで、製造業界向けにAI-OCRを多数導入してまいりました。製造業界では、いまだに大量の書類が紙で保管されている企業が多く、倉庫や書庫に探しに行かないと必要な情報を参照できない場合があります。また、文書がPDF化されていたとしてもファイル名でしか検索できず、文章の中身を含めた検索ができないなど、保管してきた大量のナレッジを有効活用しきれていないことが課題となっています。

「ぜんぶよむもん」は、書類内に記載されている文字をすべてテキストデータ化することで、文章の中身を含めた効率的な検索が可能となります。「ぜんぶよむもん LLMオプション」により、データ化した内容を大規模言語モデルで処理することによって、蓄積されたナレッジの更なる活用が実現します。

「ぜんぶよむもん」の導入によるナレッジ活用イメージ

■無料トライアル募集中
 「ぜんぶよむもん」、および「ぜんぶよむもんLLMオプション Powered by Azure OpenAI Service」の、企業向け無料トライアル版を9月29日(金)まで提供します。
・トライアル版 申込URLhttps://go.cinnamon.ai/zenbu_yomumon_LP1.html
・ぜんぶよむもん資料ダウンロードhttps://go.cinnamon.ai/wp_zenbu_yomumon_dl.html

■基本料金プラン(2種類)
① 月額利用
Web画面にて、お客様ご自身でファイルアップロード/ダウンロードを実施いただくプラン
【初期費用】0円
【月額】5万円(税別)※月1000ページまで。
【LLMオプション Powered by Azure OpenAI Service】 ★
月額1万円(税別)

② スポット利用
対象画像ファイルを受領し、当社でOCR処理を実行の上、まとめてお戻しするプラン
【基本料金】
200万円(税別)+処理ページ数×6円(税別)
※2023年8月31日までのスポット利用
お申し込みで、基本料金が半額となるキャンペーンを実施します。
※申込日は、契約締結日となります。

■「ぜんぶよむもん」の入出力で対応可能なファイル形式  ※LLMオプションも同様

  • 入力 6種類のファイル形式から、画像取り込み(全文AI-OCR処理)が可能
  • 処理可能なファイル形式 PDF / JPG / JPEG / PNG / TIFF / TIF
  • 出力 用途に応じた3種類のファイルで出力が可能

– Excel(lmage line report)
画像ファイルとテキストのOCR読み取り出力結果になります。画像とテキストで
OCR 結果を確認することができます。

– Excel(line report)
テキストのみのOCR読み取り出力結果になります。

– PDF(透明テキスト付き)
元の画像ファイルにOCR読み取りした透明テキスト*を付与したPDFファイルです。

* Searchable PDF(サーチャブルPDF)として元の画像ファイルの情報に載せてPDFファイルで出力されます。
これにより、画像に加えてOCR読み取り結果からの全文テキスト検索などが可能となります。

「ぜんぶよむもん」でテキスト化した結果の出力ファイルイメージ