news シナモンAIからのお知らせ

  • プレス

全文AI-OCR 「Flax Scanner ぜんぶよむもん」 のオンプレミス版を提供開始

膨大なナレッジを抱える製造業・建設業などの書類をセキュアにデータ化

 弊社は、技術文書画像から文字を自動認識し、高精度にテキストデータ化することができるオリジナルの全文AI-OCR、「Flax Scanner ぜんぶよむもん」のオンプレミス版を、2023年10月3日より提供開始します。外部ネットワークに接続することなく利用できるオンプレミス版はセキュリティレベルが非常に高く、製造業、建設業など多くのナレッジを抱える企業に安心して導入頂けます。

【紹介動画】 https://www.youtube.com/watch?v=4wQTMhhlJO4

「Flax Scanner ぜんぶよむもん」は、図面や設計図、仕様書などの技術文書や、カタログ、作業指示書といった多くの資料(紙文書やPDFデータ)からテキストデータを抽出し、デジタル化することができるAIプロダクトです。企業の資産である膨大なナレッジを、活用しやすいデータに変換することで、生産性の向上や計画の高度化、ノウハウの継承、在庫管理の省人化など、企業DXを推進します。

■ 座標定義は不要。多様な書類を91%*の高精度AI-OCRで読み取り可能。
「Flax Scanner ぜんぶよむもん」は、多くのAI-OCRで使用される「座標定義(どこに何の記載があるのかを事前に定義する技術)」が不要のため、簡単に導入することができます。また、専門的な業界用語を含む、仕様書、報告書、点検記録、図面、実験・試験データ、取扱説明書、マニュアル、専門誌、調査資料、契約書など、さまざまな種類の文書の読み取りが可能です。さらに、漢字、ひらがな、カタカナ、英数字、記号・単位の読み取りにも対応しており、手書きと活字いずれの文字においても91%以上*という高い読み取り精度を実現しています。*当社テストデータ値。

開発の背景
製造業、建設業界では、いまだに大量の書類が紙で保管されている企業が多く、倉庫や書庫に探しに行かないと必要な情報を参照できない場合があります。また、書類がPDFデータ化されていたとしてもファイル名でしか検索できず、保管してきた大量の技術資産を有効活用しきれていないことも課題となっています。

「Flax Scannerぜんぶよむもん」は、書類内に記載されている文字をすべてテキストデータ化し、文書の中身全文を対象とした包括的な検索が可能となります。同時に、自然言語処理、生成AI技術による文書内容の分析が可能となるため、文書のデジタル化はナレッジを活用していく取り組みの第一歩と言えます。

「Flax Scannerぜんぶよむもん」 を導入したナレッジ活用イメージ

■ 「Flax Scannerぜんぶよむもん」オンプレミス版は、以下のようなニーズのある企業におすすめ

  • 機密性の高い技術文書をデジタル化して活用したい
  • 自社ハードウェア、プライベートクラウドに環境構築し、AI-OCRを利用したい
  • 処理枚数上限、処理スピードなどのパフォーマンスを自由にカスタマイズしたい

◇ 無料トライアル募集中 ◇
「Flax Scannerぜんぶよむもん」は、無料トライアルを提供しています。
・トライアル版 お申し込みhttps://go.cinnamon.ai/zenbu_yomumon_LP1.html
・ぜんぶよむもん資料ダウンロードhttps://go.cinnamon.ai/wp_zenbu_yomumon_dl.html

■提供プラン(3種類)  

① 月額利用(オンプレミス版) NEW!
お客様環境に構築し、お客様ご自身でファイルをアップロード/ダウンロードを実施いただくプラン。
費用については、当社問い合わせフォーム(コチラよりご連絡ください。

➁ 月額利用(クラウド環境)

Web画面にて、お客様ご自身でファイルアップロード/ダウンロードを実施いただくプラン
【初期費用】0円
【月額費用】ミニマム月1,000ページ5万円~(税別)
【LLMオプション Powered by Azure OpenAI Service】月額1万円(税別)

③ スポット利用

対象画像ファイルを受領し、当社でOCR処理を実行の上、まとめてお戻しするプラン
【基本料金】
200万円(税別)+処理ページ数×6円(税別)

「Flax Scanner ぜんぶよむもん」の対応可能なファイル形式

【入 力】 6種類の画像ファイル形式(PDF / JPG / JPEG / PNG / TIFF / TIF)を汎用的に取り込む(全文AI-OCR処理)ことが可能です。

【出 力】 用途に応じた3種類のファイルで出力が可能
Excel(lmage line report)
  画像ファイルとテキストのOCR読み取り出力結果になります。画像とテキストでOCR 結果を確認することができます。
Excel(line report)
  テキストのみのOCR読み取り出力結果になります。
PDF(透明テキスト付き)※元ファイルがPDF形式のみ出力可能。
  元の画像PDFファイルに、AI-OCR読み取り結果を透明テキストとして付与したファイルです。
全文テキスト検索が可能なSearchable PDFとなります。

「ぜんぶよむもん」でテキスト化した結果の出力ファイルイメージ