シナモンAI、読み取り精度91%のAI-OCR「ぜんぶよむもん LLMオプション」提供開始
- 2023/7/19
- ビジネス
- AI-OCR, Azure OpenAI, ChatGPT, LLM
国内の大手企業へ人工知能(AI)ソリューションを提供するシナモン(シナモンAI)は18日、大規模言語モデルをオプションとして連携する「ぜんぶよむもん LLMオプション Powered by Azure OpenAI Service」を、8月1日から提供開始すると発表した。
「ぜんぶよむもん」は、製造業、建設業における紙文書のデジタル化をサポートし、ナレッジ資産化を推進するシナモンAIのAI-OCR。業界用語を含む、仕様書、報告書、点検記録、図面、実験・試験データ、取扱説明書、マニュアル、専門誌、調査資料、契約書など各種文書に幅広く対応している。漢字、ひらがな、カタカナ、英数字、記号・単位を読み取ることが可能で、手書きと活字いずれの文字においても91%以上(同社テストデータ値)という高い読み取り精度を実現している。
今回リリースする「ぜんぶよむもん LLMオプション」は、「ぜんぶよむもん」をAzure OpenAI Serviceと連携させることで、チャットを通じて技術文書の内容について様々な情報処理サポートを行い、文書ナレッジの活用が可能。代表的なユースケースとして、従来では個別開発が必要とされた、「文書内容からの特定情報の抽出」を簡易的に実行できる。また、ブラウザ経由でChatGPTを使用する場合、入力データが学習に利用されることによる情報漏洩がセキュリティ面での課題となるが、「ぜんぶよむもん LLMオプション」ではAPI経由でChatGPTと連携されるため、入力データが学習に利用されることがない。そのため、入力データを学習に利用されない環境で大規模言語モデルを業務利用することが可能となる。
シナモンAIではこれまで、製造業界向けにAI-OCRを多数導入してきた。製造業界では、いまだに大量の書類が紙で保管されている企業が多く、倉庫や書庫に探しに行かないと必要な情報を参照できない場合がある。また、文書がPDF化されていたとしてもファイル名でしか検索できず、文章の中身を含めた検索ができないなど、保管してきた大量のナレッジを有効活用しきれていないことが課題となっている。
「ぜんぶよむもん」は、書類内に記載されている文字をすべてテキストデータ化することで、文章の中身を含めた効率的な検索が可能となる。「ぜんぶよむもん LLMオプション」により、データ化した内容を大規模言語モデルで処理することによって、蓄積されたナレッジの更なる活用が実現するという。
無料トライアル募集中
「ぜんぶよむもん」、および「ぜんぶよむもんLLMオプション Powered by Azure OpenAI Service」の、企業向け無料トライアル版を9月29日まで提供する。