ニューラルネットワークの画像内テキスト抽出サービス

四角の領域を検出

文・テキスト抽出

書式、カード、名刺、振込用紙、本など、文字が書かれている数多くの媒体は四角の形をしています。イメージの中からその四角の領域を抽出し、その部分を平面化して集中的に分析することができます。しかも、様々な目線からの四角領域で検出こともできます。

OCRの精度と認識率を高める最も重要なことは、文書にある文・テキストの位置を把握することです。 人工ニューラルネットワークを通じてイメージの文・テキストの位置を正確に抽出します。

様々な書体学習

文書に書かれる書体はそれぞれの国・使用する言語別に非常に多様です。

最も多く使用される書体の学習が基本的に行われています。また、目的・用途に合わせて別途の書体学習も可能です。

特徴

様々な画質に対応

イメージの画質・撮影及びスキャンの品質により様々な画質に対応します。イメージのテキスト認識・抽出に最適のイメージ前処理アルゴリズムでテキスト認識が出来るように提供します。

光モジュール・素早い高速

軽量化されたモジュール・素早い速度は多数のドキュメントからテキストを抽出するときに便利であり、 A.I技術に基づいてモバイルアプリケーションに適用・活用することができます。

活用分野の例

文書のテキスト認識

身分証明書認識・非対面本人確認

自動的な名刺の分類、身分証の分類など