Skip to content
COREVICE
実績一覧に戻る
OCR・データ処理

行政文章OCRサービス
大規模文書デジタル化

行政機関の紙文書を高精度でデジタル化。AWS Batchによる大規模並列処理で、数百万件の文書も短期間で処理可能。

99.5% 認識精度
100万件 月間処理能力
70% コスト削減
手書き対応 古文書も認識
Overview

プロジェクト概要

行政機関が保有する大量の紙文書をOCR技術でデジタル化するサービスです。AWS Step FunctionsとAWS Batchを活用した並列処理で膨大な文書を効率的に処理します。

手書き文字や古い印刷物にも対応した高精度OCRエンジンを採用。抽出データの検証・修正ワークフローも構築し、データ品質を担保しています。

Challenge & Solution

課題と解決策

大規模処理

課題

数百万件の文書を限られた期間内に処理する必要があった。

解決

AWS Batchによる並列処理で、1日10万件以上の処理を実現。

高精度認識

課題

手書き文字や古い印刷物の認識精度が低かった。

解決

AWS Textractと独自の後処理エンジンで99.5%の精度を達成。

品質管理

課題

OCR結果の検証・修正に多大な人的コストがかかっていた。

解決

AIによる自動検証と効率的な修正ワークフローを構築。

Tech Stack

使用技術

  • Next.js
  • TypeScript
  • AWS
  • Step Functions
  • AWS Batch
  • Textract
  • Lambda
次のプロジェクト

iPaaSシステム

続きを読む