認識器学習構築サービス
業界によっては数千オーダーのキーワードや周辺文脈を考慮した高度なルール設計が求められるケースがあります。 このような本格的なドメイン特化型認識器の構築には、当社独自のトレーニングアルゴリズムをご活用いただくことで、 高精度と高速処理のバランスに優れたエンジンを短期間で構築できます。
認識器学習構築サービスは、API利用料金とは別途費用が発生する有償サービスです。
本サービスはPII-Fi API利用契約を締結されている法人のお客様のみご利用いただけます。
詳しくは担当者までお気軽にお問い合わせください。
サービス概要
お客様が保有する業務文書やマニュアル等の文書データをもとに、 ドメイン固有のキーワード辞書・カテゴリ体系・スコアリングルールを備えた専用認識器を作成します。
当社独自のトレーニングアルゴリズムにより、高精度と高速処理のバランスに優れたエンジンを構築。
お客様の業務ドキュメントから効率的に学習し、短期間でドメイン特化型認識器を提供。
精度の追い込みやドメイン固有の表現への対応など、きめ細かなチューニングを実施。
当社の専門家がお客様の要件をヒアリングし、最適な認識器を設計・構築。
対応ドメイン例
| ドメイン | 検出対象の例 | 想定ユースケース |
|---|---|---|
| 金融 | 個人収入・資産・負債、企業収益、M&A情報、口座番号 | 金融機関のコンプライアンス、顧客情報保護 |
| 医療 | 診断名、検査結果、処方内容、遺伝子情報、患者ID | 電子カルテのマスキング、臨床データの二次利用 |
| 法務 | 契約金額、和解金、訴訟情報、知的財産、契約番号 | 契約書レビュー、法的文書の機密情報管理 |
| 人事 | 給与・報酬、人事評価、懲戒情報、社員番号 | 人事システムの情報保護、監査対応 |
| 製造業 | 製造原価、配合比率、取引先単価、営業秘密 | 技術文書の機密管理、サプライチェーン情報保護 |
| 研究開発 | 研究データ、実験結果、特許情報、研究者情報 | 研究データの共有・公開時の非識別化 |
サービスの流れ
1. ヒアリング
お客様の業務内容、検出したいPIIの種類、精度要件、処理量などをヒアリングします。
2. 要件定義
ヒアリング内容をもとに、認識器の仕様(カテゴリ体系、検出ルール、優先度など)を定義します。
3. データ収集
学習に必要なサンプルデータをご提供いただきます。業務文書、マニュアル、メールなどの文書データが対象です(構造化されている必要はありません。ラベリング等も不要です)。
4. 学習・構築
当社独自のアルゴリズムでデータを分析し、ドメイン特化型の認識器を構築します。
5. 検証・調整
構築した認識器の精度を検証し、必要に応じてチューニングを行います。
6. 納品・導入
完成した認識器をお客様のPII-Fi API環境に導入します。導入後のサポートも提供します。
セルフサービスとの比較
| 項目 | セルフサービス(API経由) | 認識器学習構築サービス |
|---|---|---|
| 対象 | シンプルなルール | 複雑な業務要件 |
| キーワード規模 | 数十〜数百 | 数千〜数万 |
| チューニング | お客様自身 | 専門家が実施 |
| 精度 | 標準 | 業務要件に最適化 |
| 構築期間 | 即時 | 要件に応じて数週間〜 |
| 費用 | API利用料のみ | 有償(要お見積り) |
お問い合わせ
認識器学習構築サービスについてのご質問、お見積りのご依頼は、担当者までお気軽にお問い合わせください。