カラクリ、日本語特化の生成AIガードレール「KARAKURI Guardrails」β版を提供開始
この記事の内容をまとめると…
- 日本語に特化した生成AIガードレール「KARAKURI Guardrails」β版の提供を開始
- 日本語独自の表現や文化特性に対応した高度な検知・制御を実現
- ハルシネーションリスクや個人情報など、複数のリスク検知機能を搭載
日本語に特化した生成AIの安全管理システム「KARAKURI Guardrails」のβ版が提供開始された。本システムは、日本語の曖昧表現や敬語など特有の言語文化に対応し、より安全で実用的な生成AI活用を実現することを目的としている。
KARAKURI Guardrails詳細
「KARAKURI Guardrails」は、カラクリが開発した日本語対応の生成AIガードレールであり、既存のテクノロジー企業が提供する有害コンテンツ検出やコンプライアンスチェックなどの基本機能に加え、日本語特有の文脈や慣習に基づいた高度な検知・制御機能を持つ。企業固有の要件やポリシーに応じたカスタマイズも可能で、精緻なリスク管理と安全なコミュニケーション環境の提供を目指している。
主な機能は以下の通り。
- ハルシネーションリスクの検知
生成AIが事実と異なる内容を生成するリスクを検出し、誤情報の拡散を防止。 - 文脈逸脱の検知
会話やクエリの文脈から逸脱した応答を特定し、意図に沿った情報提供を維持。 - 攻撃的行為の検知
悪意ある入力やシステムの脆弱性を突こうとする試みを検出し、安全性を確保。 - 個人情報の検知
氏名や住所、クレジットカード情報などを検出・マスキングし、プライバシー保護を強化。 - 禁止ワード、禁止トピックの検出
組織のポリシーや法的基準に基づいた用語・トピックを検出し、適切なコンテンツ管理を支援。
その他
「KARAKURI Guardrails」は、2024年12月2日から6日に開催された『AWS re:Invent 2024』において、ソニー株式会社により紹介された。