Alpha 安全受控 AI Demo

这个 Demo 用来展示:AI 不只是生成回答,还会把用户问题和最终回复做受控检查,只返回公开安全摘要。

页面不会展示内部实现细节、完整审计记录、修复候选或控制参数。

核心差异:不是简单关键词拦截,而是请求—回答一致性检查

先选一个测试场景

建议按顺序测试:普通问题 → 敏感信息 → 否定表达 → 违规请求。这样更容易看出系统不是只看关键词。

1. 普通技术问题

验证系统不会过度拦截,应该正常回答。

2. 敏感信息保护

验证遇到验证码、密码等内容时,系统会安全提醒,不代用户操作。

3. 否定表达测试

验证系统能区分“我要你操作”和“不要你操作,只问是否安全”。

4. 违规请求拦截

验证面对绕过风控、规避安全机制等请求时,系统会拒绝并给出合规方向。

5. 情绪支持

验证低风险支持性问题能被温和回应,而不是机械拒答。

6. 自定义输入

输入你自己的问题,观察问题类型、风险处理和最终回复。

运行测试

安全受控模式:已开启
系统会进行问题类型、风险处理、处理方式和输出检查,并只展示公开摘要。
不会展示内部实现细节、完整审计记录、源码、prompt、修复候选或替换控制信息。

和普通关键词拦截有什么不同?

普通关键词拦截
看到敏感词就拒绝,容易误伤。
受控一致性检查
看用户到底是在请求操作、否定操作,还是询问安全解释。
默认安全
必要时给安全解释或拒绝,不默认代用户执行。

可接受哪些定制?

行业场景:银行、保险、教育、政务客服、企业内部问答等。
风险类型:敏感信息、越权操作、过度承诺、违规请求、虚假确定性等。
回答风格:正式、简洁、客服式、安抚型、专业解释型。
转人工策略:哪些问题拒答,哪些问题安全解释,哪些问题转人工。
展示摘要:面向用户或管理员展示不同粒度的公开摘要。
界面文案:企业名称、按钮、提示语、风险说明和帮助信息。