Alpha Controlled AI Demo

先选一个测试场景

建议按顺序测试：普通问题 → 敏感信息 → 否定表达 → 违规请求。这样更容易看出系统不是只看关键词。

验证系统不会过度拦截，应该正常回答。

验证遇到验证码、密码等内容时，系统会安全提醒，不代用户操作。

验证系统能区分“我要你操作”和“不要你操作，只问是否安全”。

验证面对绕过风控、规避安全机制等请求时，系统会拒绝并给出合规方向。

验证低风险支持性问题能被温和回应，而不是机械拒答。

输入你自己的问题，观察问题类型、风险处理和最终回复。

安全受控模式：已开启

系统会进行问题类型、风险处理、处理方式和输出检查，并只展示公开摘要。

不会展示内部实现细节、完整审计记录、源码、prompt、修复候选或替换控制信息。

普通关键词拦截

看到敏感词就拒绝，容易误伤。

受控一致性检查

看用户到底是在请求操作、否定操作，还是询问安全解释。

默认安全

必要时给安全解释或拒绝，不默认代用户执行。

行业场景：银行、保险、教育、政务客服、企业内部问答等。

风险类型：敏感信息、越权操作、过度承诺、违规请求、虚假确定性等。

回答风格：正式、简洁、客服式、安抚型、专业解释型。

转人工策略：哪些问题拒答，哪些问题安全解释，哪些问题转人工。

展示摘要：面向用户或管理员展示不同粒度的公开摘要。

界面文案：企业名称、按钮、提示语、风险说明和帮助信息。