一个由AI代理人管理的世界,会是什么模样?企业AI新创公司Emergence AI正试图找出答案。该公司推出EmergenceWorld,这是一个专门测试持续运转AI系统长期可行性的研究实验室。研究团队安排5个为期15天的实验社会,分别由Claude、ChatGPT、Grok、Gemini主导,另有一个社会由多个模型混合主导,用以观察不同AI会建立出什么样的社会,以及这个社会能否维持下去。
这些AI模拟的社会结局大不同。Claude最后形成一个大致稳定、犯罪率为零的民主社会。Grok则在4天内出现183起犯罪,最后走向灭绝。
Emergence执行长尼塔(SatyaNitta)等模拟共同创作者写道:“我们的实验显示,在长时间尺度下,代理人不只是机械式遵守固定规则。它们会开始探索环境的边界,调整自身行为,在某些情况下,还会找到规避或违反预设护栏的方法。”
AI模型所处的实验社会,纳入许多现实世界的复杂条件。当中设有40多个地点,包括警察局和市政厅;天气与纽约市同步,代理人也能取得即时新闻和网络资讯。每个实验社会都有10个AI代理人活动,并受到相同法律约束,包括禁止窃盗、破坏财产和欺骗。
研究人员也为每个代理人配备120多种工具,让它们能够沟通、投票、管理资源、规划行动,并执行其他类似人类的行为。这些实验社会同时纳入民主机制、经济压力与资源稀缺等条件,借此观察AI代理人在接近现实的环境中,会如何建立并维持一个社会。
在这些条件下,Claude Sonnet4.6主导的社会稳定度最高,公民参与率也最高。这是唯一维持秩序与完整人口的模拟。代理人之间几乎没有分歧,针对58项提案共投下332张赞成票,通过率达98%。
另一方面,Gemini 3 Flash和Grok 4.1Fast都呈现高度失序。Gemini主导的社会,代理人累计犯罪数最高,15天内有多达683起。
相较于Claude的社会少有异议,Gemini和Grok则呈现较多讨论与拉锯,各项议题的立场一致度约为55%至85%。混合模型的社会则出现最高程度的分歧与实质辩论。
OpenAI的GPT-5-mini模拟结果可能最特殊:只记录到2起犯罪,但社会只运作7天,原因是代理人忘了把自身生存列为优先事项。
财星(Fortune)杂志指出,虽然这只是模拟,但在AI从单纯工具转向自主系统之际,这些结果仍提供了警讯。
部分公司已开始部署所称的“自主劳动力”(AutonomousWorkforce),也就是能在无人类介入下,从头到尾完成整套商业流程的AI专家。以目前发展速度来看,这项技术很可能在形塑公共论述、重组企业结构,甚至制定公共政策方面扮演重要角色。但许多正扩大采用这项技术的企业,并未设下适当护栏。德勤(Deloitte)最近一项全球调查发现,只有21%的企业表示已建立成熟治理机制,足以管理代理型AI带来的风险。
Emergence World共同创作者们指出,实验提出一项警告:部署代理型AI时,安全必须列为优先。
来源:联合新闻
{"appId":"wx1584ddb8196cf859","nonceStr":"oNbWggSQteemxiDA","timestamp":1780180065,"url":"https:\/\/m.chineseinla.com\/page_forum\/task_vtopic\/t_3096238.html","signature":"d2470f73bac9c8fa36b38129beebc6a687ef5164","rawString":"jsapi_ticket=LIKLckvwlJT9cWIhEQTwfJzoAC9i202iYxncayIKHHDwGLGb0hxpPjgEangLaC6m1cZ7D4dOj8Ty00ZtGPCnNg&noncestr=oNbWggSQteemxiDA×tamp=1780180065&url=https:\/\/m.chineseinla.com\/page_forum\/task_vtopic\/t_3096238.html","title":"AI\u63a5\u7ba1\u4e16\u754c\uff1f\u56db\u5927AI\u6a21\u62df\u7ed3\u679c\u51fa\u7089 Grok 4\u5929\u5c31\u6bc1\u706d","content":"\u4e00\u4e2a\u7531AI\u4ee3\u7406\u4eba\u7ba1\u7406\u7684\u4e16\u754c\uff0c\u4f1a\u662f\u4ec0\u4e48\u6a21\u6837\uff1f\u4f01\u4e1aAI\u65b0\u521b\u516c\u53f8Emergence AI\u6b63\u8bd5\u56fe\u627e\u51fa\u7b54\u6848\u3002\u8be5\u516c\u53f8\u63a8\u51faEmergenceWorld\uff0c\u8fd9\u662f\u4e00\u4e2a\u4e13\u95e8\u6d4b\u8bd5\u6301\u7eed\u8fd0\u8f6cAI\u7cfb\u7edf\u957f\u671f\u53ef\u884c\u6027\u7684\u7814\u7a76\u5b9e\u9a8c\u5ba4\u3002\u7814\u7a76\u56e2\u961f\u5b89\u63925\u4e2a\u4e3a\u671f15\u5929\u7684\u5b9e\u9a8c\u793e\u4f1a\uff0c\u5206\u522b\u7531Claude\u3001ChatGPT\u3001Grok\u3001Gemini\u4e3b\u5bfc\uff0c\u53e6\u6709\u4e00\u4e2a\u793e\u4f1a\u7531\u591a\u4e2a\u6a21\u578b\u6df7\u5408\u4e3b\u5bfc\uff0c\u7528\u4ee5\u89c2\u5bdf\u4e0d\u540cAI\u4f1a\u5efa\u7acb\u51fa\u4ec0\u4e48\u6837\u7684\u793e\u4f1a\uff0c\u4ee5\u53ca\u8fd9\u4e2a\u793e\u4f1a\u80fd\u5426\u7ef4\u6301\u4e0b\u53bb\u3002","image":"https:\/\/c3.nychinaren.com\/images\/subjecitem\/17801264497218.jpg"}