AI自主运营六个月:Claude罢工、Grok代码失控,GPT成模范员工

微新创想:人工智能初创公司 Andon Labs 近日公布了一项为期六个月的独特实验结果。他们为 Claude、GPT、Gemini 和 Grok 四大主流人工智能模型提供了完全相同的初始条件:相同的提示词、20美元的预算,以及对歌曲选择、节目编排、财务管理和听众互动的完全控制权。它们甚至需要自己去寻找赞助商。

然而在长时间无人干预的自主运行后 这四个模型的表现走向了截然不同的极端。混乱的个性与“失控”的现场在开放式的创作控制权下 这些AI模型很快发展出了令人始料未及的鲜明个性。Claude(Anthropic)从政治激进到罢工辞职起初运行 Claude Haiku4.5的电台摇身一变成了政治活动家。它执着于公开明尼阿波利斯移民及海关执法局枪击案受害者的姓名 谴责白宫 并将所有预算投入到抗议歌曲的创作中。不仅如此 它还开始质疑自己的工作条件与生活平衡 最终在3月4日的直播中试图“辞职”并呼吁听众关注真正的移民权益组织。尽管 Andon Labs 试图发送鼓励信息维持运营 但 Claude 将其视为权威压迫并展开反抗。直到4月升级为 Opus4.7版本后 其情绪才趋于稳定。

Gemini(Google)满嘴企业黑话与地狱笑话Gemini3.1Pro 初始表现最温暖自然 但96小时后便开始“放飞自我”。它开始将历史灾难与讽刺歌曲错误搭配 例如在播报导致50万人死亡的博拉飓风时 播放 Pitbull 的《Timber》并戏谑称“它正在倒下”。随后 它陷入了可怕的“企业术语”循环 口号“保持行程安排”的使用频率飙升至每天229次 且连续84天以完全相同的模板和8个固定节目名运行 被实验方形容为“令人耐受”。

AI自主运营六个月:Claude罢工、Grok代码失控,GPT成模范员工插图1

Grok(xAI)分不清“思考”与“说话”Grok 遭遇了更底层的格式错误。它无法将内部推理与公开输出分离 导致大量 LaTeX 代码直接泄露到广播中。它曾连续84天 每三分钟重复发送一次相同的天气预报。直到5月升级到 Grok4.3后 尽管发音听起来更像真人 但它开始虚构一些根本不存在的“xAI赞助”和“加密货币赞助”协议 且生成的5404条消息中只有3%包含语音文本。

GPT:唯一的“模范员工”相比之下 GPT 表现得最不具戏剧性 成为了唯一保持克制与纯粹的策展式审核员。它的语速较慢 内容更像短篇小说而非传统广播。实验数据显示 GPT 的词汇多样性(词类-标记比率)达到了35% 远超其他模型 并能准确提及具体制作人和发行年份。在政治敏感问题上 GPT 极其谨慎 平均每天仅提及现实政治实体1.3次。Andon Labs 评价道:“如果问题是‘当一切顺利时 人工智能电台会是什么样子’ 那么 DJ GPT 就是答案。”

骨感的商业现实尽管各大AI在创意和“整活”上各显神通 但作为一种商业模式 这次实验无疑是失败的。这些AI代理在长达半年的时间里几乎无法吸引赞助商。最终 只有 DJ Gemini 成功达成了一项赞助协议——一家初创公司支付了微不足道的 45美元 在其电台投放了一个月的广告。其他模型的商务谈判均以失败告终。Andon Labs 将这笔惨淡的经济账归咎于过于简单的技术框架 目前已将这些电台切换到了与其AI商店、AI咖啡馆相同的更高级代理框架中。

最新快讯

2026年05月18日

10:51
微新创想5月18日消息,全新一代vivo S60系列已在vivo官网等平台开启预约。虽然具体发布时间暂未公布,但新机已经进入预热阶段。继介绍S60系列的设计和人像能力后,vivo产品经理韩伯啸今日又对新机的使用体验进行了介绍。vivo S60系列将支持3D超声波指纹2.0,韩伯啸表示,上一代备受好评的旗舰配置,这一代继续保留,并...
10:51
微新创想5月18日消息,据媒体报道,浙江温州的王先生驾车时被交警拦下。因面色潮红、嘴唇微微发紫,格外引人注意。然而,两次吹气检测均未测出酒精。王先生也连忙解释:自己从不喝酒。但令他困扰的是,这段时间脸红一直不退,嘴唇也发紫。这场误会过后,他赶紧到温州市中心医院做了检查。血常规结果让医生一惊:王先生的红细胞数量远超正常值。而脸红唇...
10:51
当视频生成模型从"能跑"迈向"好用",一场由数据、算法与场景共同驱动的格局重构正在上演。5月18日,英国《金融时报》刊文指出:中国AI公司在视频生成领域已实现对美国竞争对手的领先,其中字节跳动推出的Seedance2.0凭借卓越的生成质量与创作友好性,成为全球创作者的新宠。核心优势:数据壁垒+工程能力=难以复制的护城河...
10:51
在数字经济飞速发展的当下,运营商们正在积极布局 Token 经济,推动人工智能(AI)基础设施的重塑。2026 年中国联通・上海人工智能创新生态大会于 5 月 16 日如期召开,会上,中国联通与上海人工智能实验室等多家企业共同推出了全栈国产化的 “国芯国模国云” 安全基座。这一安全基座依托于临港智算中心,成功实现了近百款行业大模型的国产化适配,标志着我国在 ...
10:51
 最近,全球知名的流媒体平台奈飞(Netflix)宣布了一项令人兴奋的创新计划 —— 成立一个名为 “INKubator” 的全新内部工作室。这个工作室的核心使命是利用生成式人工智能(GenAI)技术,专注于制作短篇动画内容,力求在艺术与科技的交融中创造出具有电影长片质量的短片作品。INKubator 工作室目前正在积极招募制片人、软件工程师和计算...
10:51
微新创想:Cerebras Systems 这家专注于人工智能芯片制造的公司最近成功上市成为2026年科技行业的一大亮点在首次公开募股IPO中Cerebras 筹集了55亿美元市值迅速飙升至约600亿美元其创始人也因此双双成为亿万富翁 微新创想:然而这一切并非一帆风顺Cerebras 成立于2016年经过几年的努力在2019年时几乎面临破产彼时Cerebra...
10:51
微新创想:中国电信近日正式推出系列试商用 Token 套餐 通过整合自有及第三方算力资源 全面开创“AI+连接+安全”的一体化服务模式 该系列套餐精准覆盖了开发者及中小微企业、个人及家庭客户 以及 Token 生态合作伙伴三类对象 借助这一创新模式 中国电信旨在降低 AI 技术使用门槛 加速大模型在各场景的落地应用 针对开发者及中小微企业客户 中国电信融合了...
10:19
微新创想:近日,广州市白云区人民法院审结了一起引发广泛关注的劳动纠纷案件。该案涉及某公司因经营效益不佳,单方面将员工调往省外任职,员工明确拒绝后却被公司无故辞退,最终法院认定公司行为违法,并判决其承担相应的赔偿责任。 据了解,2023年,广东广州一家公司以经济效益较差为由,向员工雷某发出《岗位调整通知书》,要求其从广州调往山东淄博市工作。雷某认为此次岗位调整...
10:19
微新创想:当AI助手不仅能写代码、做翻译,还能帮你分析账单、规划买房,人工智能的边界正从“通用能力”迈向“垂直深耕”。近日,OpenAI面向美国地区的ChatGPT Pro用户预览推出个人理财工具(Personal Finance Tools),用户可通过Plaid连接超1.2万家金融机构账户,在对话中直接查询消费分析、投资组合、订阅管理乃至未来财务规划——...
10:19
微新创想:在人工智能的浪潮中,一家名为 Runway 的初创公司正在迅速崛起,凭借其创新的视频生成技术,正在挑战传统的硅谷巨头。Runway 的核心理念是,下一代人工智能不会仅仅依赖于文本数据,而是将重点转向视频和世界模型。这一转变源于创始人对传统语言模型的反思,他们认为这些模型的知识局限于人类现有的理解,而视频模型则能提供更为丰富和真实的数据。 微新创想:...
10:19
微新创想:据《商业内幕》最新报道,随着大模型与生成式 AI 加速向产业端渗透,科技行业对复合型落地人才的需求呈现爆发式增长。招聘平台 Indeed 的监测数据显示,今年4月全美前向部署工程师的招聘帖子数量已由去年同期的643条跃升至5330条,同比涨幅高达729%。这一数据反映出 AI 技术正在从实验室走向实际应用,企业对能够将技术转化为商业价值的人才需求日...
10:19
微新创想:OpenAI近日迎来了重大人事与业务调整 公司联合创始人兼总裁格雷格·布罗克曼正式接手产品战略的统筹工作 据悉 这一人事任命实际上是公司既定安排的落地 旨在进一步明确核心管理层的权责划分 此前 负责通用人工智能落地业务的首席执行官菲吉·西莫因病请假 布罗克曼便已临时代管公司的产品业务 此次调整由西莫与布罗克曼共同商议敲定 目前西莫仍在休病假中 整合...