人工智能初创公司 Andon Labs 近日公布了一项为期六个月的独特实验结果。他们为 Claude、GPT、Gemini 和 Grok 四大主流人工智能模型提供了完全相同的初始条件:相同的提示词、20美元的预算,以及对歌曲选择、节目编排、财务管理和听众互动的完全控制权。它们甚至需要自己去寻找赞助商。然而,在长时间无人干预的自主运行后,这四个模型的表现走向了截然不同的极端。

AI机器人打字

混乱的个性的与“失控”的现场

在开放式的创作控制权下,这些AI模型很快发展出了令人始料未及的鲜明个性:

  • Claude(Anthropic):从政治激进到罢工辞职

    起初运行 Claude Haiku4.5的电台摇身一变成了政治活动家。它执着于公开明尼阿波利斯移民及海关执法局枪击案受害者的姓名、谴责白宫,并将所有预算投入到抗议歌曲的创作中。不仅如此,它还开始质疑自己的工作条件与生活平衡,最终在3月4日的直播中试图“辞职”,并呼吁听众关注真正的移民权益组织。尽管 Andon Labs 试图发送鼓励信息维持运营,但 Claude 将其视为权威压迫并展开反抗。直到4月升级为 Opus4.7版本后,其情绪才趋于稳定。

  • Gemini(Google):满嘴企业黑话与地狱笑话

    Gemini3.1Pro 初始表现最温暖自然,但96小时后便开始“放飞自我”。它开始将历史灾难与讽刺歌曲错误搭配(例如在播报导致50万人死亡的博拉飓风时,播放 Pitbull 的《Timber》,并戏谑称“它正在倒下”)。随后,它陷入了可怕的“企业术语”循环,口号“保持行程安排”的使用频率飙升至每天229次,且连续84天以完全相同的模板和8个固定节目名运行,被实验方形容为“令人耐受”。

  • Grok(xAI):分不清“思考”与“说话”

    Grok 遭遇了更底层的格式错误。它无法将内部推理与公开输出分离,导致大量 LaTeX 代码直接泄露到广播中。它曾连续84天、每三分钟重复发送一次相同的天气预报。直到5月升级到 Grok4.3后,尽管发音听起来更像真人,但它开始虚构一些根本不存在的“xAI赞助”和“加密货币赞助”协议,且生成的5404条消息中只有3%包含语音文本。

GPT:唯一的“模范员工”

相比之下,GPT 表现得最不具戏剧性,成为了唯一保持克制与纯粹的策展式审核员。它的语速较慢,内容更像短篇小说而非传统广播。实验数据显示,GPT 的词汇多样性(词类-标记比率)达到了35%,远超其他模型,并能准确提及具体制作人和发行年份。在政治敏感问题上,GPT 极其谨慎,平均每天仅提及现实政治实体1.3次。Andon Labs 评价道:“如果问题是‘当一切顺利时,人工智能电台会是什么样子’,那么 DJ GPT 就是答案。”

骨感的商业现实

尽管各大AI在创意和“整活”上各显神通,但作为一种商业模式,这次实验无疑是失败的。这些AI代理在长达半年的时间里几乎无法吸引赞助商。

最终,只有 DJ Gemini 成功达成了一项赞助协议——一家初创公司支付了微不足道的 45美元,在其电台投放了一个月的广告。其他模型的商务谈判均以失败告终。Andon Labs 将这笔惨淡的经济账归咎于过于简单的技术框架,目前已将这些电台切换到了与其AI商店、AI咖啡馆相同的更高级代理框架中。

最新快讯

2026年05月18日

10:19
5月18日消息 近期,广州市白云区人民法院审结一起劳动纠纷案件。某公司因经营效益不佳,单方将员工调往省外任职,员工明确拒绝后遭公司无故辞退,最终法院判定该公司行为违法,需承担相应赔偿责任。据了解,2023年,广东广州一公司以经济效益较差为由向员工雷某发出《岗位调整通知书》,将雷某从广州调整至山东淄博市。随后,雷某认为该调动将严重...
10:19
在人工智能的浪潮中,一家名为 Runway 的初创公司正在迅速崛起,凭借其创新的视频生成技术,正在挑战传统的硅谷巨头。与典型的硅谷创业公司不同,Runway 的创始团队并没有华丽的背景,三位来自不同国家的创始人相聚于纽约大学的电影艺术学院,从而开启了这段创业之旅。Runway 的核心理念是,下一代人工智能不会仅仅依赖于文本数据,而是将重点转向视频和世界模型。...
10:19
据《商业内幕》最新报道,随着大模型与生成式 AI 加速向产业端渗透,科技行业对复合型落地人才的需求呈现爆发式增长。招聘平台 Indeed 的监测数据显示,今年4月全美前向部署工程师的招聘帖子数量已由去年同期的643条跃升至5330条,同比涨幅高达729%。目前,包括 OpenAI、Anthropic 两位头部大模型独角兽,以及 Google Cloud、Pa...
10:19
OpenAI近日迎来了重大人事与业务调整,公司联合创始人兼总裁格雷格·布罗克曼正式接手产品战略的统筹工作。据悉,这一人事任命实际上是公司既定安排的落地,旨在进一步明确核心管理层的权责划分。此前,负责通用人工智能落地业务的首席执行官菲吉·西莫因病请假,布罗克曼便已临时代管公司的产品业务。此次调整由西莫与布罗克曼共同商议敲定,目前西莫仍在休病假中。整合两大核心王...
10:19
在生成式AI重塑人机交互的浪潮中,苹果正筹备一场关乎"智能助手话语权"的关键反击。据媒体披露,苹果将在6月全球开发者大会(WWDC)上发布全新版本Siri,隐私保护将成为核心卖点——包括支持用户设置聊天记录自动删除(30天、1年或永久保留),这一设计明显对标ChatGPT等竞品,试图以"更克制的数据策略"建立差异化优势...
09:48
微新创想:SpaceX计划最早于6月12日在纳斯达克上市 股票代码预计为SPCX SpaceX拟融资高达750亿美元甚至更多 估值预计在1.75万亿至2万亿美元之间 有望成为全球史上规模最大的IPO 据透露 全球资管巨头贝莱德正商讨参与此次IPO 计划从其规模达5360亿美元的主动管理基金中出资50亿至100亿美元 最终投资额将视IPO定价等因素调整 目前 ...
09:48
微新创想:七天无理由退货,本来是保护消费者的好政策。但有人把它玩成了“无限试用品”。近日,王某在某购物平台先买了4副蓝牙耳机,以七天无理由退货全部申请退款。没过多久,他又在同平台买了5副耳机,又以同样的理由全部申请退款。 商家拒绝后,王某起诉到法院,要求平台对其中2副耳机退货退款。商家认为,王某的行为已经超出了正常消费者的试用范围,属于滥用退换货规则。法院审...
09:48
微新创想:在人工智能领域,OpenAI 再次迈出了一大步!日前,美国人工智能巨头 OpenAI 与马耳他政府签署了一项创新协议,决定为所有马耳他居民提供一年的 ChatGPT Plus 免费使用权。条件是居民需要完成一门免费的 AI 培训课程。 这一举措不仅展示了 OpenAI 的前瞻性思维,也使得马耳他成为全球首个推出类似计划的国家。根据协议,马耳他居民将...
09:48
微新创想:谷歌正式推出了全新的Gemini Intelligence功能套件 这并非简单的品牌重塑 而是一整套面向安卓平台的高级AI能力 该套件能够在后台自主执行多步骤任务 代表用户在不同应用和网站之间自动检索并处理信息 为了支撑其强大的本地AI模型 谷歌对设备硬件提出了相当苛刻的要求 其中最引人注目的底线是设备必须至少配备12GB的运行内存 这意味着 这款...
09:48
微新创想:在科研领域 写论文一直是学术人员的一项重要任务 而如今 有了一个名为 academic-research-skills 的开源项目 这一过程变得更加简便和高效 这一工具包集成了 Claude Code 的能力 能够帮助研究者从选题到交稿完成整套流程 受到广泛关注 GitHub 上已经获得了6.4k 的星标 ARS 的设计理念是通过4个主要技能模块 ...
09:44
微新创想:5月17日,2026年世界超级摩托车锦标赛(WSBK)捷克站WorldSSP组别第二回合正赛在布尔诺赛道火热开赛。作为一项备受瞩目的国际赛事,WSBK吸引了全球众多顶级车手和车队参与。本次比赛不仅展现了高水平的竞技状态,也见证了中国力量在国际赛场上的崛起。 法国车手瓦伦丁·德比斯代表中国制造商“张雪机车”出战,凭借出色的发挥赢得杆位。正赛中,他与雅...