近日,网络安全公司 SentinelOne 与 Censys 联合发布的一项深度研究揭示了开源大语言模型面临的严峻安全挑战。 研究指出,当这些模型脱离主流托管平台的“护栏”与安全限制,在外部私有计算机上独立运行时,极易沦为黑客与犯罪分子的攻击目标,产生严重的安全风险。

这项耗时近 300 天的研究发现,目前互联网上存在数千个缺乏保护的开源 AI 运行实例,其中包含大量基于 Meta 的 Llama 和谷歌的 Gemma 等主流模型开发的衍生版本。 尽管部分开源模型原生自带安全防线,但研究人员仍发现了数百起安全护栏被恶意移除的情况。

安全专家将这一现象形容为行业视野外的“冰山”:开源算力在支持合法用途的同时,正被明显用于犯罪活动。 攻击者可以通过劫持这些运行实例,强制模型生成大量垃圾信息、编写精准的钓鱼邮件,甚至发动大规模的虚假信息宣传。

研究团队重点分析了通过 Ollama 工具部署的开源实例。 令人担忧的是,在约 25% 的观察对象中,黑客可以直接读取模型的“系统提示词”——即决定模型行为的核心底层指令。 进一步分析显示,其中 7.5% 的指令已被修改,旨在为有害行为提供技术支持。

这种风险场景波及范围极广,包括但不限于仇恨言论传播、暴力内容生成、个人隐私数据窃取、金融诈骗,甚至是涉及儿童安全的内容。 由于这些模型绕开了大型平台的监控机制,传统的安全防护手段往往难以奏效。

最新快讯

2026年01月30日

19:05
1月30日,中国东航(600115.SH)发布业绩预告称,预计2025年归母净利润为-13亿元至-18亿元。公司全年运输总周转量达279.81亿吨公里、旅客运输量约1.50亿人次,同比分别增长10.82%和6.68%;利润总额预计2亿至3亿元,实现扭亏为盈。亏损主因系会计准则要求转回前期可抵扣亏损对应的递延所得税资产,致所得税费用增加,从而影响归母净利润为...
19:05
2026年1月30日,英伟达正式发布了编号为582.28的WHQL认证驱动程序,这一重要更新专门针对已停止常规支持的三大经典显卡架构——Maxwell(涵盖GTX 700及900系列)、Pascal(GTX 10系列)以及Volta(Titan V)平台。此次紧急补丁的核心目标在于全面修复CVE-2025-33217等五个高危安全漏洞,切实提升老旧显卡用户的...
19:05
2026年1月30日,谷歌向美国地区Google AI Ultra订阅用户(250美元/月)开放Project Genie原型体验。该AI模型支持通过文字提示或图片生成可交互游戏世界,用户可自定义角色、视角及移动方式,并支持混合重制与导出预览视频。目前存在生成不精准、延迟及单次游玩限时60秒等限制。项目尚处早期测试阶段,未面向全球或免费用户开放。
19:05
知名爆料人NateTheHate近日释放重磅消息,据其透露,任天堂计划于2月5日举办一场以第三方游戏为核心主题的线上发布会。与以往强调《马力欧》《塞尔达传说》等自研大作的直面会不同,此次活动将全面聚焦合作厂商的全新力作,为玩家带来更多元化的游戏体验。 该消息发布于2026年1月30日,时间节点恰逢任天堂既定的2月至4月新作密集发售期,与近期推出的《马力欧网球...
19:04
1月30日,阿里旗下千问APP宣布加入2026年春节红包活动。据悉,千问将在春节期间向用户派发总额超亿元的红包,具体金额仍在最终确认中。活动面向全体千问APP用户,通过App内互动任务、签到、分享等方式发放,旨在提升用户活跃度与节日期间 engagement。此举标志着大模型应用首次深度参与春节流量运营,与腾讯元宝、百度文心等形成正面竞争。红包发放时间覆盖...
19:04
2026年1月30日,开源电子书管理器Calibre正式发布9.0版本。本次更新引入全新‘书架’视图,以实体书脊形式展示藏书,并支持通过主窗口右下角布局按钮自由切换视图。阅读器新增‘编辑图书’快捷按钮,一键跳转至EPUB、AZW3、KEPUB等格式的编辑界面;导航支持页码直输跳转;Linux版还优化触控板惯性滚动体验。更新旨在提升书库浏览直观性与编辑-阅读...
18:35
重磅消息!2026年1月23日,TikTok Shop美国站宣布对物流规则实施重大战略调整。根据官方公告,平台将于2月起正式终止自发货模式(Seller Shipping),并强制要求所有卖家统一使用官方面单服务。TikTok Shop美区卖家收到关于物流规则调整的邮件图源:跨境卖家分享为保障卖家业务平稳过渡,平台规定如下:现有...
18:35
声明:本文来自于微信公众号 壹娱观察,作者:厚码,授权站长之家转载发布。就在1月28日,粉丝数真正意义上的“小红书一姐”赵露思开启了她的带货直播首秀,虽然是助农0佣金版本。一如她去年夏天注销微博前说的,“真的助农”。这场小红书直播是0佣金模式,赵露思也在直播中表示,“助农的每一分钱,都会直接返给农民”。据第三方数据显示,开播不到...
18:34
声明:本文来自于微信公众号 窄播,作者:麻花,授权站长之家转载发布。爆了很多次的传言最终还是成真了。1月27日安踏体育发布公告称,它将以15.06亿欧元的价格收购彪马29.06%的股份,交易完成后,安踏将成为彪马的最大股东。1991年安踏刚创立时,还是福建晋江一个从事贴牌代工的小企业。2009年,它收购FILA并对其进行品牌重塑...
18:11
小红书近日被爆出正在秘密内测一项名为“语音问一问”的新功能。这一动作标志着小红书开始发力“真人经验 + AI”的问答场景,试图在激烈的 AI 搜索竞争中,利用其独特的社区内容优势开辟新战场。目前,已有部分参与内测的用户发现,搜索框下方的原有热榜功能已被语音“问一问”入口取代。用户只需通过语音输入问题,搜索结果页不仅会呈现相关的笔记内容,还会额外显示一份由 A...
18:11
近日,OpenAI 旗下的视频生成应用 Sora 的下载量出现了大幅度下滑。根据 Appfigures 的数据,Sora 在 1 月份的移动端下载量环比暴跌了 45%,同时消费者的支出也下降了 32%,降至 36.7 万美元。这一现象引发了业界的广泛关注,似乎预示着人工智能应用早期的热潮正在退去。Sora 曾在去年 10 月一举登顶苹果应用商店的下载榜首,超...
18:11
在近日于上海举办的中国司法人工智能大会(CJAI2026)上,清华大学互联网司法研究院重磅推出了一款名为 LegalOne-R1 的开源法律大模型。这款模型的研发得到了华为云昇腾 AI 云服务的强力支持,标志着我国在法律领域的人工智能应用又向前迈出了一大步。LegalOne-R1 提供了三种不同参数版本:1.7B、4B 和 8B,旨在通过针对我国司法数据的深...