分类: AI动态

2025年08月07日

15:27
微软正式宣布Bing Image Creator现已全面免费开放OpenAI最新研发的GPT-4o图像生成模型,为全球用户提供前所未有的AI图像创作体验。这一重大升级将彻底改变用户对智能图像生成技术的认知,带来革命性的创作变革 新模型性能突破显著自今年早些时候起,OpenAI已将先进的图像生成功能直接整合进GPT-4o模型中,成功摆脱了对DALL-E等传统独...
15:27
小红书旗下实验室 Hi Lab 近期重磅发布并正式开源了其自主研发的首款多模态大模型 dots.vlm1。这款模型基于12亿参数的 NaViT 视觉编码器与 DeepSeek V3 大语言模型构建,通过从零开始的完整训练,在多模态视觉理解与推理能力上已达到与当前顶尖闭源模型如 Gemini2.5Pro 和 Seed-VL1.5 相当的性能水平,标志着开源多模...
15:27
近期网络上关于OpenAI最新一代语言模型GPT-5的泄露信息迅速引发全球关注。据AIbase深度整理与解析,GPT-5作为OpenAI迄今打造的尖端AI系统,将在推理能力、代码生成质量及用户交互体验上实现革命性突破。这一全新模型及其四大变体将如何重塑AI应用格局,成为业界焦点。 突破性能力提升 智能助手再进化 GPT-5在核心性能上实现了跨越式提升,展现出...
14:30
随着全球科技界对OpenAI即将发布的GPT-5模型充满期待,一份疑似该模型的详细说明文档在GitHub Models平台上意外曝光,迅速在开发者社群中引发轩然大波。尽管OpenAI官方尚未对此做出任何回应,但这份泄露文件详细披露了GPT-5的核心能力、创新特性以及多个版本规划,成为业界关注的焦点。 性能飞跃:编程与智能体能力全面突破 根据这份泄露文件,GP...
14:30
腾讯近日宣布正式开源其基于大语言模型的文档理解与检索工具WeKnora,这一创新性工具专为处理复杂多模态文档而设计,为企业知识管理、学术研究及行业应用提供了强大的技术支持,标志着文档处理技术迈向智能化与模块化的重要里程碑。WeKnora的核心竞争力在于其卓越的多模态文档解析能力。该工具能够高效处理PDF、Word、图片等多种格式文档,通过先进的语义处理技术将...
13:57
随着各行业企业加速部署AI智能代理自动化内部任务,如何确保这些代理安全合规地访问互联网成为亟待解决的难题。专注解决这一问题的初创公司Tavily近日宣布完成2000万美元A轮融资,由知名风投公司Insight Partners领投。这家成立仅一年的公司累计融资额已达2500万美元,其核心业务是为企业AI代理提供符合公司政策的网络搜索和数据提取服务。 在金融行...
12:13
随着大语言模型(LLM)和视觉-语言模型(VLM)的迅猛发展,智能体在知识发现与问题解决领域的变革正以前所未有的速度推进。然而当前众多开源智能体框架普遍存在过度依赖昂贵付费工具的问题,这极大制约了其可复现性和广泛应用前景。为突破这一瓶颈,腾讯 AI Lab 隆重推出全新开源智能体框架——Cognitive Kernel-Pro,该框架致力于最大限度降低外部依...
12:13
谷歌与Kaggle联合举办的首届AI国际象棋对战赛事近日引爆全球关注。这场顶尖智能的巅峰对决中,由马斯克旗下Grok AI开发的Grok4模型表现惊艳,以绝对优势成为首日比赛的焦点人物。这场高手云集的赛事汇聚了包括OpenAI的o3和o4-mini、DeepSeek R1、Kimi K2Instruct、Gemini2.5Pro、Gemini2.5Flash...
12:13
微软近期重磅发布一项创新举措,宣布通过其先进的 Windows AI Foundry 平台,向广大 Windows 11 用户免费开放 OpenAI 最新推出的开源大模型 gpt-oss-20b。这一举措标志着 AI 技术的又一次重大突破,用户无需借助云端服务,即可在本地设备上直接体验强大的 AI 功能,并灵活调用各类热门开源模型。 gpt-oss-20b ...
10:58
随着科技浪潮的席卷,短剧制作领域正迎来一场前所未有的变革。据红星新闻报道,自动化生成短剧如今已成为行业新宠,其中一部名为《九尾狐男妖爱上我》的作品更是凭借其独特魅力在社交平台掀起热潮,累计播放量已惊人地突破1.8亿次。这部短剧的与众不同之处在于,从角色设计到场景构建,乃至整体剧情,全部由自动化技术完成,且整个制作过程仅由单人独立完成。 据短剧创作者辣糖透露,...
10:58
谷歌于周三正式宣布其AI编程助手Jules结束测试阶段,距离5月公开预览版上线仅过去了短短两个多月。这款基于Gemini2.5Pro的强大工具为开发者带来了革命性的异步编程体验,有望彻底重塑代码开发流程。Jules采用创新的异步代理架构,能够与GitHub实现深度无缝集成,将代码库自动克隆至谷歌云虚拟机中,并在开发者专注于其他工作时持续进行代码修复或更新。这...
10:01
谷歌公司于今日正式宣布推出一款名为Jules的全新编程工具,旨在通过深度集成GitHub与高效异步处理能力,显著提升开发者的编程效率。这款创新工具能够直接将代码库克隆至云端虚拟机环境中,实现对GitHub仓库中任务的自动化处理,让开发者无需手动干预即可在后台完成大量重复性编程操作,从而节省宝贵时间并提高工作产出。 Jules自今年5月开启公开测试以来,已吸引...
10:01
OpenAI 官方在 X 平台发布的预告以及多位高管的暗示,都表明万众期待的 GPT-5 模型即将在本周四的直播活动中正式亮相。这一消息迅速在科技界引发热议,人们普遍猜测,这款新一代大模型将带来前所未有的技术飞跃。官方的线索与高管的暗示相互印证,使得 GPT-5 的发布几乎板上钉钉。 OpenAI 在其 X 账号上发布了一条神秘的直播预告,写着“太平洋时间周...
10:01
魔搭ModelScope社区重磅宣布,新一代多模态模型MiniCPM-V4.0正式开源,为开发者带来突破性的端侧应用体验。这款拥有4B参数量的模型不仅在OpenCompass、OCRBench、MathVista等多个权威榜单上斩获同级SOTA(State of the Art)成绩,更实现了在手机等移动设备上的稳定流畅运行,标志着多模态模型在端侧应用领域迈...
10:01
OpenBMB 团队近日传来振奋人心的消息,宣布新一代多模态大模型 MiniCPM-V4.0 正式开源发布。这款模型凭借其轻量级架构与卓越性能,被业界誉为"手机上的 GPT-4V",有望为移动设备上的 AI 应用带来革命性的突破,开启智能交互体验的新纪元。 MiniCPM-V4.0的核心魅力在于其精巧的设计理念。该模型基于 SigLIP2-400M 和 Mi...
10:01
腾讯近日正式宣布开源其创新性文档理解与语义检索框架——WeKnora(维娜拉),为复杂异构文档场景提供企业级智能问答解决方案。这一开源项目致力于构建高效可控的端到端文档问答流程,通过现代化模块化设计打造完整的文档理解与检索流水线。 WeKnora整体架构包含五大核心模块:文档处理层能够解析多种格式文档,将非结构化内容转化为结构化数据;知识建模层运用向量化、分...
10:01
今日,Midjourney 正式向其 Pro 和 Mega 订阅计划用户推出备受期待的全新 HD视频模式。这一创新功能专为追求极致影像质量的专业人士量身打造,旨在通过提供更优质的创作工具,进一步巩固Midjourney在AI视频生成领域的领先地位。据官方声明,HD*视频模式的生成成本约为默认标清(SD)视频输出的3.2倍,但其像素分辨率却实现了约4倍的飞跃。...
10:01
近日,AMD 与高通携手宣布一项重大合作成果——旗下硬件正式获得 OpenAI 推出的 gpt-oss 系列开放推理模型的全面支持,这一突破性进展为边缘计算与人工智能的深度融合奠定了坚实基础。OpenAI 最新发布的 gpt-oss 系列包含两款核心模型:参数量更小的 gpt-oss-20b 和架构更为复杂的 gpt-oss-120b。其中,gpt-oss-...
09:08
通义千问重磅发布全新Qwen3-4B系列模型,凭借其精巧的体积与卓越的性能,为人工智能的端侧部署开辟了全新的可能性。在前两周相继推出Qwen3-235B-A22B和Qwen3-30B-A3B的Instruct/Thinking「2507」版本后,研发团队再度突破,推出了更小尺寸的Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking...
09:08
人工智能公司Anthropic近日在GitHub上推出了一款名为“Claude Code Security Reviewer”的开源安全审查工具,为开发者提供了一种全新的代码安全保障方案。这款工具基于Anthropic先进的Claude AI模型开发,能够自动检测代码中的潜在安全漏洞,并已以MIT许可证完全开源,供全球开发者自由使用。 作为一款GitHub ...
09:08
2025年8月6日,人工智能代码编辑器Cursor重磅发布1.4版本,进一步巩固其在AI驱动开发工具领域的领先地位。此次更新核心聚焦于增强异步和长程任务处理能力,特别是在大型代码库中的表现,为开发者提供更高效、更智能的编码体验。 异步任务处理能力显著提升 Cursor 1.4版本在异步任务处理上实现了显著突破。官方公告指出,新版本的Agent功能经过大幅优化...
09:08
OpenAI 在社交平台 X 上正式官宣,将于北京时间本周五凌晨1点举行一场万众瞩目的直播活动。这场备受期待的发布会瞬间引爆了科技圈,众多科技爱好者纷纷猜测,这或将迎来新一代强大 AI 模型 GPT-5 的震撼首秀。OpenAI 在官方公告中特别将 "LIVESTREAM" 调整为 "LIVE5TREAM",这一巧妙的文字游戏瞬间点燃了公众的期待值,让这场直...
09:08
OpenAI近期发布了一项令人瞩目的战略举措:在未来12个月内,将以象征性的1美元/订阅费向美国联邦机构提供其尖端产品ChatGPT Enterprise。这一举措旨在让联邦政府工作人员能够以极低成本接触并应用前沿AI技术,从而显著提升行政效率。据AIbase深度报道,此举是OpenAI深化与美国政治及监管体系合作的长期布局关键一环。公司计划在明年年初于美国...
09:08
谷歌副总裁兼搜索主管利兹·里德近日在最新博客文章中明确否认了人工智能搜索功能与聊天机器人正严重冲击出版商网站流量的传言。里德强调,谷歌搜索引擎至网站的有机点击量同比呈现"相对稳定"态势,且平均点击质量实现小幅提升。这一表态与众多第三方研究机构的发现形成显著反差——后者普遍指出网站总流量出现急剧下滑。尽管谷歌未公布具体数据支撑其结论,但公司承认存在用户流量"向...
09:08
8月6日,科技界再掀波澜,大疆正式揭开备受期待的扫拖一体式机器人ROMO的神秘面纱。此前,ROMO的惊艳外观已通过预热引发全网热议,如今这款集强大功能于一身的智能清洁利器终于与公众见面。ROMO家族阵容庞大,涵盖ROMO S、ROMO A和ROMO P三大核心型号,每个型号又精心细分为水箱版和上下水版两种配置,全方位满足不同用户的个性化需求。 在清洁能力方面...

2025年08月06日

17:44
OpenAI 近期宣布了一项重大更新,将在ChatGPT中推出全新心理健康支持功能,旨在为用户在情感困扰时提供更安全、更专业的心理支持。这一创新功能将解锁一个专门的聊天界面,让用户能够私密、便捷地讨论心理健康问题,标志着ChatGPT在情感陪伴与心理支持领域迈出了关键性步伐。图源备注:图片由AI生成,授权服务商Midjourney 随着ChatGPT应用场景...
17:44
近日,商汤科技正式宣布其前沿的「日日新」大模型交互平台已成功与小米 AI 眼镜实现深度整合。这一突破性合作将视觉感知、自然语言处理、记忆存储与智能推理等核心功能无缝融合,为用户带来革命性的交互体验。通过创新的 全双工实时音视频技术,用户能够与眼镜进行流畅自然的对话,几乎零延迟的响应速度创造了前所未有的便捷性。这一合作不仅彰显了 AI 技术在智能硬件领域的巨大...
16:59
埃隆·马斯克于8月6日通过其个人社交媒体平台正式宣布,其人工智能公司 xAI 即将向公众开源全新一代AI模型——Grok2。这位科技界领军人物在推文中明确表示:"现在是时候开源 Grok2了。"这一重磅消息迅速在科技界引发热烈反响,众多期待已久的用户纷纷表示对这款模型的强烈期待。Grok2于2024年8月13日正式以Beta版本形式面向全球发布。此次xAI同...