AI绘画领域再起波澜 MidJourney的霸主地位遭遇劲敌Ideogram强势崛起

近日 AI绘画领域传来重磅消息 MidJourney的领先地位正面临前所未有的挑战后起之秀Ideogram横空出世凭借免费注册的初始策略迅速吸引了大量关注目光其最令人瞩目的特性是在图像中精准生成文字这一突破性功能甚至引得英伟达科学家范麟熙亲自上手创作出”It’s over Midjourney”的震撼作品

背后支撑这一创新技术的是Ideogram AI这家由谷歌AI绘画四大核心成员集体离职创办的创业公司总部位于多伦多在成立之初就获得了1650万美元(约1.2亿人民币)的种子轮融资该投资由a16z和Index Ventures联合领投个人投资者阵容堪称星光熠熠包括OpenAI创始成员Andrej Karpathy强化学习领域权威Pieter Abbeel Node.js创始人Ryan Dahl GitHub联合创始人Tom Preston-Werner等业界巨擘甚至连Ideogram AI团队的前任上司前谷歌大脑掌门人Jeff Dean也加入了投资行列

尽管创始团队全部由技术专家组成 Ideogram AI在市场推广方面却毫不逊色他们通过社交媒体发起的二次创作tag活动迅速引爆网络掀起了一波病毒式传播热潮

AI精准生成文字的难题终获突破

让AI在图像中精准生成文字一直是行业难题尽管SDXL和Midjourney新推出的局部重绘功能有所改进但用户反馈显示成功率仍然不高需要反复尝试Ideogram的出现彻底解决了这一痛点立即在用户中引发热烈反响从网友们分享的创作案例可以看出Ideogram的功能已经相当成熟无论是让文字出现在指示牌上完美适应环境光影还是制作咖啡拉花都能轻松应对抽象风格海报的字体设计同样游刃有余更令人惊叹的是只需简单添加提示词”typography”就能大幅提升文字生成成功率不过目前该技术对中文的支持还略显不足

图像生成能力媲美行业顶尖水平

抛开文字生成功能 Ideogram的图像生成质量同样表现出色可以与MidJourney和Stable Diffusion相媲美有技术分析指出如果Ideogram采用了与Imagen完全相同的技术框架但使用谷歌T5作为语言编码模型而非OpenAI CLIP这意味着它在理解提示词中空间关系描述方面具有更强能力已有用户成功生成风格统一的图像系列再结合Pika Labs的视频生成工具更是能制作出电影预告片级别的短片

扩散模型顶级研究团队的实力展现

Ideogram AI的创始团队由7人组成其中4位都是谷歌Imagen论文的共同作者CEO Mohammad Norouzi是多伦多大学计算机科学博士期间获得谷歌ML博士奖学金加入谷歌大脑后曾参与生成模型和神经机器翻译研究同时也是Hinton团队自监督对比学习框架SimCLR的合著者CTO William Chan(陳俊樂)拥有滑铁卢大学和卡内基梅隆大学教育背景2012年加入谷歌先后从事机器学习广告工程和NLP研究联合创始人Chitwan Saharia本科毕业于孟买理工学院2019年加入谷歌现负责Ideogram技术发展Jonathan Ho博士毕业于UC伯克利曾在OpenAI工作一年是去噪扩散模型奠基之作的合著者同时也是Ideogram AI的投资人团队中其他三位成员Shayaan Abdullah曾任职Twitter Jacob Lu曾在亚马逊等公司担任软件工程师Jenny Lei则在谷歌完成软件工程实习

视频生成技术同样领先

值得注意的是Ideogram AI的四位联合创始人在谷歌期间还主导完成了视频生成项目Imagen Video该技术早在一年前就已实现生成1280*768分辨率每秒24帧的高清视频片段

创业团队的前车之鉴与开放策略

Ideogram AI的诞生有着深刻的时代背景无论是Imagen还是其视频生成版本Imagen Video谷歌都出于安全伦理等考虑未向公众开放试玩API或开源代码这一现象近年来困扰着众多从谷歌离职的创业者大模型领域的Transformer八位作者之一Cohere创始人Aidan Gomez就曾直言离开谷歌是因为”没有看到大模型发挥真正力量”而Ashish Vaswani与Niki Parmar创办Adept AI和Essential AI也是因为”谷歌希望用Transformer优化现有产品而我们希望创造新产品”这些经历让新成立的Ideogram AI决心吸取教训采取更加开放的策略最初宣布的1000人测试名额迅速满员 Ideogram AI随后又开放了部分名额量子位上午尝试注册时未遇排队情况可见名额依然有限感兴趣的用户需抓紧机会

试玩地址:https://ideogram.ai

参考链接:[1]https://ideogram.ai/launch[2]https://x.com/ideogram_ai/status/1694024927853129757[3]https://x.com/DrJimFan/status/1694358069638275463[4]https://x.com/WilliamLamkin/status/1694535089575637048

最新快讯

2026年02月10日

16:37
在全球 AI 芯片竞赛趋于白热化的当下,又一家极具实力的半导体玩家正式入场。近日,知名 AI 半导体企业 DEEPX 宣布与神州数码达成战略合作。双方将强强联手,利用 DEEPX 的“高性能、低功耗”芯片技术,全面加速物理 AI 在中国市场的落地应用。精准填补市场空白:不只是 GPU 的替代者目前的 AI 芯片市场,高端有 GPU,低端有各类高性价比 SoC...
16:37
随着 Anthropic 正式发布 Opus 4.6 模型,一场关于 AI 自主编程能力的硬核实验引发了科技圈的热议。Anthropic 安全团队研究员 Nicholas Carlini 近日透露,他利用 16 个 Claude 智能体(Agents)组建了一个“特工团队”,在几乎没有人工干预的情况下,从零开始编写出了一个基于 Rust 语言的 C 编译器。...
16:37
大模型时代的版权之争,或许终于迎来了由科技巨头主导的“和解方案”。亚马逊正计划推出一个全新的 AI 内容市场,旨在筑起出版商与 AI 大模型开发者之间的价值桥梁。告别“免费午餐”,内容授权开启正规化。长期以来,出版商与 AI 公司就训练数据的版权问题纠葛不断。据知情人士在AWS会议上透露,亚马逊的这一新计划将允许出版商直接向科技公司出售内容版权。计费模式变革...
16:37
微新创想:大模型时代的“神仙打架”,竟然打出了几分江湖义气 2 月 10 日,针对近期频繁出现的算力告急问题,月之暗面 (Moonshot AI)旗下的 AI 助手 Kimi 给出了一份极具个性的回应 高峰时段“被挤爆”,Kimi 坦诚算力不足。近日,不少网友发现 Kimi 出现了“间歇性罢工”。 页面频繁跳出提示:“高峰时段算力不足,已切换至 K2.5 快...
16:14
微新创想:17年前的春晚,蔡明和郭达这两位春晚常驻嘉宾表演了小品《家有毕业生》。大学生们一边看着电视屏幕上蔡明老师「费尽心机」帮刚刚大学毕业的儿子「卖土豆」,一边又盯着自己的电脑屏幕,在《QQ农场》种下一颗又一颗的「土豆」。蔡明已成为了一代人的春晚记忆符号,她上一次上春晚,是2019年。而《QQ农场》随着时间的推移,似乎被沉淀在了移动互联之前的时代。 17年...
16:14
微新创想:远离屏幕,更多是因为“脑仁疼”上瘾、爱玩,二十多年前“上线”的智能手机,成了我们最离不开的物件。Eyesafe 报告以当前趋势推算,一个人一生中可能有四分之一的时间都在盯着屏幕,总暴露时长预计超过18万小时,手机在其中“居功至伟”。而人脑的平衡机制,让已经深陷其中的我们开始想要逃离。下了班之后,有意无意地规避手机的使用。海外用户也是如此,德勤此前的...
16:13
微新创想:今年年夜饭吃什么?这个问题的答案,很多人其实早就“吃”过了,不过不是在饭桌上,而是在抖音、小红书等社交平台的视频里。春节临近,年味已经提前上线。有人复刻奶奶的老味道,有人用龙井茶炖出江南年菜,还有人干脆在村里办起厨艺大赛,全村围坐吃席。一场全民参与的“云上年夜饭”,正让年味提前升温。截至发稿前,抖音话题#抖音年味争霸赛已超35亿播放,#春节美食挑战...
15:59
微新创想:2026年2月,峰飞航空科技自主研发的5吨级eVTOL“V5000天际龙”在江苏昆山民用无人机试飞运行基地成功完成垂直起飞、正向转换、反向转换及降落的全流程转换飞行。此次试飞标志着该机型在实际应用环境中的重要进展。 微新创想:V5000天际龙采用了复合翼与三翼面的创新布局设计,使其在空气动力学性能上达到新的高度。机身配备了20台第五代升力电机,不仅...
15:59
微新创想:2026年2月10日,汽车媒体CarScoops发布现代途胜(Tucson)改款原型车路测图。该车为现代旗下最畅销SUV的中期改款车型,于韩国及北美地区进行测试。 新车采用近似封闭式前格栅设计,整体造型更加紧凑。日行灯采用棱角分明的造型,增强了车辆的辨识度和视觉冲击力。车身线条流畅,呈现出强烈的运动感,同时蚌壳式引擎盖的设计进一步提升了车辆的豪华感...
15:59
微新创想:2026年2月10日 银欣正式上线面向单路服务器处理器的高性能一体式水冷散热器XE420 该产品采用全铜镀镍冷头 28mm厚铝制冷排及三颗14034工业级LCP扇叶风扇 集成4000 RPM三相六极水泵 其冷头配备大尺寸微水道铜底板 支持多平台安装套件选配 适配主流服务器与工作站平台 风扇转速800–2500 RPM 最大风量123.8 CFM 噪...
15:59
微新创想:2026年2月9日,谷歌Android新系统Aluminum OS被曝将在桌面端深度集成Gemini。这一消息引起了广泛关注,显示出谷歌在人工智能助手领域的进一步布局。据最新测试版Google App(v17.5)代码显示,Gemini将作为系统级的全局助手,用户可以通过状态栏右上角的图标或“Google键+空格”的快捷方式来启动它。这种设计方式与...
15:59
微新创想:2月10日,上海普陀区万里街道联合淘宝闪购等机构启动“AI+老年助餐”试点项目。该项目面向辖区内的100位老年人发放体验券,旨在通过科技手段提升他们的用餐体验。试点服务支持老年人使用千问APP、天猫精灵等智能终端进行语音点餐,为他们提供更加便捷的订餐方式。 微新创想:此次试点是淘宝闪购首次系统性地将AI语音点餐技术应用于社区老年助餐服务。这一举措不...