AI绘画领域再起波澜 MidJourney的霸主地位遭遇劲敌Ideogram强势崛起

近日 AI绘画领域传来重磅消息 MidJourney的领先地位正面临前所未有的挑战后起之秀Ideogram横空出世凭借免费注册的初始策略迅速吸引了大量关注目光其最令人瞩目的特性是在图像中精准生成文字这一突破性功能甚至引得英伟达科学家范麟熙亲自上手创作出”It’s over Midjourney”的震撼作品

背后支撑这一创新技术的是Ideogram AI这家由谷歌AI绘画四大核心成员集体离职创办的创业公司总部位于多伦多在成立之初就获得了1650万美元(约1.2亿人民币)的种子轮融资该投资由a16z和Index Ventures联合领投个人投资者阵容堪称星光熠熠包括OpenAI创始成员Andrej Karpathy强化学习领域权威Pieter Abbeel Node.js创始人Ryan Dahl GitHub联合创始人Tom Preston-Werner等业界巨擘甚至连Ideogram AI团队的前任上司前谷歌大脑掌门人Jeff Dean也加入了投资行列

尽管创始团队全部由技术专家组成 Ideogram AI在市场推广方面却毫不逊色他们通过社交媒体发起的二次创作tag活动迅速引爆网络掀起了一波病毒式传播热潮

AI精准生成文字的难题终获突破

让AI在图像中精准生成文字一直是行业难题尽管SDXL和Midjourney新推出的局部重绘功能有所改进但用户反馈显示成功率仍然不高需要反复尝试Ideogram的出现彻底解决了这一痛点立即在用户中引发热烈反响从网友们分享的创作案例可以看出Ideogram的功能已经相当成熟无论是让文字出现在指示牌上完美适应环境光影还是制作咖啡拉花都能轻松应对抽象风格海报的字体设计同样游刃有余更令人惊叹的是只需简单添加提示词”typography”就能大幅提升文字生成成功率不过目前该技术对中文的支持还略显不足

图像生成能力媲美行业顶尖水平

抛开文字生成功能 Ideogram的图像生成质量同样表现出色可以与MidJourney和Stable Diffusion相媲美有技术分析指出如果Ideogram采用了与Imagen完全相同的技术框架但使用谷歌T5作为语言编码模型而非OpenAI CLIP这意味着它在理解提示词中空间关系描述方面具有更强能力已有用户成功生成风格统一的图像系列再结合Pika Labs的视频生成工具更是能制作出电影预告片级别的短片

扩散模型顶级研究团队的实力展现

Ideogram AI的创始团队由7人组成其中4位都是谷歌Imagen论文的共同作者CEO Mohammad Norouzi是多伦多大学计算机科学博士期间获得谷歌ML博士奖学金加入谷歌大脑后曾参与生成模型和神经机器翻译研究同时也是Hinton团队自监督对比学习框架SimCLR的合著者CTO William Chan(陳俊樂)拥有滑铁卢大学和卡内基梅隆大学教育背景2012年加入谷歌先后从事机器学习广告工程和NLP研究联合创始人Chitwan Saharia本科毕业于孟买理工学院2019年加入谷歌现负责Ideogram技术发展Jonathan Ho博士毕业于UC伯克利曾在OpenAI工作一年是去噪扩散模型奠基之作的合著者同时也是Ideogram AI的投资人团队中其他三位成员Shayaan Abdullah曾任职Twitter Jacob Lu曾在亚马逊等公司担任软件工程师Jenny Lei则在谷歌完成软件工程实习

视频生成技术同样领先

值得注意的是Ideogram AI的四位联合创始人在谷歌期间还主导完成了视频生成项目Imagen Video该技术早在一年前就已实现生成1280*768分辨率每秒24帧的高清视频片段

创业团队的前车之鉴与开放策略

Ideogram AI的诞生有着深刻的时代背景无论是Imagen还是其视频生成版本Imagen Video谷歌都出于安全伦理等考虑未向公众开放试玩API或开源代码这一现象近年来困扰着众多从谷歌离职的创业者大模型领域的Transformer八位作者之一Cohere创始人Aidan Gomez就曾直言离开谷歌是因为”没有看到大模型发挥真正力量”而Ashish Vaswani与Niki Parmar创办Adept AI和Essential AI也是因为”谷歌希望用Transformer优化现有产品而我们希望创造新产品”这些经历让新成立的Ideogram AI决心吸取教训采取更加开放的策略最初宣布的1000人测试名额迅速满员 Ideogram AI随后又开放了部分名额量子位上午尝试注册时未遇排队情况可见名额依然有限感兴趣的用户需抓紧机会

试玩地址:https://ideogram.ai

参考链接:[1]https://ideogram.ai/launch[2]https://x.com/ideogram_ai/status/1694024927853129757[3]https://x.com/DrJimFan/status/1694358069638275463[4]https://x.com/WilliamLamkin/status/1694535089575637048

最新快讯

2026年03月03日

19:26
微新创想:2026年3月3日 中国电影股份有限公司发布公告称 拟使用不超过54亿元暂时闲置的自有资金进行现金管理 此举旨在提高资金使用效率 增加公司收益 资金来源为公司日常经营中暂时闲置的自有资金 不涉及募集资金 投资范围限于安全性高 流动性好的低风险金融产品 该事项尚需公司董事会审议通过 不构成关联交易或重大资产重组
18:54
微新创想:据知情人士消息,埃隆·马斯克旗下X平台与xAI公司拟全额清偿合计约175亿美元债务。此举由摩根士丹利协调,已于近日通知现有债权人。xAI所发30亿美元高收益债券将按面值117%溢价赎回。资金来源未披露。 此次偿债计划涉及的金额巨大,显示出马斯克旗下企业集团在财务上的重大调整。X平台与xAI公司作为马斯克的重要资产,其债务清偿不仅关系到两家公司的运营...
18:54
微新创想:2026年3月3日,国盾量子副总工程师唐世彪荣获2025年“大国工匠年度人物”称号。这一荣誉不仅是对他个人专业能力的认可,也体现了他在量子通信领域的重要贡献。唐世彪所带领的团队研发的量子手机在央视活动现场进行了展示,这款手机搭载了先进的量子密话功能,基于单光子通信技术,具有不可复制、不可分割的特性,能够实时发现任何窃听行为,为信息安全提供了前所未有...
18:53
微新创想:2026年3月3日,晶泰科技孵化企业ReviR宣布其自主研发的小分子药物RTX-117完成首例受试者给药。这一重要进展标志着该药物正式迈入临床研究阶段。 RTX-117是由晶泰科技与ReviR联合发现的创新药物。作为我国首个基于人工智能技术靶向RNA的小分子候选药物,它代表了药物研发领域的一项重大突破。 此次临床试验在境内合规的临床中心启动,主要目...
18:53
微新创想:2026年3月2日,社交媒体X平台正式推出内置“披露付费推广”标签功能。这一功能位于发帖界面底部旗标中,创作者可一键开启,明确标识商务合作或利益相关帖文。该功能的推出,标志着X平台在内容透明化方面迈出了重要一步。 微新创想:此举旨在提升内容可信度,帮助用户更清晰地区分真实分享与广告内容。对于经常浏览社交媒体的用户而言,这一变化将显著改善信息获取的体...
18:53
微新创想:2026年3月3日,谷歌家居负责人阿尼什·卡图卡兰宣布平台多项更新。此次升级面向全球Google Home用户,重点修复长期存在的交互异常问题,并为集成摄像头设备新增Live Search实时搜索功能。 依托新版Gemini模型,系统可即时理解摄像头画面内容,支持自然语言查询,如“车道上有车吗?”。这一功能的引入,极大地提升了用户在智能家居环境中的...
18:53
微新创想:2026年3月3日,美国医疗费用管理平台Ease Health宣布完成4100万美元A轮融资,由Andreessen Horowitz(a16z)领投。此次融资标志着公司在医疗科技领域的重要进展,进一步巩固了其在行为健康服务管理方面的领先地位。 该公司专注于为行为健康服务提供者打造AI驱动的一体化平台,集成客户关系管理、电子健康档案与收费管理功能。...
18:53
微新创想:2026年3月2日,Efor公司正式完成对ND公司的收购。ND是一家总部位于中国、专注于制药行业调试、确认与验证(C&Q)及质量合规服务的解决方案提供商,以患者为中心理念著称。 此次收购旨在强化Efor在生命科学领域的一站式合规服务能力。通过整合ND的专业资源,Efor能够进一步拓展其在制药行业的服务范围,为客户提供更加全面和高效的解决方案...
18:53
微新创想:在本次MWC大会上 小米正式展示了旗下的超级跑车Vision Gran Turismo 这款充满未来感的赛车一经亮相 便迅速吸引了全球汽车爱好者与科技博主的关注 根据官方介绍 这款概念车在设计之初就追求极致的空气动力学性能 它不仅拥有极低的风阻系数 还具备强大的下压力表现 设计师试图通过创新的车身结构 彻底突破传统超跑的效率边界 在设计细节上 ...
18:53
微新创想:中国 AI 硬件出海再传捷报 2026年3月3日,乐奇 Rokid 宣布对其海外版 AI 眼镜 Rokid Glasses 进行重磅软件升级,正式成为全球首款原生支持谷歌 Gemini 的 AI 眼镜。此次升级不仅提升了产品的功能性,更标志着中国 AI 硬件在全球市场上的重要突破。 此次升级后,Rokid Glasses 彻底打破了单一模型的束缚,...
18:19
微新创想:2026年3月3日,Aqara正式推出集悦妙控屏S1 Plus(Siri版) 这款产品是全球首款支持苹果Siri语音控制的智能家居中控屏,标志着Aqara在智能家庭领域迈出了重要一步 设备配备了一块6.9英寸的高清屏幕,为用户带来更加直观的交互体验。同时,内置的双扬声器和四麦克风阵列,确保了语音识别的精准性和稳定性 用户可以通过简单的“嘿,Siri...
18:19
微新创想:2026年3月3日,宏碁游戏董事长高树国在上市前业绩发布会上表示,公司作为PS5在中国台湾、香港及菲律宾、新加坡的代理商,目前未接到索尼关于主机价格调整的任何通知。 受内存成本上升影响,PC硬件价格波动明显,但游戏主机市场表现相对稳定。高树国指出,游戏主机的迭代周期较长,相较于PC产品,其更新换代频率较低,因此厂商在定价上更具掌控力。 此外,原厂在...