AI绘画领域再起波澜 MidJourney的霸主地位遭遇劲敌Ideogram强势崛起

近日 AI绘画领域传来重磅消息 MidJourney的领先地位正面临前所未有的挑战后起之秀Ideogram横空出世凭借免费注册的初始策略迅速吸引了大量关注目光其最令人瞩目的特性是在图像中精准生成文字这一突破性功能甚至引得英伟达科学家范麟熙亲自上手创作出”It’s over Midjourney”的震撼作品

背后支撑这一创新技术的是Ideogram AI这家由谷歌AI绘画四大核心成员集体离职创办的创业公司总部位于多伦多在成立之初就获得了1650万美元(约1.2亿人民币)的种子轮融资该投资由a16z和Index Ventures联合领投个人投资者阵容堪称星光熠熠包括OpenAI创始成员Andrej Karpathy强化学习领域权威Pieter Abbeel Node.js创始人Ryan Dahl GitHub联合创始人Tom Preston-Werner等业界巨擘甚至连Ideogram AI团队的前任上司前谷歌大脑掌门人Jeff Dean也加入了投资行列

尽管创始团队全部由技术专家组成 Ideogram AI在市场推广方面却毫不逊色他们通过社交媒体发起的二次创作tag活动迅速引爆网络掀起了一波病毒式传播热潮

AI精准生成文字的难题终获突破

让AI在图像中精准生成文字一直是行业难题尽管SDXL和Midjourney新推出的局部重绘功能有所改进但用户反馈显示成功率仍然不高需要反复尝试Ideogram的出现彻底解决了这一痛点立即在用户中引发热烈反响从网友们分享的创作案例可以看出Ideogram的功能已经相当成熟无论是让文字出现在指示牌上完美适应环境光影还是制作咖啡拉花都能轻松应对抽象风格海报的字体设计同样游刃有余更令人惊叹的是只需简单添加提示词”typography”就能大幅提升文字生成成功率不过目前该技术对中文的支持还略显不足

图像生成能力媲美行业顶尖水平

抛开文字生成功能 Ideogram的图像生成质量同样表现出色可以与MidJourney和Stable Diffusion相媲美有技术分析指出如果Ideogram采用了与Imagen完全相同的技术框架但使用谷歌T5作为语言编码模型而非OpenAI CLIP这意味着它在理解提示词中空间关系描述方面具有更强能力已有用户成功生成风格统一的图像系列再结合Pika Labs的视频生成工具更是能制作出电影预告片级别的短片

扩散模型顶级研究团队的实力展现

Ideogram AI的创始团队由7人组成其中4位都是谷歌Imagen论文的共同作者CEO Mohammad Norouzi是多伦多大学计算机科学博士期间获得谷歌ML博士奖学金加入谷歌大脑后曾参与生成模型和神经机器翻译研究同时也是Hinton团队自监督对比学习框架SimCLR的合著者CTO William Chan(陳俊樂)拥有滑铁卢大学和卡内基梅隆大学教育背景2012年加入谷歌先后从事机器学习广告工程和NLP研究联合创始人Chitwan Saharia本科毕业于孟买理工学院2019年加入谷歌现负责Ideogram技术发展Jonathan Ho博士毕业于UC伯克利曾在OpenAI工作一年是去噪扩散模型奠基之作的合著者同时也是Ideogram AI的投资人团队中其他三位成员Shayaan Abdullah曾任职Twitter Jacob Lu曾在亚马逊等公司担任软件工程师Jenny Lei则在谷歌完成软件工程实习

视频生成技术同样领先

值得注意的是Ideogram AI的四位联合创始人在谷歌期间还主导完成了视频生成项目Imagen Video该技术早在一年前就已实现生成1280*768分辨率每秒24帧的高清视频片段

创业团队的前车之鉴与开放策略

Ideogram AI的诞生有着深刻的时代背景无论是Imagen还是其视频生成版本Imagen Video谷歌都出于安全伦理等考虑未向公众开放试玩API或开源代码这一现象近年来困扰着众多从谷歌离职的创业者大模型领域的Transformer八位作者之一Cohere创始人Aidan Gomez就曾直言离开谷歌是因为”没有看到大模型发挥真正力量”而Ashish Vaswani与Niki Parmar创办Adept AI和Essential AI也是因为”谷歌希望用Transformer优化现有产品而我们希望创造新产品”这些经历让新成立的Ideogram AI决心吸取教训采取更加开放的策略最初宣布的1000人测试名额迅速满员 Ideogram AI随后又开放了部分名额量子位上午尝试注册时未遇排队情况可见名额依然有限感兴趣的用户需抓紧机会

试玩地址:https://ideogram.ai

参考链接:[1]https://ideogram.ai/launch[2]https://x.com/ideogram_ai/status/1694024927853129757[3]https://x.com/DrJimFan/status/1694358069638275463[4]https://x.com/WilliamLamkin/status/1694535089575637048

最新快讯

2026年03月05日

09:10
最近,一位中药学专业的女大学生在网络上可是火了一把。她叫小华紫,是湖南怀化通道侗族自治县人,现在是一名大四学生。小华紫从小就跟着外公上山采药,对山里的草药了如指掌。最近,她把自己进山尝草药的视频发到了网上,没想到一下子就走红了。在这些视频里,小华紫背着小背篓,带着小狗,在山里寻找各种草药。她不仅会讲解草药的特性和用途,还会亲自品...
09:10
近日,江西景德镇瑶里景区里一只名叫“赛虎”的网红狗成了大家关注的焦点。这只已经17岁高龄的狗狗,最近身体状况不太好,出现了咳嗽、行走不稳的症状,让不少游客和网友都揪起了心。据了解,赛虎可是景区的“老住户”了,多年来一直陪伴着游客,被大家亲切地称为现实版的“忠犬八公”。赛虎的故事挺感人的。它的主人是一位老爷爷,几年前去世了。家人曾...
09:10
最近国际金价一直在高位徘徊,不少手里有黄金的市民都琢磨着要不要变现。在新街口的一家典当行,一位女士小心翼翼地从包里拿出一本珍藏多年的第三套人民币(纯金)纪念册。她告诉记者,这套纪念册是多年前在银行买的,花了3.3万元,里面有一套和第三套人民币一样的纯金纪念钞,总重57克。她原本是想着既能收藏又能投资,现在听说金价涨得厉害,就想着...
09:10
微新创想:2026年2月13日 南京诺令生物科技股份有限公司正式向港交所主板递交上市申请 建银国际担任独家保荐人 公司成立于2018年 专注于一氧化氮吸入疗法的研发与商业化推广 其核心产品iNOwill是全球首款采用电化学催化法进行iNO治疗的治疗仪 在该领域具有显著的技术优势和市场影响力 截至2025年9月 公司已获得5款产品上市批准 并有4款产品处于研发...
09:10
微新创想:2026年3月4日,X平台用户jakeu+曝光了雷蛇毒蝰V4 PRO专业版白色款的外包装盒,显示该鼠标即将上市。这一消息引起了众多电竞爱好者的关注。毒蝰V4 PRO专业版延续了毒蝰V4系列的经典设计,采用了对称式偏右手结构,进一步优化了人体工学体验。同时,该款鼠标在重量控制方面表现出色,是一款超轻量化的产品,适合需要长时间操作的玩家。 该鼠标配备了...
09:10
微新创想:美国国防科技领域正经历一场由监管政策冲突引发的供应动荡。据TechCrunch披露,尽管Anthropic开发的Claude模型目前仍被美军用于实战支持,但特朗普政府近期发布的一系列重叠且互抵的禁令,已导致大量国防科技承包商加速弃用该系统。 根据最新指令,民事机构被要求立即停止使用Anthropic产品,而国防部则获得六个月的过渡期。然而,在政策尚...
09:10
微新创想:微软近日在其开发者社区发布了一款名为 Phi-4-Reasoning-Vision-15B 的新型开源 AI 模型。这款模型不仅具备高分辨率的视觉感知能力,还能够进行深度推理,标志着 Phi-4 系列的一个重要突破。 作为首个同时具备 “看得清楚” 和 “想得深入” 特性的 “小语言模型”(SLM),Phi-4 的问世将为开发者开辟新的智能应用场景...
09:10
微新创想:微软近日正式发布了全新的开源权重多模态大模型 Phi-4-reasoning-vision-15B。这款模型最大的技术突破在于其具备“自主决定思考时机”的能力——它能够智能判断任务难度,自主选择是快速给出答案,还是启动深度的逻辑推理。这种特性在目前的开源轻量级模型中极为罕见。 作为 Phi-4 系列的新成员,该模型拥有150亿参数,专门针对图像描述...
09:09
微新创想 苹果公司于3月4日向行业合作伙伴发布简报宣布将在Apple Music中引入全新的AI透明度标签制度 此举旨在通过升级元数据管理系统提升平台内人工智能参与创作内容的透明度 根据新规唱片公司及发行商在上传音乐作品时需针对AI生成或AI辅助创作的内容进行主动标注 该功能的核心在于对音频元数据的精细化拓展 发行商现在可以针对歌曲的特定维度包括封面图音轨音...
09:09
微新创想:谷歌今日宣布正式向美国所有英语用户开放其搜索引擎中的Gemini Canvas AI模式 这一举措标志着Gemini Canvas从实验室测试阶段迈入大规模商用阶段。作为谷歌在生成式AI领域的重要布局 Canvas旨在将传统的搜索体验转化为深度协作的创作空间 帮助用户完成从项目规划到代码生成的复杂任务 功能层面 Canvas支持用户在AI模式下直接...
08:34
微新创想:近日,陕西渭南的一处景区引发了网友们的热议,原因竟是景区介绍牌上标注的作者是一个颇为特别的名字——“DeepSeek”。不少游客在看到这个作者名时,都误以为是个外国人的名字,仔细一瞧才发现,这原来是一款人工智能助手的名字。 景区工作人员解释说,这块介绍牌是去年摆放的,上面的内容确实是由DeepSeek生成的,主要是对尧头窑进行一个简单的介绍。他们表...
08:34
微新创想:2026年3月4日,苹果公司在Apple Music平台上线“透明度标签”(Transparency Tags)要求唱片公司及发行商标注音乐内容中AI参与的核心环节 该标签系统涵盖封面、音轨、作曲及音乐视频四类创作元素 适用于“实质性部分由AI生成”的音乐作品 同一作品可叠加多个标签以体现不同创作环节的AI参与程度 苹果公司并未强制要求技术检测,而...