声明:本文来自于微信公众号 机器之心,作者:冷猫,授权站长之家转载发布。近年来,明星视频生成产品持续迭代升级,凭借简洁易用的操作界面和强大的模型技术,迅速成为大众娱乐的新宠。在生成领域,谷歌的纳米香蕉 nano-banana 以「照片变手办」的超高真实感创意玩法横扫社交媒体,尤其受到宠物爱好者的追捧。这一现象揭示了 AI 生成技术让想象落地的强大能力,激发了全民 AI 创作的浪潮。

PixVerse V5图生视频全球第一 爱诗科技如何引爆一亿人AI创作热潮插图

在 AI 视频创作领域,PixVerse(拍我 AI)上周五启动免费开放周,两天内涌现出大量创意作品。创作者们利用 Nano banana 3D 手办模板和小红书、短视频平台,玩出了衣柜变装的精彩视频,点赞量突破5000。早在两年前,PixVerse 就上线网页端产品,30天内访问量突破百万,成为视频生成领域的元老级玩家。其推出的「拍我 AI」国内版本搭载 PixVerse V4.5底模,凭借「好玩好用的 AI 工具」标签,迅速占领视频生成应用榜首。

PixVerse V5图生视频全球第一 爱诗科技如何引爆一亿人AI创作热潮插图1

对于普通用户,拍我 AI 提供海量热门 AI 视频模板,让创意表达触手可及;对于进阶创作者,文生视频、图生视频、首尾帧、多主体、视频续写等工具,完美支持天马行空的创作思路。更值得一提的是,拍我 AI 早在 veo3 之前就推出音频音效和对口型等音频创作功能,实现视频创作全流程闭环。即日起至9月10日,用户生成任意视频无需消耗积分,可尽情体验爆款短视频创作,释放创意潜能。

PixVerse V5图生视频全球第一 爱诗科技如何引爆一亿人AI创作热潮插图2

拍我 AI 最新发布的 Agent 创作助手功能,将 AI 导演随身携带。用户只需选择模板并上传图片,Agent 即可自动生成5-30秒短片,覆盖当前爆火特效和创意视频,彻底解放繁琐的 Prompt 设计工作。以网红哈基米为例,拍我 AI 不仅生成高质量手办尾帧图,还打造炫酷转场动画,让「照片变手办」成为全民玩法。凭借这些创意功能,拍我 AI 全球用户数已突破亿级,成为全球 AI 视频创作平台的领跑者。

PixVerse V5图生视频全球第一 爱诗科技如何引爆一亿人AI创作热潮插图3

爱诗科技作为拍我 AI 背后的研发团队,在技术创新上持续突破。新一代自研视频生成大模型 PixVerse V5 于8月27日发布,在权威测评平台 Artificial Analysis 测试中,图生视频项目全球第一,文生视频项目全球第二,视频生成能力全面领先。PixVerse V5 的三大核心优势:智能理解、极速生成、更逼真自然,为用户带来前所未有的创作体验。

PixVerse V5图生视频全球第一 爱诗科技如何引爆一亿人AI创作热潮插图4

在智能理解方面,PixVerse V5 采用统一特征空间技术,让用户指令与生成视频实现无缝对接。以「莱特兄弟的双翼飞机进化到喷气客机」为例,拍我 AI 能精准理解模糊指令,生成高质量视频。在极速生成方面,PixVerse V5 将视频生成速度从分钟级提升至秒级,最快5秒即可生成高质量短片,1分钟生成1080P高清视频。通过扩散极致蒸馏技术,爱诗科技将视频扩散生成过程压缩至极少数步骤,实现准实时生成。

PixVerse V5图生视频全球第一 爱诗科技如何引爆一亿人AI创作热潮插图5

在更逼真自然方面,PixVerse V5 通过扩大模型参数规模和高质量训练数据,显著提升审美、复杂动作、运动幅度和光影的还原能力。爱诗科技全面采用自研的视频生成模型 DiT 架构,结合视觉 Transformer 和扩散模型优点,利用全局注意力机制,实现可扩展性强、多模态扩展、生成质量高的优势。PixVerse V5 在模型结构设计、训练策略等方面进行创新,包括专用于视频与图像生成的 Tokenizer、自适应 Attention 结构等,突破创造力上限。

在模型训练策略上,PixVerse V5 采用多模态统一表征、自适应加噪去噪、渐进式训练策略、原生动态分辨率支持等创新优势,有效提升模型理解与生成精度。爱诗科技拥有海量图像和视频数据,为模型预训练和监督训练微调提供高质量数据支持。这些技术革新驱动 PixVerse 模型不断进化,支撑用户生成动作自然、光影真实、物理规律准确的创意视频,满足广告、电商、影视等高标准要求。

随着技术迭代,视频生成已进入创意和美学的新阶段。PixVerse V5 在模型中融入高质量视频数据和人类偏好标注,结合强化学习后训练(RLHF),提升文本-视频对齐精度、动作自然度和美学评分。超可爱的小猫咪舔爪爪、毛茸茸的小窝和字体设计等细节,展现了 AI 对人类审美的深刻理解,为 AI 艺术创作奠定坚实基础。

爱诗科技模型发展历程令人瞩目。从2023年7月开始训练视频生成大模型,到2025年8月底发布 PixVerse V5,仅用两年时间实现技术飞跃。期间每隔数月就有模型迭代,2024年底发布 PixVerse App 产品,创全球最快高质量视频生成模型纪录。从 V3 到 V5,生成速度从10秒进化到5秒准实时,镜头语言、多主体、智能体等里程碑式功能接连上线,推动拍我 AI 成为全球用户量最大的视频生成平台。

AI 视频生成是一场没有终点的马拉松。爱诗科技创始人兼 CEO 王长虎博士表示:「视频是最贴近用户的内容形态。一旦视频生成技术能够落地,它的产品化和商业化潜力可能不亚于大语言模型。」2024年10月 PixVerse V3 上线,标志着普通用户首次用 AI 创造出无法想象的视频,这一刻才是视频生成的「GPT 时刻」。爱诗科技将持续释放视频潜能,让创造的能力真正走向每个普通人。

最新快讯

2025年11月17日

10:36
截至11月12日,债券ETF数量达53只,较年初增加32只,规模从2024年底的1799.87亿元升至7054.23亿元。同期,百亿级债券ETF由5只增至30只,呈现爆发式增长。新品种频出为投资者提供了更多资产配置选择。业内人士认为,债券ETF产品创新加速,未来将有更多新品推出。
10:36
SK集团会长崔泰元在首尔官民联席会议上宣布,旗下SK海力士将投资约600万亿韩元(约合2.9万亿元人民币)建设龙仁半导体集群。该项目位于京畿道龙仁市,规划建设四座大型晶圆厂,其中首座工厂已于今年2月启动建设,预计2027年5月投产。据韩联社报道,由于HBM产品对先进工艺产能需求激增,该项目投资规模远超预期。单座龙仁晶圆厂的产能相当于清州M15X工厂的六倍规...
10:36
吉利汽车今日正式揭晓其高端MPV系列的品牌名称——"吉利银河V系列",并宣布首款车型将于11月21日在广州举行全球首发亮相。这一消息不仅标志着吉利银河产品矩阵的进一步丰富,更彰显了其在新能源汽车领域的战略布局。 据悉,吉利银河产品线已构建起包括M、E、L、A四大系列以及星舰、星耀等多款明星车型的完整产品架构。这一多元化布局不仅覆盖了不同细分市场,更体现了吉利...
10:36
市场监管总局近期正式批准发布两项具有里程碑意义的国家标准——《智能家用电器的智能化技术要求和评价 第1部分:通用要求》与《智能家用电器应用场景 第1部分:通用要求》,标志着我国智能家电行业迈入标准化新时代。这两项标准将于2026年5月1日起全面施行,为智能家电的定义、评价和应用场景提供权威规范 标准从"智能能力"和"场景效果"两大维度对智能家电进行科学界...
10:36
阿里巴巴今日正式宣布千问App公测版上线,这款基于全球顶尖开源模型通义千问Qwen研发的智能助手,标志着阿里在人工智能应用领域实现重大突破。作为阿里AI战略的重要落子,千问App不仅具备强大的智能对话能力,更创新性地融合了办事功能,未来将逐步拓展至办公、地图、健康、购物等多元生活场景,为用户带来全方位的智能化服务体验。 据悉,千问App采用阿里自主研发的最强...
10:36
零跑汽车正式官宣,旗下首款智能精品长续航SUV——全球战略车型A10将于2025年广州国际车展揭开神秘面纱。随着首款预告图的热烈释出,新车极具辨识度的流畅车身线条与时尚跨界设计风格迅速引爆行业关注。尤为吸睛的是,其前后灯组分别采用了独特的"微笑"与"咧嘴笑"点亮设计,这种极具表现力的灯光语言为整车造型注入了鲜明的个性魅力。 零跑CEO朱江明近期在重要媒体沟通...
10:36
明澈科技近日成功斩获数千万人民币A轮融资,投资方阵容强大,由南创投、元禾控股和创谷资本联合领投。这家创新型企业深耕眼部微型器械研发领域,以突破性的技术手段聚焦青光眼等眼科疾病的微创治疗与实时监测,致力于为患者带来更安全、更有效的治疗方案。 经过多年的技术积累,明澈科技已成功构建起包括MIGS(微管青光眼手术)、微针给药系统、高精度传感器以及磁控手术机器人等在...
10:36
2025年11月17日,重庆市渝中区携手顺丰速运创新推出“徒手旅行”行李存包寄递服务,为游客和市民带来前所未有的便捷出行体验。该服务在轨道交通小什字站多个出口精心设置了绿色丰巢智能存包柜,覆盖全天候24小时自助存取寄服务,让旅客出行更加轻松自在。存包柜根据不同需求分为小、中、大三种规格,最大可容纳28寸行李箱,满足各类出行场景需求。市民游客只需通过手机扫码即...
10:36
2023年11月21日,苏州爱得科技发展股份有限公司正式提交北交所上市申请,标志着这家专注于骨科耗材领域的创新企业迈出了资本市场的重要一步。根据公开披露信息,公司计划通过首次公开发行股票募集资金,发行规模在100万股至2,953.0762万股之间(不含超额配售部分),若全额行使超额配售权,则发行总规模不超过3,396.0376万股。此次募资总额预计达到约1....
10:36
微新创想11月17日讯 北京苹果零售店再迎新成员 荟聚店即将盛大开业 备受瞩目的北京荟聚Apple Store正式官宣开业日期 预计将于12月6日上午10时迎来首批顾客 根据官方消息 该店坐落于北京市大兴区欣宁街15号北京荟聚购物中心一层 成为苹果在北京设立的第六家门店 同时也是中国大陆第49家Apple Store的落成 值得注意的是...
10:36
11月17日,阿里巴巴重磅官宣“千问”项目,正式向AI to C市场发起全面进军。当日,基于全球性能顶尖的开源模型Qwen3的千问APP公测版同步上线,凭借其完全免费的使用策略以及与各类生活场景生态的无缝融合,宣告与ChatGPT展开全方位竞争。阿里核心管理层将“千问”项目提升至“AI时代的未来之战”的战略高度,彰显其决心与野心。 目前,千问APP公测版已全...
10:36
谷歌近日宣布NotebookLM平台迎来重大升级,新增强大的图像数据源功能,让用户能够轻松上传各类视觉资料。无论是课堂上的黑板板书、珍贵的教科书扫描页,还是生活中的街拍表格,系统都能自动完成OCR文字识别与深度语义解析,更令人惊喜的是,用户现在可以直接使用自然语言对图像内容进行精准检索。这一创新功能已面向全平台免费开放,旨在为用户提供更便捷的知识管理体验。 ...