2013年,当国内第一个HTML5微楼书在北大宿舍诞生时,一个年轻创业者的人生轨迹就此改变。来自山东莱阳的89后小伙董少灵,从高中时期就开始创业,先后涉足本地信息分类网站、蛋糕坊、电商网站和翻译服务公司,直到微信公众号兴起,他敏锐地捕捉到了巨大商机。当时,他发现许多企业难以有效运营公众号,客户甚至提出”能否将公司宣传册搬到微信上”的需求,这成为他创业生涯的转折点。
第二年,还在北大国际法学院攻读硕士学位的董少灵正式创立兔展智能,仅凭H5制作平台,半年内就获取了600万用户。9年来,他带领团队自主研发了新一代内容引擎、传播大数据工具、营销云平台、数字人工具等系列产品,如今企业用户规模已突破4000万,覆盖金融、医药、零售、地产、美妆等多个行业。公司不仅高速发展,还备受资本市场青睐,累计获得9轮融资,投资方包括招商局、深创投、投控东海、越秀产业基金等头部机构。
日前,在微新创想主办的2023AIGC技术应用大会上,兔展智能入选2023值得关注的AIGC公司(模型层)榜单,并正式发布以图像视觉为核心的多模态大模型”兔灵”,与以语言为主的多模态模型形成差异化优势。兔展智能创始人、董事长兼CEO董少灵表示,兔灵大模型是一个视觉占比7成、语言占比3成的全新混合体,研发之初就聚焦于解决垂直领域问题,从而更好地防范”幻觉”问题。
兔展智能从推出H5工具到如今的数字内容引擎,始终致力于让客户以更低成本、更快捷的方式生产多元丰富的内容,无需手写前端代码即可生成精美移动端富媒体页面。面对生成式AI浪潮,兔展智能围绕人类叙事的三个环节——交互体验、感官和知识理解,不断精深中国新一代AI数字内容总装线,最终形成了基于兔灵多模态大模型的AIGC内容引擎。
兔灵多模态大模型的关键核心技术是DragonDiffusion AI图像引擎,用户只需框选拖拽即可实现AI图像编辑和再生成,配合DragonAdapter文本到图像扩散模型控制器,可精准控制图片生成结果,满足商用场景需求。DragonDiffusion由北京大学张健老师团队VILLA实验室、北京大学深圳研究生院-兔展智能AIGC联合实验室与腾讯ARC Lab共同研发,属于兔展智能原创的Dragon系列技术,还包括业界首个创意中文字体生成技术Dragon CN Encoder和智能排版布局技术Dragon Layout,与FreeDoM共同构成兔展智能图像视觉素材生成高效、精准、可控的技术框架。
在语言领域,兔展智能重点攻克”防幻觉”这一基础机理,通过科学预测下一个词的概率,避免机器编造不存在的法律案例。以ChatLaw为例,该模型在多个法律测试中表现优异,超越GPT4。董少灵指出:”这与我们在视觉模态中注重精准控制生产的理念一脉相承。”
应用层面,兔展智能从三个环节展开布局:交互环节推出DragonCode智码,大幅提升开发效率;视觉环节通过Chat&Drag-Image智图提供多种图片再生成能力,Drag&Chat交互模式实现精准控制;理解环节推出ChatKnowledge项目,涵盖法律垂直领域跑分第一的ChatLaw,以及即将发布的ChatDocument文件理解大模型和ChatFinance金融研究大模型。
董少灵认为,生成式AI浪潮中会诞生一批杀手级应用,关键在于”Magic Point”——让用户感觉如同变魔术般神奇。兔展智能从创业初期半年获取600万用户到如今突破4000万用户,正是踩准了用户这一心理。十年前,当别人还在发送PPT、Word文档时,兔展就能制作带音乐动画的H5,这种创新体验正是当年的Magic Point。
作为业界首个能精准高效生成创意中文字体的技术,Dragon CN Encoder让用户以极低成本快速生成创意字体,填补了市场空白。董少灵指出,目前99%的工具都是套壳Stable diffusion,没有一款能自动生产中文字体的大模型。这类应用配合国庆节等热点营销极易破圈,例如”中国大模型终于解决中文字体自动生成问题”这一话题本身就具有引爆民族自豪感的潜力。
如今,ChatDocument每天可为用户节省30分钟,ChatFinance成为用户金融顾问,ChatLaw成为用户法律顾问,这些应用都具备成为爆款的要素。董少灵预测,未来谁能帮助设计师解决精准生图问题,谁又能第一个生成中文字体,必将成为行业领导者。
兔展智能之所以既做大模型上层也做底层,是因为使用他人底层无法实现自主可控需求,特别是金融客户的合规要求。董少灵透露,兔灵大模型的多模态比例独特,视觉占7成、语言占3成,而ChatGPT等模型语言占比高达8成。研发之初,兔展智能就决定聚焦垂直领域,从而更好地防范”幻觉”问题。
兔展智能战略与投融负责人董应赛表示,许多公司盲目拥抱大模型,却未想好落地场景,而兔展智能始终从具象客户需求出发形成商业闭环。对于生成式AI,兔展智能坚持”扎硬寨,打呆仗”,在应用层推出上保持克制。去年,面对元宇宙热潮,兔展智能只挑选信息传递效率高的细分场景推出MR短视频;今年春节期间,兔展智能推出AI数字人拜年小程序,但发现平台不给数字人直播流量,本质上仍是”fake story”,因此建议创业者保持理性判断。
相比元宇宙等风口,生成式AI的重要特征是让更多人享受AI普惠化。中国内地Photoshop活跃用户仅300万,而兔展用户达4000万,借助生成式AI,没有专业技能的人也能制作精美富媒体页面。在公共法律服务方面,ChatLaw让毫无法律知识的人也能生成诉状,这显然是一个更庞大的增量市场。
董少灵感慨道:”创业如万米长跑,短期内挣钱可能没问题,但最终赢得比赛的还是认真做事的创业者。”作为创业老兵,他建议创业公司先学会”扎硬寨,打呆仗”,在资金、数据、算力三要素中至少具备其二,并在两个垂类里成为数一数二,再去弥补短板。对于投资人来说,应关注具备能力而非短期热闹的公司,例如兔展智能拥有900T数据和场景优势。
“百模大战”从未发生,应用层机会不可低估。董少灵指出,从资金、数据、算力三要素看,真正做底座的大模型公司不会超过20家,但应用层将涌现上百上千个高存活率应用。生成式AI是对生产力、生产关系的系统性重塑,也是对人类理解智能、理解人、理解自己的启蒙运动+工业革命。未来应用层繁荣是必然,需要的是耐心——与SaaS解决公司问题不同,生成式AI切实解决个人问题,用户付费习惯天然会变好。
董少灵认为,若将大模型视为IaaS,在中国能真正挣钱的IaaS厂商只是极少数,但在IaaS之上却能长出无数杀手级应用。云计算厂商甚至不敌这些应用公司的估值,因此大模型应用层机会不可低估。回顾近一年研发历程,他坦言做大模型是焦虑与兴奋并存——焦虑在于影响短期营收,兴奋在于其社会价值不可估量。
作为多年创业老兵,董少灵给大模型创业者建议:先学会”扎硬寨,打呆仗”,在资金、数据、算力三要素中至少具备其二,并在两个垂类里成为数一数二,再去拼缺少的要素。对于投资人来说,应关注具备能力而非短期热闹的公司,例如兔展智能拥有900T数据和场景优势。董少灵相信:”万事都有因,只要因是对的,果自然就会来。”