每周AI大事件 | OpenAI或为AI建应用商店、美图发布视觉大模型、腾讯云行业大模型新进展
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。
Part1动态
[国内要闻]
腾讯云披露行业大模型方案进展,并公布MaaS(Model-as-a-Service)能力全景图。其基于企业痛点和需求,依托腾讯云TI平台打造的行业大模型精选商店,提供涵盖模型预训练、模型精调、智能应用开发等一站式行业大模型解决方案。
商汤科技公布了自己的大模型测试结果,三个测试项目中都超越了ChatGPT。商汤科技自研中文语言大模型名为商量SenseChat2.0”,日前公布的测试显示,MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。
长虹电视旗下大模型“长虹超脑”正式发布,具备感知、理解、创造三大核心能力。同时,长虹推出了全球首台人工智能电视、发布了全球首款多模态交互电视、实现了全球首个电视交互的免唤醒能力。
快手旗下的视频剪辑类产品“快影”和功能拍摄类产品“一甜相机”,已于近期陆续内测包括“AI动漫视频”、“AI文案推荐”、“AI瞬息宇宙”、“AI简笔画“在内的多款AIGC创作功能。
美图公司发布了“懂美学的AI视觉大模型”MiracleVision(奇想智能),为行业客户提供AI视觉解决方案,并与创作者和开发者共建模型生态。
印象笔记开放“印象AI”使用次数限制。据悉,“印象AI”基于印象笔记自主研发的轻量级大语言模型“大象GPT”,并结合国内外大语言模型的混合模型方案,为用户提供开放式写作助手等功能。
据科创板日报报道,腾讯云将在“行业大模型及智能应用技术峰会”公布腾讯云在行业大模型方面的技术方案,以及智能应用升级和产业客户场景的应用进展。重点是面向行业大模型的应用落地,而非聊天助手类产品。
视频号发布了关于创作者规范使用深度合成技术生成内容的建议,要求创作者应对使用虚拟现实、深度合成技术等生成或合成的非真实的音视频内容进行显著标识。
阅文集团CEO侯晓楠发布全员内部信称,将成立重点项目组集中攻坚AIGC技术及其场景应用,让技术能力成为创作者们的强大助力,成为内容生态平台升级的加速器。
金山办公:“WPS AI”相关功能将逐步上线
“WPS AI”相关功能将逐步上线,有望全面赋能公司全线产品。金山办公董事长邹涛说,AI是金山办公重要的产品战略之一,当前公司选择“两条腿走路”,首先会选择和AIGC 、大型语言模型相关的技术服务商合作,通过他们的技术赋能来进行产品研发;同时也在持续接触一些优秀的创业公司。
百家云发布AIGC产品“市场易”大模型
百家云召开线上发布会,发布了业内首款适用于企业市场部内容生产场景的GPT大模型引擎“市场易”。市场易支持SaaS订阅,首家26800元/年,并支持定制私有化部署,无需调用外部模型。
[国际要闻]
最新研究发现,GPT-4的创造力全方位持平或碾压人类。最近,一项有关GPT-4的创造力思维测试火了。来自蒙大拿大学和UMWestern大学的研究团队发现,GPT-4在Torrance创造性思维测试(TTCT)中的得分直接排在了前1%。
特斯拉最近上线了一个新的推特账号Tesla_AI”,并发布了几条推文,介绍了特斯拉在人工智能方面的进展。一些推文称,特斯拉正在打造自主机器人的基础模型。我们的多模态神经网络已经安装在客户车辆上,这些网络采用任意模式,如摄像头视频、地图、导航、惯性测量单元(IMU)、GPS等。
StableDiffusion模型发布新版本:生成图像以假乱真
StabilityAI官方宣布,推出SDXL0.9版本更新,对StableDiffusion进行了优化。与此前的SDXLBeta相比,新版本下的StableDiffusion模型在图片的生成上有着更为明显的优势。
OpenAI计划推出一个应用商店,允许开发者在其自家的人工智能技术之上构建的AI模型进行销售。
在Omdia的一项新调查中,超过一半的受访者表示,,他们使用人工智能来降低成本和提高效率的结果是积极的。
GitHub进行了一项调查,旨在了解有多少程序员正在使用AI工具。结果显示,500名接受调查在美国工作的开发人员中有92%的人表示已经将AI工具整合到了工作中,而70%的人表示这些工具为他们的工作带来了“优势”。
Snap发布SnapFusion:手机生成式AI图像速度缩短至不到两秒
Snap宣布其SnapResearch部门研发出一项新技术,可加快生成式AI艺术创作生成图像的速度。Snap称该新方法为SnapFusion,将通过生成式AI制作图像的时间缩短至不到两秒。他们声称这是「迄今为止学术界发布的最快速度」。
谷歌推出了一项由人工智能驱动的虚拟试穿功能,让购物者可以在各种模特身上看到服装的效果。
纽约州立大学(NYU)的一个研究团队完成了一项看似不可能的任务:他们成功设计了一款没有硬件定义语言的半导体芯片。他们仅仅使用了简单的英语,通过其中的定义和示例来定义和描述半导体处理器,展示了人类的聪明才智、好奇心和基础知识在与ChatGPT的AI能力相结合时所能实现的惊人成就。
出版集团Gannett计划在其用于发布新闻的系统中引入生成式人工智能,这将有助于节省资金并提高效率。然而,该公司表示将确保在使用技术时不会自动部署,而是需要人工监督。
GPT-4在MIT的数学和EECS(电气工程和计算机科学系)本科学位考试中,表现出的能力完全满足毕业要求。而且妥妥地拿下满分!
Part2热门产品
动嘴写代码指日可待!AI代码生成明星项目GPT-Engineer一夜爆火,短短几天狂揽19k星。这是一个根据指示生成代码的AI工具,你只需要「动动嘴」,就能直接构建整个代码库。甚至,它能学习你的代码风格,短短几分钟就能让你搞定编码项目。
LG推CaptioningAI:10秒内为图片提供5句描述和10个关键词
LG发布了一款名为CaptioningAI的生成式AI服务。LG介绍,CaptioningAI基于零次学习技术,使AI可以像人类一样利用其先前积累的经验和知识来解释它第一次看到的物体或场景。平均而言,该服务能在10秒内为一张图片生成5个完整的描述性句子和10个关键词。
日前,Deepmind的一个名为"Bigger,Better,Faster"的AI算法,在只用了两小时的时间内掌握了26个Atari游戏,与人类效率水平相当。这个不需要预先训练模型的算法达到了人类学习的效率,并且需要的计算能力比旧方法少得多。无模型代理直接从与游戏世界的交互中获得奖励和惩罚的信息,并学最佳策略。
普林斯顿大学研究人员AlexanderRaistrick日前发布了一款名为“Infinigen”的开源AI模型,可以帮助人们生成逼真的3D场景。Infinigen是一款基于开源建模软件Blender的免费开源模型,能够通过随机数学规则生成一系列自然界的“植物、动物”场景,并且可以通过输入提示词来自定义地形,并添加“云、雨、雪、雷暴、天火”等自然现象。
日前,Meta平台的人工智能研究部门推出了名为Voicebox的机器学习模型,可以将文本转换为语音。与其他文本转语音模型不同的是,Voicebox能够执行许多未经过训练的任务,包括编辑、去除噪音和样式转换。Voicebox是一种生成模型,可以在英语、法语、西班牙语、德语、波兰语和葡萄牙语等六种语言中合成语音。
Part3观点
阿里陈龙:现阶段的AI,还处于工具和内容阶段
阿里巴巴集团战略规划总裁陈龙表示,现阶段的AI,还处于工具和内容的阶段,大家都在认真地学习,未来更AI原生的一些新兴产业和工作会大幅度增加。
刘慈欣最近在一次活动中表达了自己对以ChatGPT为代表的人工智能可能会给人们带来的影响,回答了人工智能是否会消灭人类的问题。第一个层次就是这种字面意义上的消灭,就是人工智能用某种暴力从肉体上完全消灭人类或是统治世界。一个有很讽刺意义的一件事情:我们人类的无能反而成为我们一个最后的屏障。
在谈及人工智能带来的挑战时,张勇表示,“人工智能的发展可以类比移动互联网,目前所有行业,包括制造业、交通业、金融业等,都会在AI加持下不断升级,虽然有一些行业和岗位会受挫,但随着技术的不断落地,旧的行业消失,新的行业也会出现。”
Meta首席人工智能科学家杨立昆表示,目前像ChatGPT这样的AI系统并不具备人类水平的智能,生成式AI系统甚至不如狗聪明。尽管未来会出现比人类更聪明的机器,但这并不应该被视为威胁。
马斯克表示:「我实际上并没有认为会有人同意这个暂停。但我是想,为了提醒大家记住也要说,『我认为我们应该暂停』」。
Part4深度
前期ChatGPT的访问量增长率惊人,1月份的环比增长率为131.6%,2月份为62.5%,3月份为55.8%,在4月份明显放缓,环比增长率为12.6%,到了5月,这个数字已经变为了2.8%。
污染中文互联网,AI成了“罪魁祸首”之一。AI模型获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。结果就是,我们不得不面对一大堆快速生成的低质量内容,让人眼花缭乱,头晕目眩。
用AI经营餐饮店是一种什么体验?小红书博主“车达|王同学”(以下简称王同学)和朋友们一起开了家三明治店,原本自己做的三明治看起来平平无奇,根据AI的建议重新制作、升级包装后,一下就有网红三明治内味了!
AI浪潮席卷而来之时,时刻瞄准商机的公司CEO们,更是既兴奋、又焦虑,兴奋的是新变革意味着新机遇,同时他们也焦虑在这一场巨变中会被落下。他们焦虑方向的选择,更焦虑落地场景。他们短期内希望AI能够降本增效,但长期来看,更寄希望于把AI当成新的增长驱动力。