欢迎来到微新创想的[每周AI大事件],这里是您了解人工智能领域最新动态和发展趋势的专属窗口。过去一周,AI领域发生了诸多引人注目的事件,我们将为您一一梳理,助您把握行业脉搏。
### Part1 动态
#### 国内要闻
1. **《生成式人工智能服务管理暂行办法》发布**
2023年8月15日起,《生成式人工智能服务管理暂行办法》正式施行。该办法坚持发展和安全并重,促进创新与依法治理相结合,明确了生成式人工智能服务的总体要求。办法提出了一系列技术发展和治理措施,包括鼓励创新应用、推动基础技术自主创新、提高训练数据质量等,旨在规范和引导生成式AI服务健康发展。
2. **中科院ChipGPT攻克AI芯片设计**
中科院计算所的ChipGPT项目取得了突破性进展。该项目团队指出,与传统的敏捷方法相比,使用大语言模型的芯片自动设计方法可以减少代码量5.32-9.25倍,并在面积优化方面提升47%。这一成果显著加速了芯片开发进程,并实现了设计的优化。
3. **京东推出言犀大模型**
京东正式推出京东言犀大模型,并发布言犀AI开发计算平台。该平台已启动预约注册,预计8月正式上线,将为开发者提供强大的AI支持。
4. **机器人接入大模型无需训练即可完成复杂指令**
李飞飞团队最新成果——VoxPoser具身智能技术,使机器人可以直接听懂人类的自然语言指令并完成复杂任务,无需额外数据和训练。这一突破性技术将极大提升机器人的智能化水平。
5. **快手搜索内测智能问答产品**
快手方面透露,他们正在进行智能问答产品的内测,为用户在搜索场景中提供智能问答和文本创作等新功能。这是短视频直播行业首个基于大语言模型的应用产品,标志着AI技术在娱乐领域的深入应用。
6. **AIGC半年融资超1000亿**
2023年上半年,涉及生成式AI大模型及其落地应用的企业融资达51笔,投融资金额超过人民币1000亿元。其中,单笔过亿元融资有18笔,显示出资本市场对AIGC领域的热烈追捧。
7. **北京将发4000万元算力券**
北京市经济和信息化局计划通过算力券等形式,支持模型伙伴和模型观察员,降低企业训练成本并提高算力匹配效率。首期算力券预计将资助不低于4000万元的模型伙伴企业,为AI发展提供有力支持。
8. **蓝色光标:出海广告主AI营销工具初代模型将于下半年推出**
蓝色光标在互动平台表示,其针对出海广告主的AI营销工具(垂直行业模型)初代模型将于下半年推出并试运行,为出海企业提供智能化营销解决方案。
9. **中科创达与北京智源人工智能研究院成立AI大模型实验室**
中科创达宣布与北京智源人工智能研究院共同成立”魔方未来联合实验室“,双方将在大模型开发与应用创新等方面展开战略合作,共同推进大模型技术创新与成果转化,促进AI技术在智能汽车、智能机器人、智慧工业、智能物联网等领域的应用落地。
10. **国际要闻**
1. **谷歌更新Bard功能:支持中文对话、朗读内容**
谷歌的AI聊天机器人Bard迎来新功能更新,支持40种新语言和朗读内容的能力。用户现在可以用阿拉伯语、中文、德语、印地语和西班牙语等近四十种语言与AI进行对话。Bard还增加了固定和重命名对话的选项,并具有丰富的控制选项和多模态功能,提升了语言能力、语音回应、控制选项和多模态功能的表现。
2. **马斯克成立AI公司 xAI**
马斯克在推特上宣布,他的人工智能公司x.AI正式成立,目标是理解“宇宙的真实本质”。xAI与推特当前母公司X公司(在架构上)相互独立,但将与X公司及特斯拉密切合作。公司高管团队由马斯克带领,成员来自曾工作于Google、DeepMind、微软、特斯拉等公司的高管,曾负责AlphaCode、ChatGPT等项目。
3. **Meta 即将发布商用版 LLaMA 大模型**
Meta即将发布其人工智能模型的商业版本,使初创企业和企业能够在该技术基础上构建定制软件。Meta表示其LLMs是“开源”的,新模型的细节将公开发布,推动AI技术的开放共享。
4. **Adobe Firefly Web 服务现已在全球推出**
Adobe宣布其Firefly Web服务现已在全球推出,支持100种语言的文本提示。Firefly在网络和Photoshop上已生成超过10亿个资源,这些发布是“Adobe历史上最成功的两个测试版本之一”。
5. **OpenAI 最新模型 GPT-4架构曝光**
OpenAI最新模型GPT-4的所有细节被揭示,包括架构、训练和推理的基础设施、参数量、训练数据集、token数、成本、混合专家模型(MoE)等非常具体的参数和信息,为AI研究者提供了宝贵参考。
6. **Netflix开发新的AI技术实时替换视频背景**
Netflix的研究人员表示,他们可能已经让无处不在的绿幕过时了。Maganta Green Screen(MGS)是一项在影视行业中应用人工智能的创新进展,利用AI的力量增强视觉效果,使其在实时中更加逼真和精确。
7. **特斯拉人形机器人Optimus入驻北美门店**
特斯拉将其最新的人形机器人Optimus擎天柱的模型引入了北美门店,为消费者带来了一个全新的科技体验。此次门店中展示的机器人并不能真正运行,只是为了展示公司未来的美好愿景,希望借助人们对机器人的好奇心,进一步提升其汽车产品的关注度。
8. **AI检测工具容易误判非英语写作为机器生成**
一项研究显示,超过一半的时间里,AI检测器错误地将非英语母语者的写作判断为机器生成。这种错误分类可能对求职者、学生和其他经常根据写作能力评估的人造成困扰。
9. **今年 AI 服务器出货量年增率达70%**
最新报告指出,由于来自美国超大云端服务供应商的订单增加,特别是微软,再加上沙特阿拉伯新增的人工智能(AI)需求,今年AI服务器出货量年增率上看70%,显示出AI市场的强劲增长。
10. **谷歌被指控窃取数百万用户数据训练人工智能工具**
谷歌面临一项广泛的侵权诉讼,指控其未经用户同意,窃取了数百万用户的数据,并违反版权法来训练和开发其人工智能产品,引发了对数据隐私和AI伦理的广泛关注。
11. **OpenAI被知名作家起诉侵犯版权**
美国喜剧演员兼作家Sarah Silverman以及作家Christopher Golden和Richard Kadrey近日在美国地方法院起诉OpenAI和Meta,指控其侵犯版权。他们称,OpenAI和Meta使用了他们的书籍作为训练数据,而没有得到他们的同意。
12. **Edge 浏览器内的 Bing Chat 将具备聊天记录功能**
微软广告和网络服务首席执行官Mikhail Parakhin在回答网友的提问时表示,微软Edge浏览器内的Bing Chat将支持聊天记录功能,提升用户体验。
13. **微软必应吸引近15亿用户使用 Bing AI**
Bing AI是当今最受认可的人工智能工具之一,与ChatGPT的受欢迎程度不相上下。根据最新的统计数据,仅在2023年,就有近15亿用户访问了Bing,显示出其强大的市场影响力。
14. **YouTube推出AI生成的测验功能**
YouTube正在其移动应用程序上尝试使用人工智能生成的测验,旨在帮助观众更多了解教育视频中涉及的主题。该功能还将帮助视频分享平台更好地了解每个视频对某一主题的覆盖程度,推动AI技术在教育领域的应用。
### Part2 产品
1. **商汤绘画大模型 RAPHAEL出手即大作**
商汤大模型团队提出的文生图大模型RAPHAEL,可以生成具有高度艺术风格或摄影风格的图片,速度极快。RAPHAEL通过Space-MoE、Time-MoE和Edge-supervised learning三个组件实现,展现了AI在艺术创作领域的强大能力。
2. **谷歌新插件推理效率比ControlNet高20倍以上**
谷歌最近发布了MediaPipe Diffusion插件,这是一个可在移动设备上运行的低成本可控文本到图像生成解决方案。该插件可以提取条件图像中的特征,并将其注入到扩散模型的编码器中,以实现对图像生成过程的控制。与ControlNet相比,MediaPipe Diffusion插件的推理效率提高了20+倍,在v100上运行甚至可以提速高达100倍。
3. **上海交大发布开源“白玉兰科学大模型”**
上海交通大学在2023世界人工智能大会上发布了“白玉兰科学大模型1.0版”,包括化学合成(BAI-Chem)、神经流体(BAI-NeuroFluid)和科学评测基准(BAI-SciEval)三个领域模型,展现了AI在科学领域的应用潜力。
4. **清华&中国气象局大模型登Natur精确预测极端天气**
清华大学与中国气象局合作开发的大模型“NowcastNet”成功解决了极端降水天气临近预报的世界级难题。该模型能够在公里尺度下预报0-3小时的极端降水,包括短时强降水、暴风雨、暴雪、冰雹等,为防灾减灾提供了有力支持。
5. **百川开源最强中英文百亿参数模型!超越LLaMA**
百川智能正式发布了参数量130亿的通用大语言模型Baichuan-13B、对话模型Baichuan-13B-Chat及其INT4/INT8两个量化版本,成为中国开源大模型领域的重要里程碑,展现了国产大模型的强大实力。
6. **文生视频AI Pika Labs:做广告、电影都不在话下**
一款名为Pika Labs的文生视频AI火了。该AI能够生成非常流畅的视频,甚至可以用于广告和电影制作。从Pika Labs生成的一些视频片段来看,整体的表现十分出色,展现了AI在视频创作领域的巨大潜力。
7. **ChatGPT上线GPT-4以来最强应用“代码解释器”**
OpenAI为其语言模型ChatGPT引入了一项名为“代码解释器”的新功能。该功能可以让用户拥有更好的交互编程体验和强大的数据可视化能力。用户可以在其ChatGPT配置文件中启用代码解释器选项,并将其用于数据分析、图表创建、文件编辑和数学计算等任务。代码解释器被认为是OpenAI GPT-4最强大的功能之一。
8. **ChatGPT神器Code Interpreter终于开放**
OpenAI已正式推出Code Interpreter,这是其针对ChatGPT Plus用户的官方插件。Code Interpreter允许用户直接在ChatGPT界面中编写和执行Python代码,从而实现数据分析、创建图表、编辑文件等任务。这项新功能受到了早期采用者的好评,他们称赞其实用性和自动执行复杂任务的能力。
### Part3 观点
1. **AMD CEO:人工智能将主导芯片设计行业**
AMD首席执行官苏姿丰强调,AI是芯片设计的方式,尤其是在测试和验证方面,并将AI确定为未来的首要战略重点,展现了AI在科技领域的引领作用。
2. **斯坦福大学:大多数大语言模型不符合欧盟AI法案**
斯坦福大学著名的以人为中心的人工智能研究所(HAI)表示,对10个主要基础模型的调查显示,它们“基本上不”遵守欧盟的人工智能法案。得分最高的基础模型是Bloom,紧随其后的是EleutherAI的GPT-NeoX和Google的PaLM2。OpenAI的GPT-4排名第四,Cohere的Command跻身前五,引发了对AI伦理和法规的思考。
3. **报告称:高技能工作岗位更容易受到AI影响**
报告显示,高技能职业可能最易受人工智能(AI)影响,当然AI当前对就业的影响尚未完全显现。研究进一步将“高技能白领工作”定义为最易受AI影响的职业,包括商务专业人员、经理、首席执行官和科学工程专业人员,引发了对未来就业市场的关注。
4. **比尔·盖茨:人类已准备好应对人工智能带来的重大风险**
比尔·盖茨表示,人类已经准备好处理人工智能带来的重大风险。尽管他无法回答人工智能可能导致的灭绝威胁,但他对能够应对人工智能带来的风险持乐观态度,展现了人类对AI发展的理性思考。
5. **腾讯张立军:游戏已成为推动芯片、AI等技术发展的强大驱动力**
腾讯公司副总裁、华东总部总经理张立军表示,在过去半个多世纪里,游戏与前沿科技一直处于一种紧密的共生关系之中。在用户不断提升的体验需求驱动下,游戏总能及时地拥抱和应用最前沿的科技成果,反过来,游戏也成为推动芯片、AI等技术发展的强大驱动力。
6. **迪士尼米奇配音演员:AI永远无法捕捉米奇老鼠的精髓**
迪士尼吉祥物米老鼠的配音演员艾万表示,AI是当今好莱坞正在关注的一个话题,推动人工智能的技术确实很了不起,但根据他的观点,它永远无法捕捉米奇老鼠的精髓,引发了对AI在文化领域应用的思考。
### Part4 深度
1. **GPT-4被曝“变蠢” OpenAI偷偷搞“小动作”?**
近期,有用户在OpenAI的在线开发者论坛中反映,GPT-4的质量似乎有所下降,变得更“蠢”了。用户指出,GPT-4在长篇内容的分析和创作上退步明显,并且写作质量下降。一些开发者也表示,GPT-4在逻辑能力、编码能力等方面都出现了问题,出现了循环输出代码、错误响应等情况。有专家猜测,OpenAI可能在创建一些较小的GPT-4模型,这些模型类似于大型模型,但运行成本较低。
2. **AI“入侵”内容平台,创作者狂喜?**
AI在内容平台上的大规模应用。知乎、百家号、网易号等平台都推出了AI辅助创作的功能,包括AI笔记、AI大纲、AI标题等。这些AI工具能够帮助创作者提高创作效率,扩大内容池。然而,AIGC的泛滥也带来了一些风险,如内容质量的下降和对人工创作者的冲击。平台和创作者都需要借助AI的力量不断学习和进步,以适应这个时代的变化。
3. **大模型加速涌向移动端!ControlNet手机出图只需12秒**
随着大模型技术的发展,移动应用的人机交互方式正发生革命性变化。高通公司在CVPR2023上展示了搭载15亿参数的ControlNet模型在手机端的运行,仅需不到12秒就能完成出图。高通AI负责人Ziad Asghar表示,将10亿+参数的大模型部署到手机只需要不到一个月的时间。大模型的出现将使终端设备上的数字助手能够通过自然语言指令完成各种操作,实现个性化的用户体验。通过量化、编译和硬件加速优化等技术,大模型在终端侧的部署变得更加容易。这一变革不仅限于手机,而是将重塑包括笔记本电脑、汽车、物联网等终端设备上的所有移动应用。高通将领导这场变革,并成为推动大模型落地的核心。
4. **ChatGPT最强竞品Claude2重磅升级 第一手实测在此**
Anthropic发布了Claude2,被称为GPT-4最强竞品,免费且不需要排队即可使用。用户可以通过邮箱注册登录,并享受比GPT-4便宜4-5倍的价格。Claude2支持上传和分析长文档,可以提取摘要并回答相关问题。用户可以构建自己的知识库,实现更高效的学习和研究。此外,Claude2还有代码解释器和小学数学能力,对于程序员和学生来说非常实用。
5. **ChatGPT潮落 资金逃离AI概念股**
ChatGPT的受欢迎程度正在下降,网站流量出现负增长。受欢迎程度的下降也对股市产生了影响,许多人工智能概念股都出现了大幅下跌。然而,有迹象表明大型语言模型正在转向B2B市场,OpenAI开放了GPT-4API,百度和阿里巴巴等其他公司专注于为B2B应用程序开发大型模型。尽管ChatGPT的受欢迎程度有所下降,但更多杀手级应用程序正在开发中。
6. **更具情感的大模型,会给人类带来什么?**
文章讨论了人工智能开发中对情商(EQ)的日益关注及其潜在应用。它提到了诸如Character.ai和Inflection AI的Pi之类的例子,它们优先考虑EQ以提供与用户更加个性化和同理心的互动。文章强调了情感人工智能的独特优势,包括其理解人类情感和社交互动的能力。像Westlake Mindworks这样的公司,这些公司正在致力于开发具有长期记忆和高级情绪分析功能的人工智能,展现了AI在情感领域的巨大潜力。