欢迎来到微新创想的[每周AI大事件],这里是您了解AI领域最新动态的窗口,记录了过去一周值得关注的AI热点内容,帮助您把握人工智能领域的最新趋势和发展方向。
### Part1 动态
#### [国内要闻]
1. **百度网盘推出智能助理“云一朵”**
百度网盘正式推出基于大模型的智能助理“云一朵”,这款助理能够帮助用户快速搜索文件和视频、总结知识、翻译文档等。它还能自动分析文档并返回中文结果,快速查找图片,并为视频添加字幕和提取标题。作为基于百度网盘大模型产品文心一言的力作,云一朵旨在重塑网盘市场的新格局。
2. **百度推出通用图像关键信息抽取工具PP-ChatOCR**
百度飞桨团队推出基于文心大模型的通用图像关键信息抽取工具PP-ChatOCR。该工具结合了OCR文字识别和大模型技术,能够在多种场景下提取图像中的关键信息。使用PP-ChatOCR可以快速搭建通用的图像关键信息抽取系统,降低开发成本。
3. **张勇:通义听悟累计用户超55万**
张勇表示,阿里云正在把促进大模型的生态繁荣作为首要目标,积极发展大模型的开源社区。目前,魔搭社区集聚了200多万AI开发者、1000多个优质AI模型,模型累计下载总量超过4500万。
4. **昆仑万维子公司与Meta合作**
昆仑万维旗下子公司天工科技与Meta签订了一项合作协议,合作开发适用于Meta Quest2及其迭代设备上的StarMaker VR版本。一旦开发获得Meta的通过,StarMaker VR版本将在Oculus官方商店上线,实现昆仑万维在元宇宙领域的商业化突破。
5. **清华团队AI创企“生数科技”完成数千万元天使+轮融资**
北京生数科技有限公司完成了数千万元天使轮融资,资金将用于算法研发、产品开发和团队扩充。生数科技是生成式人工智能基础设施及应用提供商,已实现了百亿数据、数十亿参数规模的模型内测,并在多种模态任务中实现了国际领先的效果。
6. **周鸿祎宣布360安全大模型将发布**
360创始人周鸿祎宣布360安全大模型将发布,并已在内部应用中落地。360安全大模型围绕数字安全开展,已与360数字人结合应用于安全态势分析和安全趋势讲解等实际业务中。
7. **OpenAI在中国申请注册GPT-5商标**
欧爱运营有限责任公司(OPENAI OPCO,LLC)近日在中国申请注册2枚“GPT-5”商标,国际分类包括科学仪器、网站服务。
8. **快手公布全模态、大模型AIGC解决方案**
快手公布了他们在大型模型方面的最新进展。他们展示了一种全模态、大模型的AIGC解决方案,该解决方案基于他们自主研发的基座大模型,提供了文本生成、图像生成、3D生成、音乐生成以及视频生成等技术能力。此外,他们还公布了数字人产品“快手智播”。
9. **阅文集团推出大语言模型应用产品“作家助手妙笔版”**
阅文集团在上半年实现了32.8亿元的收入,虽然同比下降了19.7%,但归母净利润却增长了64.8%。阅文集团表示,在2023年,他们看到了AI技术取得关键性突破的机遇,并推出了大型语言模型应用产品“作家助手妙笔版”,为作家提供创作辅助和数据运营等服务。
10. **B站申请“bilibiliAI”商标**
B站关联公司上海幻电信息科技有限公司申请注册“bilibiliAI”商标,该公司成立于2013年5月,经营范围包括企业形象策划、动漫游戏开发、专业设计服务、信息咨询服务等。
11. **小米应用商店:AI绘画等深度合成服务需提供资质**
小米应用商店发布了关于深度合成服务资质的要求,要求提供AI绘画等深度合成服务的开发者提供相应的资质,包括互联网信息服务算法备案、安全评估报告、全国互联网安全管理服务平台审批通过的截图、软件著作权证书或APP电子版权证书、ICP证或ICP备案等。这一要求将于2023年8月15日正式生效实施。
12. **薇娅公司发布AI数字人直播业务 直播成本降至数千元**
薇娅公司旗下子公司谦语智能和羚客发布了AI数字人直播业务和一站式AI智能直播综合平台。谦语智能CEO陶亚表示,传统的品牌直播间每月需要投入15-25万元,而借助AI数字人直播,品牌方只需投入数千元,而且数据效果甚至优于真人直播。
13. **美图旗下美颜相机推出“AI人像精修”专区 涵盖6大AI人像功能**
美图旗下美颜相机推出“AI人像精修”专区,该专区涵盖了6大AI人像功能,包括AI去双下巴、AI表情、AI换背景、AI一键美颜、AI头发、AI路人消除。这些功能针对用户在日常生活中的痛点,旨在提供更好的人像拍照体验。
14. **字节跳动旗下飞书AI助手“MY AI”或将于今年9月发布**
核心要点总结:字节跳动旗下的飞书计划于今年9月正式发布AI助手“MY AI”。该智能AI助手将包括自动汇总会议纪要、创建报告、优化和续写文字内容等功能。在飞书app中,MY AI还可以通过对话形式,帮助用户自动创建日程、搜索公司内部知识库等。该产品功能目前还在推进中,具体的公测及上线时间尚未确定。
15. **中国电信:在通用大模型方面今年还会有新的成果**
中国电信在2023半年度业绩会上公布了上半年的财务数据,营收和净利润同比增长。董事长兼首席执行官柯瑞文表示,中国电信将在通用大模型领域继续取得新成果。他强调了通用大模型的重要性,指出最近发布的TeleChat是真正意义上的大模型。
16. **王小川旗下百川智能Baichuan-53B大模型开启内测**
百川智能发布了新一代大模型Baichuan-53B,这是继baichuan-7B和baichuan-13B之后的第三款大模型产品。Baichuan-53B在知识问答、文学创作等方面表现优异,展现出强大的商业文案创作、文学创作和中文理解能力。
17. **人脸识别技术应用安全管理规定公布**
根据《人脸识别技术应用安全管理规定》,使用人脸识别技术需遵守法律法规,只有在具有特定目的和充分必要性,并采取严格保护措施的情况下方可使用。同时,在公共场所使用人脸识别技术,或者存储超过1万人的人脸信息,需在30个工作日内备案。规定还要求对人脸信息进行个人信息保护影响评估,并限制保存人脸原始图像。此举旨在规范人脸识别技术应用,保护个人信息权益及公共安全。
18. **网易申请“网易玉言”大模型商标**
网易申请注册商标“网易玉言”,该商标与网易伏羲实验室推出的中文预训练大模型相关。该大模型拥有110亿参数,由深层Encoder和浅层Decoder组成。目前,“玉言”大模型已在网易集团内的文字游戏、智能NPC、文本辅助创作等业务场景取得了显著的业务效果。
19. **成都上半年人工智能产业规模达424亿元 同比增长36.9%**
成都市政府官网发布消息,成都布局人工智能产业由来已久,2022年全市人工智能产业规模为616亿元,位列全国第7,产业增速位居全国第1,综合实力排名全国第6。今年上半年产业规模达424亿元,同比增长36.9%。
20. **智源开源中英文语义向量模型BGE支持免费商用**
智源发布了最强开源可商用的中英文语义向量模型BGE(BAAI General Embedding),其在中英文语义检索精度和整体语义表征能力上均超过了社区中的其他同类模型。BGE保持了同等参数量级模型中的最小向量维度,使用成本更低。
21. **元象开源多语言大模型XVERSE-13B可免费商用**
元象XVERSE公司开源了XVERSE-13B,这是一个支持多语言的大语言模型,拥有百亿参数。XVERSE-13B可以用于文本生成、自动化写作、数据分析和知识问答等方面。该模型采用了标准Transformer网络结构,支持8K的上下文长度,是同尺寸模型中最长的,适用于多轮对话、知识问答和摘要等多种需求。
22. **美团正式入股王慧文AI公司光年之外**
根据天眼查App的信息显示,美团旗下的天津三快科技有限公司已全资入股王慧文创办的AI公司光年之外。光年之外成立于2018年,主要经营技术服务和产品销售等领域。
#### [国际要闻]
1. **微软推出大型语言模型分割推理助手LISA**
微软研究院、香港大学和SmartMore的研究人员合作推出了一种名为LISA(Large Language Instructed Segmentation Assistant)的大型语言模型分割推理助手。LISA能够通过复杂的查询文本生成分割掩码,具备复杂推理、世界知识、解释性回答和多对话的能力。
2. **苹果正在开发自己的文本生成器 暂定名为Apple GPT**
根据报道,苹果正在开发自己的文本生成器Apple GPT,表明了对人工智能技术的兴趣。苹果正在与OpenAI、亚马逊和英伟达进行语言模型的测试,选择富士康作为专用服务器的供应商。
3. **英伟达为GH200超级芯片带来HBM3e解决生成式人工智能瓶颈**
英伟达宣布对GH200超级芯片进行了提升,加入了更强大的内存功能。新版本的GH200预计将于2024年第二季度开始生产,并配备更快速的HBM3e处理器,可以满足不断增长的AI模型对内存的需求。GH200还可以通过NVIDIA NVLink与其他Superchip连接,部署用于生成式人工智能的巨型模型。
4. **英伟达L40S GPU将于今秋上市:AI推理性能比A100高1.2倍**
英伟达最近发布了全新的NVIDIA L40S GPU和搭载该加速卡的NVIDIA OVX服务器系统。L40S GPU是L40的升级版,具备48GB GDDR6ECC显存,基于Ada Lovelace架构,包含第四代Tensor Core和FP8转换引擎,性能是上一代GPU的5倍。
5. **OpenAI宣布ChatGPT所有用户已可使用自定义指令功能**
OpenAI宣布,现在所有ChatGPT用户可以在欧盟和英国以外地区通过免费计划使用自定义指令(Custom instructions)功能。这项功能允许用户在每次对话中提供自定义请求或上下文,避免了重复进行调教的麻烦。
6. **英伟达AI Workbench让任何人都可以训练生成式AI模型**
英伟达推出了AI Workbench,旨在使生成式人工智能的创建更加简单和可管理。该工具允许开发者在英伟达的AI平台上开发和部署各种模型,包括个人电脑和工作站。AI Workbench提供了数十万个预训练模型供开发者使用,并简化了定制这些模型的过程。
7. **谷歌搜索推出AI语法检查器 可更正错误句子**
谷歌在其搜索平台上引入了一个语法检查器,通过AI技术分析短语和句子的构造,提供有用的建议。用户可以通过输入短语“语法检查”、“检查语法”或“语法检查器”来激活该功能。当检测到错误时,该语法检查器会对句子进行更正,并突出显示所做的修改。目前该工具在英文中可用,但不会检查违反搜索政策的内容。
8. **亚马逊平台涌现大量AI生成的虚假旅行指南**
亚马逊平台上出现了大量由人工智能生成的虚假旅行指南,声称是由著名作家撰写。这些指南通常包含通用的旅行信息,价格低廉,并且带有虚假的五星级评论。
9. **微软宣布人工智能Bing Chat即将登陆第三方浏览器**
微软宣布其人工智能聊天机器人Bing Chat将很快在第三方浏览器上推出,包括Web和移动设备。这将使Bing Chat能够在除了微软平台之外的其他平台上进行竞争。虽然Bing Chat将在所有第三方浏览器上提供支持,但在微软自家的Edge浏览器中将获得最佳体验。
10. **网站可以阻止OpenAI网络爬虫 避免数据用于训练GPT模型**
OpenAI现在允许网站屏蔽其网络爬虫,以帮助网站运营商防止其内容被用于训练GPT模型。网站可以通过在其Robots.txt文件中明确禁止GPTBot爬虫程序的出现,或者阻止其IP地址来实现屏蔽。
11. **Zoom:其生成式AI工具不会擅自收集数据训练**
Zoom更新了其服务条款,明确表示不会在未经用户同意的情况下使用用户的音频、视频或聊天内容来训练其人工智能模型。虽然之前的政策中存在一些模糊性,但这次的更新为用户提供了更加明确的保证。Zoom在之前因关于以用户数据训练人工智能的政策引发争议,而在本次更新后做出了澄清和承诺。
12. **OpenAI起诉openai域名所有者商标侵权**
OpenAI Inc.对一家拥有域名www.open.ai名为“开放人工智能”的公司提起了诉讼,指控其侵犯了OpenAI的商标并导致消费者混淆。OpenAI称开放人工智能公司及其总裁误导消费者,让他们误认为两家公司有关联。
13. **微软Edge新功能:Bing AI帮你以不同风格重写文本**
微软更新了桌面版Microsoft Edge浏览器,新增了使用Bing AI重写文本的功能。用户可以选择不同的语气、格式和长度来重写文本,并通过Bing AI生成结果。这个功能在移动设备上的SwiftKey键盘应用中已经引入。这个功能可以帮助用户修改和改写文本内容,提供了一种方便快捷的方式。
14. **微软Windows停止支持Cortana 并专注于生成式AI**
微软宣布8月将停止支持Windows上的Cortana,并将其重心转向生成式AI。Cortana将不再作为独立应用程序存在,但在Outlook Mobile、Teams Mobile和Microsoft Teams等应用中仍将提供支持。微软计划在Windows11中引入新的AI功能,如语音访问和AI驱动的Bing。该决定反映了微软对生成式AI的重视,他们希望通过创新和利用AI技术来改善服务并保持竞争优势。
15. **鸿海向苹果独家供应AI服务器**
苹果正大力投资和研发人工智能应用,引发了对AI服务器和数据中心需求的增加。鸿海集团成为苹果的独家授权生产AI服务器的供应商,并通过越南工厂出口,成为首家受益于苹果AI商机的厂商。鸿海在全球服务器市场占据领先地位,与苹果有多年的合作关系,成为苹果的首选合作伙伴。
16. **Brave发布注重隐私保护图像和视频搜索功能**
Brave网络浏览器的开发商Brave Software为了减少对“大型科技”竞争对手的依赖,该公司调整了其搜索引擎,使其能够使用自己的图像和视频索引。该公司表示,Brave Search的图像和视频结果将从其自己的索引中获取。近年来,谷歌搜索因人工智能内容生成导致搜索结果变得更糟。
17. **OpenAI将GPT-4设置ChatGPT Plus付费用户的默认模型**
OpenAI最近为ChatGPT引入了几个新功能,包括示例提示、建议回复和后续问题。另外,OpenAI将GPT-4设置为ChatGPT Plus付费用户的默认模型,以提供更顺畅、便利的体验。用户不再需要手动切换到最新或最先进的公开可用模型。