百度发布首个量子领域大模型,以及百度量子助手和量子写作助手两大AI原生应用,旨在全面推动量子技术与大模型深度融合,释放潜力。百度量子助手降低百度量子平台门槛,提高使用效率;量子写作助手高效创作量子领域文档,促进知识产权沉淀。
智谱AI发布MathGLM数学模型,算术任务性能优于GPT-4。MathGLM数学模型在数学推理方面表现出卓越性能,准确率接近100%,明显优于GPT-4。该模型能够精确计算算术运算,提升中文数学解决能力,对不同年级数学问题和应用题也表现出良好的效果。论文链接:https://arxiv.org/abs/2309.03241Github链接:https://github.com/THUDM/MathGLM模型下载:https://modelscope.cn/models/ZhipuAI/MathGLM
Deci AI推出8.2亿参数的文本到图像潜在扩散模型DeciDiffusion1.0。Deci AI最近发布了DeciDiffusion1.0,这是一项具有8.2亿参数的文本到图像生成模型,速度比传统方法快3倍。它采用了创新的U-Net-NAS架构,通过四阶段培训过程提高了效率和图像质量。用户研究显示,它在图像美学方面有优势,并在与文本描述的匹配上表现良好,为文本到图像生成领域带来了新的创新。项目地址:https://huggingface.co/spaces/Deci/DeciDiffusion-v1-0
百川智能发布闭源大模型Baichuan2-53B并开放API。百川智能发布闭源大模型Baichuan2-53B,该模型在数学和逻辑推理方面表现出显著提升,通过高质量数据体系和搜索方法减少了模型幻觉,并开放了Baichuan2-53B的API接口,进军商业领域。
恒生电子:恒生大模型产品LightGPT已开启内测。恒生电子宣布,恒生大模型产品LightGPT已开始内测,该大语言模型专为金融领域打造,具有更专业、更合规和更轻量的特点。通过海量金融数据训练,提升了对金融相关问题的理解能力,有望推动大模型在金融行业的应用。
度小满“轩辕70B”金融大模型开源。度小满发布了金融行业大模型“轩辕70B”,具有出色的通用能力和专业金融性能。该模型在中文任务评测和金融领域获得高分,是首个参数量级达到70B的开源大模型,具备8k以上的上下文长度。它在预训练阶段融入了专业金融语料,采用加速优化策略,训练效率出色。模型已在开源社区全面开放,为金融领域提供高效的中文基座模型,用户可自定义微调,有望为自然语言处理和信息抽取任务带来新机遇。项目地址:https://github.com/Duxiaoman-DI/XuanYuan
阿里云开源通义千问140亿参数模型Qwen-14B、Qwen-14B-Chat。阿里云于9月25日开源通义千问模型Qwen-14B及其对话模型Qwen-14B-Chat,免费商用。Qwen-14B在多项评测中表现卓越,接近Llama2-70B水平。
聚焦开发者几千元训完中文版LLaMA2!Colossal-LLaMA-2把大模型门槛打下来了!从头预训练大模型过去需要高达5000万美元的投资,但Colossal-LLaMA-2降低了门槛。只需15小时和几千块钱的投入,即可训练出中文LLaMA2大模型,性能接近SOTA水平,完全开源,可用于各领域低成本构建大模型。
融资1亿美元的类ChatGPT模型开源啦!可商用,8个模型生成式AI平台Writer获得1亿美元融资,开源了8个型号的大语言模型Palmyra,包括支持数据微调,适用于多个领域的型号。其中InstructPalmyra-20b支持高级自然语言处理,Palmyra-Med用于医疗保健,Palmyra-Large适用于多种业务场景,性能评测表现出色。Writer成为ChatGPT的主要竞争对手。开源地址:https://huggingface.co/Writer在线免费体验地址:https://app.writer.com/
UCSD研究人员开源Graphologue:将LLM文本响应转化为交互式图表。大型语言模型(LLMs)如GPT-4因其生成各种用户查询的文本响应的能力而广受欢迎。加州大学圣地亚哥分校的研究人员开发了Graphologue,这是一种新颖的技术,旨在通过实时将基于文本的LLM响应转换为交互式图形图表来解决这些限制。Graphologue识别重要的文本组件,将它们组织成图形表示,并从LLM答案中创建节点链接图表,使复杂的关系和概念更容易理解。项目地址:https://github.com/ucsd-creativitylab/graphologue
中国研究团队发布多视角数据集“FreeMan”解决3D人体姿势估计局限性。中国的研究团队合作推出了名为“FreeMan”的大规模多视角数据集,旨在解决现有3D人体姿态估计数据集的局限性。该数据集包含来自8台智能手机的1100万帧视频,跨足了室内和室外环境,具备不同光照条件,提供了更真实的场景多样性。研究者通过自动化的标注流程生成了精确的3D标注,可用于多种任务。这一数据集的开源将推动人体建模、计算机视觉和人机交互领域的进步,弥合了受控实验室条件与真实场景之间的差距。项目网址:https://wangjiongw.github.io/freeman/
Runway推出镜头控制功能,提升AI视频生成。Runway最新功能为AI视频生成带来精准镜头控制,包括运动速度和方向的调整,不仅适用于图像生成视频,还能用于文本生成视频。此举是应对竞争对手Pikalabs的举措之一,两者在AI视频领域竞争激烈,各有优势。AI视频生成领域发展迅猛,文章提到了两者的竞争情况以及未来的发展方向。
中文在线与华为云签署合作协议涉及大模型训练等。华为云与中文在线签署合作协议,重点合作领域包括大模型训练,双方将共同推动数字内容生态的发展。
谷歌或于2027年自主生产AI芯片。谷歌计划自主生产Tensor处理单元(TPUs),摆脱博通依赖,以降低成本,每年可节省数十亿美元。
亚马逊宣布向Claude母公司Anthropic投资高达40亿美金。亚马逊宣布向人工智能初创公司Anthropic投资40亿美元,以加强在云计算领域的竞争。这项交易将使亚马逊的员工和云客户能够早期获得Anthropic的技术,并整合到其业务中。该交易还表明云计算公司正在积极采取行动,以应对人工智能初创公司的崛起。
新研究称,利用AI创作者比人类更环保碳排放更少。最新研究发现,基于人工智能的系统如ChatGPT、BLOOM、DALL-E2和Midjourney在文学和艺术创作方面,与人类创作者相比,碳排放明显减少。
好莱坞编剧就AI和薪酬问题达成“暂定”协议。好莱坞编剧工会(WGA)与电影电视制片和制作人联盟(AMPTP)达成了一项“暂定”协议,结束了长达数月的罢工,涵盖了2023年集体协议、薪酬和AI在剧本创作中的使用等问题,具体条款未公布。
引入Bard后,谷歌Gmail工具生成了一些虚构的电子邮件。谷歌最近将其大型语言模型驱动的聊天机器人Bard引入了一系列产品,包括Gmail、Google Drive、Google Docs、Google Maps以及谷歌旗下的YouTube等。尽管谷歌试图将其新一代生成式AI与已有的产品线相结合,但似乎行动有些仓促。一名记者测试后发现,Bard AI制造了虚假的电子邮件,甚至错误地提供航班信息和虚构的列车信息。谷歌表示Bard扩展仍处于实验阶段,但这一产品引发了隐私担忧,也让人担心谷歌在AI领域可能会犯一些严重错误。
Canalys预测:2027年将有60%的个人电脑兼容AI功能,出货量预计超过1.75亿台。Canalys预测,到2027年,60%的个人电脑将兼容AI功能,出货量预计将超过1.75亿台,兼容AI的个人电脑市场将迎来爆发式增长。
Meta计划推出AI聊天机器人服务「Gen AI Personas」。Meta计划推出名为「Gen AI Personas」的AI聊天机器人服务,旨在挽回社交媒体平台的用户流失问题。然而,Meta的新产品受到了来自Character.AI的直接竞争,后者已经成功吸引了数百万年轻用户。虽然Meta希望通过这一产品吸引年轻用户,但目前的反应复杂,不确定性较大。
Genmo AI秒杀Midjourney!3秒创作视频、图像和3D模型。Genmo是一款基于人工智能的创意产品,通过简单的语言描述,能够快速生成视频、图像和3D模型,为内容创作者、设计师和艺术家提供了强大的创作工具。
豆绘AI:专注为建筑设计从业者提供空间设计AI服务。豆绘AI平台是南京豆绘科技有限公司的产品,专注于为建筑室内园林景观从业者提供空间设计AI服务,包括AI绘图、AI设计助手和AI全景合成。它通过将AI技术与艺术领域相结合,协助用户提高绘画技巧,实现创作效率。体验地址:https://www.douhuiai.com/