
国产大模型领域再传捷报,中国电信人工智能研究院(TeleAI)近日正式宣布开源星辰语义大模型TeleChat3系列,为我国AI自主可控进程注入强劲动力。该系列模型包含国内首个基于全国产算力训练的千亿参数细粒度MoE模型——TeleChat3-105B-A4.7B-Thinking,以及采用稠密架构的TeleChat3-36B-Thinking,两者均依托上海临港国产万卡算力池完成训练,基础训练数据规模高达15万亿tokens,标志着我国在超大规模AI模型自主研发方面取得重大突破。
全栈国产化:打造自主可控技术典范TeleChat3系列深度适配华为昇腾生态,全面验证国产软硬件栈支撑千亿级大模型的能力。具体表现为:- 支持昇腾Atlas800T A2训练服务器高效运行;- 基于昇思MindSpore框架开发,实现全流程国产化;- 训练与推理环节完全运行于国产AI算力基础设施。这一系列举措不仅为行业提供了一条安全可靠的技术路径,更对保障AI基础设施供应链安全具有深远战略意义。

创新”Thinking模式”:实现AI推理过程可视化TeleChat3全系引入独创的Thinking(思考模式)机制,通过在对话模板中加入特定引导符号,模型可自动生成中间推理步骤,显著提升复杂任务中的逻辑性与准确性。在知识问答、数学推理、内容创作、代码生成、智能体(Agent)六大核心维度,其性能已与国际主流头部模型持平。以数学题求解为例,模型不再仅输出答案,而是完整呈现”理解题意→拆解步骤→公式应用→验证结果”的思维链,大幅增强可信度与可调试性。
开源开放:构建产业协同生态目前,TeleChat3系列模型权重、推理代码及使用示例已全面上线GitHub与魔搭(ModelScope)平台,面向学术研究与商业应用开放。中国电信表示将持续推动模型在政务、通信、能源、金融等关键领域的落地应用,助力”人工智能+”行动深入行业核心场景。
AIbase深度观察:国产大模型迈入新阶段TeleChat3的发布,不仅是技术成果的集中展示,更是中国AI产业自主可控战略的实质性落地。当千亿级MoE模型能在纯国产算力上高效训练,当”思考模式”性能逼近国际先进水平,国产大模型正从”可用”向”好用”乃至”敢用”的跨越式发展。在全球AI竞争日趋”地缘化”的今天,中国电信以TeleAI为支点,正在构建一条安全、开放、高性能的国产AI技术栈。这条创新路径的持续完善,或将决定中国在未来智能时代的话语权格局。

项目地址:https://github.com/Tele-AI/TeleChat3
