
北京正全力建设「人工智能(AI)之城」,北京首家Token(即词元,AI处理文本最小单位)工厂「北京壹号词元工厂」9日落地亦庄,项目一期每日Token产能高达1.4万亿个,此后算力将像电力一样成为稳定、普惠的公共资源。
综合媒体报导,该工厂首创对标电网稳定运行标准,实现7×24小时不间断运行,使算力能像电力一样即开即用。目前,工厂已实现一半任务在6秒内响应、九成任务低于10秒,并同步向全球开源「词元工厂性能基准」,标志着大模型算力供给正式迈入工业化、标准化的流水线时代。
这座面向智能体时代的「新型电厂」由软通动力信息技术股份有限公司建设,未来远期目标将达到日产10万亿Token。软通动力高级副总裁、软通智算总裁刘怡指出,AI任务的算力消耗极大,例如科研人员梳理25年来的数千万份文献撰写学术综述,仅单项任务就要消耗1亿Token。对此,词元工厂给出明确的服务质量承诺,包括服务可用性≥99.9%、首字延迟P90<10秒等指针,全面适配各类复杂AI场景。
伴随工厂落地而开源的「词元工厂性能基准」,是行业首次针对智能体长时运行特征创建的统一性能度量标准。过去,行业普遍缺少面向智能体场景的算力服务评测标准,容易导致「高分低能、参数虚标、用户选择困难」等痛点。该基准的开源,将实现对算力集群真实服务能力的精准评估与公平对比。未来,工厂还将推出「实时监测」等动态监控方法,全面监控Token生成的幻觉率与语义一致性。
此项进展背后,是中国大模型从「一问一答」式的简单对话,加速演进为长周期、多轮次、高不确定性运行的智能体系统,带动Token消耗量急速飙升。数据显示,中国单日Token消耗量在九个月内暴涨四倍,从万亿级跃升至千万亿级;摩根大通更预测,2025年至2030年,中国Token消耗量年复合增长率将高达330%。目前中国国产词元定价约为海外的1/10,价格优势极为明显。
未来,北京壹号词元工厂还将联动张家口、乌兰察布等绿电基地,构建京津冀一体化算力集群,进一步大幅降低各行各业使用AI算力的门槛。
该工厂位于北京亦庄,项目一期每日Token产能达1.4万亿个,目标是把算力做成像电力一样稳定、普惠、可即时调用的公共资源。 工厂首创对标电网运行标准,实现7×24小时不间断服务,并提出可用性99.9%、首字延迟P90小于10秒等指针,强化复杂AI场景支持。 未来它将联动张家口、乌兰察布等绿电基地,形成京津冀一体化算力集群,同时通过开源性能基准,推动算力评测标准化与成本下降。精华 FAQ

