Token - 搜索 News

CALM自编码器：用连续向量替代离散token，生成效率提升4倍

如果往上走用完整的词或短语来表示，词汇表会膨胀到无法控制。词级分词得为每种语言的每个词形都建条目，短语级更不用说，光是两个词的组合就能把查找表撑爆。往下走又会碰到另一个极端，字符级模型处理英文ASCII只要95个条目左右，内存占用看起来很好。

7 天

推理成本打到1元/百万token，浪潮撬动Agent规模化“最后一公里”

当模型规模突破单机承载能力时，跨节点通信成为新瓶颈。传统RoCE或InfiniBand网络的延迟远高于芯片内部的总线延迟，通信开销可能占据总推理时间的30%以上，导致企业被迫通过堆砌更多资源来维持响应速度，推高了总拥有成本（TCO）。

4月

月烧35万元token、逼得Claude官方连夜限速，被全网吐槽的中国“榜一 ...

据悉，该榜单的创建者指向了全栈工程师 George Pickett。他本人也是 Claude 的深度用户，一度登榜。他构建了一个编写代码时可以在后台运行的 AI 智能体 CursorBoost，可自动使 .cursorrules 文件保持最新。

腾讯网

推理成本打到1元/每百万token，浪潮信息撬动Agent规模化的“最后一 ...

环球网国内 on MSN

华为云CEO周跃峰谈AI：拒绝“泡沫化”，让每个Token真正提升行业生产力

在近期召开的2025华为开发者大赛暨开发者年度会议上，华为高级副总裁、华为云CEO周跃峰与超百位开发者进行了面对面交流。这位新任掌舵人首次剧透了华为云的新蓝图：面向智能时代，华为云的核心定位是“以肥沃黑土地，赋能行业AI”，华为云要联合开发者，在“黑 ...

8 天

字节跳动，正在变成“Token跳动”

字节跳动紧紧抓住了AI时代的流量——Token（词元），就像计算机时代的存储单位Byte（字节）一样。也让Token调用量多寡，成为衡量大模型竞争力、企业需求、商业化落地的重要指标。字节跳动旗下火山引擎披露，截至2025年12月，豆包大模型日均Token调用量已经超过50万亿，半年内增长200%，比去年同期增长了10倍，在全球仅次于OpenAI和Google。

环球网国内 on MSN

浪潮信息刘军：AI产业不降本难盈利，1元钱/每百万Token的成本还远远 ...

北京2025年12月25日 /美通社/ -- 当前全球AI产业已从模型性能竞赛迈入智能体规模化落地的"生死竞速"阶段，"降本" ...

3 天

AI Coding 生死局：Spec 正在蚕食人类编码，Agent 造轮子拖垮效率，Token ...

在早期， Fine-Tuning 被视为一种直接方案：通过在大模型层面注入领域知识，补充其世界模型的盲区。但实践很快证明，这种方式在 AI Coding 场景下成本高昂、灵活性不足，且难以应对多模型频繁切换的现实需求。相比之下，以 RAG 为代表的 ...

10 天

飞猪《2025旅行AI指数》：Token消耗量涨20倍，日均用户调用次数增7.7倍

12月23日，飞猪发布的《行走的Token——2025年旅行AI指数》显示，2025年飞猪在业内率先落地消费级AI能力，使AI的应用场景从信息生成逐渐走向连接供需、交付服务，智能化、个性化的服务消费体验正在从概念变为现实。飞猪AI平台累计接入214个 ...

中华网新闻频道

Manus官宣加入Meta，上线至今已处理超147万亿个token AI智能体迎来新机遇

AI ...

中国经济网

近年来，乌兰察布紧抓“东数西算”“京蒙协作”等战略机遇，将算力产业作为数字经济“头号工程”持续深耕。自2013年与华为共建首个数据中心以来，已签约53家企业共落地67个数据中心，总投资超2600亿元，签约标准机架超200万架，算力规模超12万P且智算占比超90%。关联产业链条渐具雏形，算力应用场景持续拓展。目前，已承接北京地区京东、字节跳动等企业算力业务超6万P，涵盖自然语言处理、计算机视觉、推荐 ...

14 天

字节跳动 AI 手机合作方案曝光，免收 Token 分成开启“让利换入口”

此次合作的核心在于字节跳动开出了极具诱惑力的“分成方案”。知情人士透露，为了打破此前手机厂商对第三方 AI 的戒备，字节跳动的战略并非简单的技术输出，而是构建一种全新的流量变现路径:包括免收定制开发费与 Token 销售分成，转而让手机厂商直接参与流量分发、会员订阅以及“二次流量”的分成收益。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果