国家数据局:我国日均 Token 消耗量突破 30 万亿,一年半时间增长 300 多倍

国家数据局:我国日均 Token 消耗量突破 30 万亿,一年半时间增长 300 多倍

人工智能 2025-08-16 16:07:05 10小时前

IT酷哥 8 月 14 日消息,据中国新闻网今天报道,国务院新闻办公室今天举行了“高质量完成‘十四五’规划”系列主题新闻发布会,其中国家数据局局长刘烈宏作出了相关报告、解读。

刘烈宏介绍道,2024 年初中国日均 Token 的消耗量为 1000 亿,截至今年 6 月底,日均 Token 消耗量已突破 30 万亿,1 年半的时间增长了 300 多倍,反映了我国人工智能应用规模快速增长。

刘烈宏还指出,中国一直在持续推进高质量数据集建设工作,截至今年 6 月底,中国已建设高质量数据集超过 3.5 万个,总体量超 400PB(409600TB)。

同时,AI 模型训练也推动了数据交易需求,今年 6 月底前中国各地高质量数据集累计交易额近 40 亿元人民币,数据交易机构挂牌的高质量数据集总规模达 246PB(251904TB)。北京数交所的高质量数据集占交易总量的比例从去年的 10% 跃升到目前的近 80%。

中文数据也在国内大模型的训练性能提升方面发挥重要作用,目前中国多数模型训练使用的中文数据占比已超过 60%,有的模型已达 80%。

IT酷哥注:Token(常被称为词元)是计算机科学与自然语言处理领域中的一个基础且重要的概念,通常指文本数据经过分词或标记化处理后的最小单位,其中单位可以是单词、标点符号、数字或其他任何有意义的符号。

文章版权声明:除非注明,否则均为网络转载文章,转载或复制请以超链接形式并注明出处。

相关阅读

  • 知网、中文在线等 26 家单位联合发布国内首份生成式 AI 数据版权倡议书
  • 消息称 ChatGPT 本可更强,GPU 短缺成最大阻碍
  • 360 智脑大模型应用发布会直播(视频)
  • Meta 首席 AI 科学家杨立昆:AI 智力连狗都不如,不应将其视作威胁
  • 京东 AI 大模型官宣 7 月 13 日发布:新上任 CEO 许冉演讲,还有重磅合作
  • 报告称 5 月美国生成式 AI 岗位激增 20%
  • 美图秀秀发布七款 AI 工具:修图一样修视频、打造电影级上镜脸
  • AI 模型 Stable Diffusion 升级:正常生成五指、图像更逼真
  • 中国联通发布鸿湖图文 AI 大模型 1.0,可实现以文生图、视频剪辑
  • AI 图像编辑技术 DragGAN 开源,拖动鼠标即可将狮子 P 转头
  • 英科智能推出 AI 设计的罕见病特效药,已在中美同时启动人体临床试验
  • 成功率 99%,科学家研发语音 deepfake 软件:只需 5 分钟录音即可欺骗语音认证系统
  • 日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病
  • 调查发现 20% 的男性使用 ChatGPT 等 AI 工具“美化”约会资料,提高交流技巧
  • 微软英伟达参投,OpenAI 竞争对手 Inflection AI 获 13 亿美元融资
  • 微软必应聊天周报:改善体育相关话题、向 Skype 开放图片生成工具
  • 学而思网校推出《人工智能第一课》,号称首个基于自研大模型的 AIGC 课程
  • 匈牙利公司推出世界首款 AI 研发饮料,口味、包装均由 AI 完成
  • 热度过去用户兴趣降低:数据显示 ChatGPT 流量在 6 月首次出现下降
  • 中国工程院院士高文:将打造 2000 亿参数自然语言大模型底座,性能对标 ChatGPT
  • 最新资讯

    热门资讯