三级在线不卡,沧海电视剧57全集在线观看,l1fqv112rg成人未删减版,天天向上2017全集在线观看完整版,国产制服91一区二区三区制服,大尺度未删减版电影排行,麻豆精品乱码一二三区别

關(guān)注我們
荊楚網(wǎng) > 最新播報

國內(nèi)多數(shù)模型訓練使用中文數(shù)據(jù)占比超60%

發(fā)布時間:2025年08月19日08:56 來源: 人民日報

記者從國家數(shù)據(jù)局獲悉:中文數(shù)據(jù)在國內(nèi)大模型的訓練性能提升方面發(fā)揮著重要作用。國內(nèi)多數(shù)模型訓練使用的中文數(shù)據(jù)占比已經(jīng)超過60%,有的模型達到80%。中文高質(zhì)量數(shù)據(jù)的開發(fā)和供給能力持續(xù)增強,推動我國人工智能模型性能快速提升。

在人工智能時代,Token(通常所說的詞元)是處理文本的最小數(shù)據(jù)單元。國家數(shù)據(jù)局局長劉烈宏介紹,2024年初,我國日均Token的消耗量為1000億,截至今年6月底,日均Token消耗量已經(jīng)突破30萬億,1年半時間增長了300多倍,反映了我國人工智能應用規(guī)模的快速增長。

【責任編輯:劉建維】