大模型“百花齐放” 业界合力“充实”中文语料数据

2023-09-09 03:20:51 来源 : 百度新闻

【资料图】

中新网上海9月8日电 (记者郑莹莹)中国大模型语料数据联盟8日又吸纳了一批新成员，来充实适用于大模型的中文语料数据。中国大模型语料数据联盟由上海人工智能实验室、中国科学技术信息研究所等单位在今年的世界人工智能大会上联合发起成立，致力建设开放型的大模型语料数据生态圈。

上海人工智能实验室主任助理王延峰说，ChatGPT令人惊艳，但它对中文的理解还不尽人意。

9月8日，中国大模型语料数据联盟在上海又吸纳了一批新成员。中新网记者郑莹莹摄

大模型时代带来以数据为中心的人工智能领域新发展，但“投喂”哪些数据备受关注。王延峰在接受记者采访时表示，语料数据不仅要量大，而且要高质量，“就像培养一个孩子一样，投入高质量的教育，才有高质量的‘输出’。”

对于中文语料数据的不足，他表示，中文语料数据对于大模型能力的提升至关重要，业界需要高质量的中文语料数据集。

上海蜜度信息技术有限公司(简称：蜜度)首席技术官刘益东在受访时指出，目前中国国内的大模型训练里，非常缺少高质量的中文语料数据集，“现在很多市面上的大模型主要是基于外文资料，再加上少量的中文资料，这样训练出来的大模型，对中文的理解能力以及对中文内容的生成能力是有欠缺的。”

蜜度是此次加入中国大模型语料数据联盟的9位“新成员”之一。现场，蜜度发布了包含7000多万条数据的开源中文语料数据集。

刘益东说，在大模型“百花齐放”的发展背景下，需要有一些机构或团体去做“公共建设”，去推动这个行业的发展，企业乐于加入其中。

上海市经济和信息化委员会人工智能发展处处长王志佳表示，“百模大战”不是一场零和游戏，携手并进才能把生成式人工智能真正与生产力相结合，把大模型这个“冷灶”真正“烧热”起来。

他指出，建设高质量语料库是大模型产业链的关键环节。大模型语料数据的多元供给需要多方协力、共同推进。(完)

标签：

习近平在黑龙江考察时强调牢牢把握在国家发展大局中的战略定位奋力开创黑龙江高质量发展新局面
2023-09-09
国足主帅明确目标是冲击世界杯热身赛能否三连胜？
2023-09-09
今日白露：露从今夜白秋意日渐浓
2023-09-09
【华商日报】中国年轻一代“粉”上瑶族古老婚俗“嫁郎”
2023-09-09
中建二局安徽分公司联合体中标6.95亿元蚌埠高铁新村安置房项目
2023-09-09
西南地区首座大型抽水蓄能电站开始带电调试
2023-09-09
“海归”女孩逐梦安徽乡村打造田园综合体
2023-09-09
菲律宾一客船沉没致1人死亡另有94人获救
2023-09-09
浦发银行：董事长郑杨、行长潘卫东辞职
2023-09-09
漯河利用外资多项指标跻身河南前列
2023-09-09
山东临沭：政府精准服务企业打造一流营商环境
2023-09-09
大模型“百花齐放” 业界合力“充实”中文语料数据
2023-09-09
商络电子(300975.SZ)：主营业务为代理销售电子元器件产品，不涉及研发生产
2023-09-09
到2027年四川将建成7家天府实验室—中国新闻网·四川新闻
2023-09-09
广西长洲船闸8月过货量近2386万吨创单月历史新高
2023-09-09
2023年中国国际服务贸易交易会落下帷幕
2023-09-09
至纯科技(603690.SH)：与国内半导体下游逻辑领域头部客户均有系统集成及制程设备相关的业务合作
2023-09-09
南大生态智慧城价值起飞保利发展赋能“北转型”崛起
2023-09-09
第九届中国（绥芬河）国际口岸贸易博览会招商招展工作基本完成
2023-09-09
信科移动：9月7日公司高管李秉成增持公司股份合计5800股
2023-09-09
专家谈科大硅谷：有科创才有产业的未来
2023-09-09
中国驻肯尼亚大使馆援助贫民窟学校，改善当地儿童求学前景
2023-09-09
珀莱雅前股东婚变揭股权代持之谜，所涉高管两年套现36亿
2023-09-09
沿着河湖看新疆丨塔里木河生态输水守护两岸“绿色走廊”
2023-09-09
9月8日晚间上市公司利好消息一览(附名单)
2023-09-09
马晓磊会见韩国广州市市长方世焕
2023-09-09
办公场地租赁发票税率是多少
2023-09-09
雄安新区国际互联网数据专用通道开通
2023-09-09
“跨栏女神”夏思凝成为湖南日报社“青春大使”，下一步目标争取突破13秒
2023-09-09
河南息县做实“统战+”文章赋能基层治理
2023-09-09
全国首家绿色旅游联盟在湖南平江成立聚焦绿色旅游高质量发展
2023-09-09
民用运输机飞行关于民用运输机飞行介绍
2023-09-09
优雅粉彩：OPPO Find N3 Flip薄雾玫瑰流露自信魅力
2023-09-09
（高质量发展调研行）指尖非遗出圈又出海
2023-09-09
太湖县沙河初级中学：开学第一课安全进校园
2023-09-09
山西证券参加2023腾讯全球数字生态大会
2023-09-09
四川通报7宗自然资源执法典型案例，村委会无证勘察地热资源被罚—中国新闻网·四川新闻
2023-09-09
柬埔寨旅游升温期待中国游客回归
2023-09-09
“认房不认贷”，杭州今日起实施！
2023-09-09
最难繁体字大全10000个图片_最难繁体字大全
2023-09-09
基于PPE平台打造，全新奥迪Q6 e-tron内饰正式公布
2023-09-09
杭州新能源号牌小客车是否限行？受限小客车特殊情况确需通行怎么办？杭州公安解答
2023-09-09
陕西92岁老汉烧秸秆遭罚写检讨引热议官方：已登门致歉
2023-09-09
蔡国庆：流水时光里，依然激流勇进的人
2023-09-09
荆州区人民路这棵大树太调皮，“上房揭瓦”惹人烦！
2023-09-09
公告速递：嘉实海外中国股票混合(QDII)2023年9月8日暂停申购、赎回及定投业务
2023-09-09
新买的车几年年检一次（新车第一次验车流程）
2023-09-09
9月8日钢价预测：出手！钢价要大跌？
2023-09-09
浦发老将潘卫东黯然退任：业绩滑坡令人震惊，投资者质疑执行不力
2023-09-09
等腰三角形一腰上的中线把该三角形的周长分为13.5
2023-09-09