3月16日,百度正式发布文心一言。ChatGPT发布至今不过四个月,很少有大厂能在这么短的时间内敢于推出真正对标ChatGPT的产品,但百度做到了。
它是全球范围内第一个率先研发出类似生产力工具的大厂,尽管还不够完美,但能快速跟上,这本身就令人倍受鼓舞。
(相关资料图)
那么它与chatGPT相比,有哪些优势和差距呢?接下来小编从对中文的理解和数据集训练角度进行分析!
首先,中文理解方面,文言一心的中文理解力更胜一筹,英文能力稍欠缺。测试者用成语“洛阳纸贵”去分别考察文言一心和chatGPT,文心一言不但解释了成语及其来源,还阐释了背后的经济学原理。这说明作为扎根于中文世界的生成式AI,文心一言的中华文化理解力没有让各位网友失望。
另外是数据集方面。目前,ChatGPT没有公布其具体的数据集来源,而对想要做出类似大模型的企业来说,一大障碍是很难获取高质量数据集。百度不缺的就是数据,尤其在中文数据集方面的优势不言而喻。比如搜索引擎抓取了非常庞大的网页库,经过很多精细的处理,可以积累高质量数据。此外,随着百度智能云的发展,百度也积累了很多行业数据。由此,百度构建了面向中文、服务应用、富含知识的多样化训练数据,对文心一言进行有监督精调,使其掌握的知识更精准,更懂中文和应用场景,并建立起人类反馈、奖励模型和策略优化之间的飞轮机制,文心一言融合不同类型数据和知识,自动构造提示,包括实例、提纲、规范、知识点和思维链等,提供了丰富的参考信息,激发模型相关知识,生成高质量结果。当然,现在文心一言在人类反馈的数据上还较为缺乏,不过在开放测试后,人类反馈数据会促进文心一言飞速迭代,从而更好理解人类的意图,给出更为更为准确、符合人类价值观的高质量回答。
总的来说,文心一言在理解能力、回答准确性以及逻辑能力方面都有不错的表现,当然,我们也要承认文心一言与ChatGPT存有差距,不过随着后期用户的更多反馈,以及技术的不断迭代,相信会逐渐缩小差距,巩固自己的优势。#科技#
本人系南京大学在读研究生,笔名Balance,力争每日更新“科技要闻评论、海外编译资讯”,分享与生活有关的科技!
标签:
03-25 05:06:44
03-25 00:09:18
03-24 21:50:55
03-24 20:20:05
03-24 20:11:02
03-24 18:17:16