(资料图片仅供参考)
7月6日,世界人工智能大会在上海世博中心及世博展览馆正式拉开帷幕。在中国电信“算网一体·融创未来”分论坛上,中国电信数字智能科技分公司(以下简称:电信智科)正式对外发布中国电信大语言模型TeleChat,并展示了大模型赋能数据中台、智能客服和智慧政务三个方向的产品。
发布会现场,电信智科副总经理何忠江表示,近年来,人工智能开始爆发性增长,并进入生成式AI时代。中国电信依托云网融合优势,打造了中国电信的大语言模型TeleChat。TeleChat使用大量高质量中英文语料进行预训练,并采用千万级问答数据进行微调。同时,设计了渐进膨胀注意力机制,用于增加模型的间隔采样;研发了自校准微调技术,将迭代后相关性偏差作为强化学习的监督信号,提升强化学习效果;并且利用知识图谱协同增强策略,通过知识图谱增强大模型的预训练和推理能力,减少大模型幻觉现象。
此外,以TeleChat为底座的教育版大模型TeleChat-E在全球大模型综合性考试评测榜单C-Eval上排名第七,前几名包括GP4、ChatGPT等知名大模型。TeleChat-E使用人工收集、标注、整理的高质量领域数据,对TeleChat进行持续效果强化。同时,TeleChat-E对Transformer Decoder的损失函数进行改进,使之更加关注题目答案的生成,提高准确率。
何忠江指出,通过大模型机制,神经网络已经可以愈加拟人化。在当下,电信TeleChat大模型正在与千行百业的信息化解决方案进行融合,在诸多行业实现商业化落地。据了解,本次论坛重点展示了三个大模型赋能行业应用产品,分别为大模型+数据中台产品、大模型+智能客服产品以及大模型+智慧政务产品。
在人工智能发展的巨大浪潮中,中国电信将依托云网融合优势,打造四级智能算力体系,围绕行业应用需求,联合产业链上下游生态合作伙伴,为千行百业量身打造定制化的行业应用大模型,促进各行业数字化、智能化转型升级,为建设数字中国贡献电信力量。
(文章来源:上海证券报·中国证券网)