努力成为工程造价信息资讯类第一门户!

帮助中心 广告联系

广东工程造价信息网-一级造价师,二级造价师,报考条件,考试科目,培训,注册-广东造价信息网

热门关键词: 

  “一本正经地胡说八道”,是许多人对当前开放式内容生成功能不满的方面。7月25日,科大讯飞宣布基于全国产算力训练的深度推理大模型讯飞星火X1再次升级,此次升级的重点就瞄准幻觉治理。

  据科大讯飞研究院院长刘聪介绍,星火X1此次升级取得的最大突破,就是无论是对自身生成内容真实性的把控(事实性幻觉治理),还是在参考外部资料时对原文的忠实程度(忠实性幻觉治理),都有显着改善,大大提升了大模型在行业应用中的可靠性。

  “整体来看,新版本星火X1的综合能力大幅提升,在翻译、推理、文本生成、数学等核心能力上已能对标OpenAI o3等国际一流大模型最新版本效果,多语言能力更是扩展至130余种。”刘聪表示,与此同时,基于星火X1的语音同传大模型也迎来全面升级,教育、医疗、企业应用、代码、科研等行业大模型和智能体均取得新突破,在复杂行业场景任务上进一步满足用户核心需求。

  面对大模型容易“胡说八道”的通病,科大讯飞大模型技术团队提出了基于多路径采样验证及事实性约束强化学习的“幻觉治理技术”。在该技术加持下,大模型在思考过程及回复生成阶段,能实现客观问题与标准答案的深度强对齐,大幅减少了在慢思考下的幻觉率,让大模型回复通用常识及专业知识问题时更加可靠。

  此外,在数据层面,科大讯飞还开创性地提出了基于人类专家数据的通用认知任务数据反写技术,有效地解决了有监督微调下高质量数据获取困难、人工标注费时费力等现实挑战,实现了主观语言类任务文笔和风格化的显着提升。

  星火X1的升级并非只停留在技术层面,其核心价值在于深入解决各行业的复杂场景需求,推动AI真正融入生产生活。得益于星火X1的升级,其在教育、医疗、企业应用、代码、科研等多个行业场景的能力也“水涨船高”,应用更深入。

  例如,借助星火X1的升级赋能,星火医疗大模型在全科辅助诊断、体检报告解读、健康咨询、导医导诊等通用医疗任务上也实现了能力的跃升。其中,在医生辅助诊疗方面,星火应用范围不断扩大,已覆盖从基层全科到三甲专科、从门诊到住院的完整诊疗链条。目前在四川大学华西医院、北京安贞医院、中国科学技术大学附属第一医院等多家知名医院开展试点,效果表现持续亮眼。

  此外,升级后的语音同传技术已全面应用于讯飞双屏翻译机、讯飞AI录音笔及同传服务,并作为2025世界人工智能大会(WAIC)唯一翻译合作伙伴,为大会提供无障碍沟通支持。

  版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:。

  加拿大北部永久冻土地基:回顾当前实践中的岩土工程考虑因素和设计实例 MDPI Geotechnics

推荐阅读

免责声明

本网转载作品的目的在于传递更多信息,涉及作品内容、

版权等问题,请联系我们进行修改或删除!