大模型已基本解决幻觉问题？--丁科技网

2024-11-13 09:19:36

来源：通信世界全媒体孙天

通信世界网消息（CWW）你是否经历过大语言模型一本正经“胡说八道”？大模型在发展初期的幻觉问题尤为严重，所回答问题基本属于“已读乱回”，至于哪家企业的大模型不在本文探讨之列，大家心知肚明，更重要的是大语言模型的幻觉问题有了最新进展。

今日，百度创始人李彦宏公开表示，“大模型基本消除了幻觉”，这对于大语言模型来说是一个巨大的进步，过去一年来大模型的幻觉问题为用户造成了很多困扰，笔者在参加某次业内会议时，有专家明确指出：“我们期望大模型即使不回答也不要输出误导性的错误答案。”

面对大语言模型的幻觉问题，各企业也在全力攻克，尤其头部的一些大模型开发厂商。OpenAl CEO Sam Altman曾指出：“我们正在努力解决幻觉问题，这将需要一年半到两年的时间。”

然而，信息技术行业发展到今天，已经步入到“日日新”的阶段，大型语言模型发展短短两年时间，就已在该领域上取得了巨大突破。

那么，为什么LLM会出现幻觉？360创始人周鸿祎曾一针见血地指出：“目前人工智能存在一个全世界公认的难题——它会产生幻觉，这是大模型本身固有的特性。”也就是说，幻觉问题是大语言模型与生俱来的。

此外，产生幻觉的原因可大致分为三个方面：数据源、训练过程、推理。

具体来看，大语言模型产生幻觉的原因包括数据质量、算法、专业领域知识丰富度、是否拟合等。

从数据质量上来看，大规模数据集中可能存在数据质量问题，例如缺失值、异常值或不一致性，这些问题可能会导致大文本模型输出错误结果。

从算法选择来看，目前大模型已经遍地开花，各家大模型选择的算法各不相同，不同的算法对于大规模数据的处理方式各不相同，选择不恰当的算法可能导致对数据的错误建模，从而产生幻觉。

从专业领域的知识的丰富程度来看，大语言模型在涉及某些专业领域时，会因为知识储备（语料）不充足或者不能理解专业领域的数据，产生对客观事实的错误解读。

从大语言模型训练的角度来看，存在过拟合的问题。模型在训练数据上表现良好，但是对样本外的数据进行测试时表现效果不佳，欠拟合和过拟合的大模型出现幻觉的概率一般较高。

虽然大语言模型幻觉一度困扰开发者和用户，但有人却持有不同的观点——大模型幻觉是非常宝贵的特性，之所以有这样的观点，是他们认为因为“幻觉和创新其实只有一线之隔”，未来，如何破除幻觉和创新的壁垒将是大模型努力的方向。

其实大语言模型发展到今天，面临的不止“幻觉”这一个挑战，如未来随着数据量的巨增，必须要进行模型压缩与优化；多模态模型与大语言模型的结合，将自然语言处理与计算机视觉、语音处理等多模态信息相结合，扩大应用场景。

原创文章

多场景AI加持，ROG 9将游戏性能进行到底

钟睒睒认为“价格就是产业导向”，有没有道理？

传苹果或推自有品牌电视，中国品牌通关全球高端市场难度要增加？

中国电视真正登顶全球的方法，可能在三星和索尼手里

卢伟冰点出了传统家电业的短板

蒸镀和印刷，OLED不排他

从便携三维影像扫描到“电子导盲犬”，IISC直击索尼创新

继京东方之后，TCL华星也推技术品牌，背后目的何在？

最新文章

AMD被曝将进军手机领域！推出“Ryzen AI”移动SoC

光伏制造行业新规正式发布，业界评论：针对性极强

工业5G模组价格大幅下跌，是利好也要警惕

小米Mini LED电视跃升至全球第三，Mini LED正成为购买首选

2025年家电以旧换新补贴还将继续吗？

英伟达涨幅不小！RTX 5090售价曝光：国行至少1万5了

赛力斯联手平安产险：行业首个智驾保障服务计划推出

多场景AI加持，ROG 9将游戏性能进行到底

钟睒睒认为“价格就是产业导向”，有没有道理？

传苹果或推自有品牌电视，中国品牌通关全球高端市场难度要增加？

快手山野音乐会唱响青城山，放大地缘特色、焕新城市名片

可灵AI面向B端重磅升级 API新增高品质模型和视频延长功能

快手理想家边丽：新媒体发展使得房产经纪房产主播融合成趋势

践行绿色低碳发展理念海信视像发布碳中和目标和路径图

杜比实验室携手小红书推动社交媒体视频体验新升级小红书 app 现已支持用户分享和观看杜比视界视频

第二代家电接班人看好实体店马来西亚不能照搬中国模式

从“家电产品”到“医疗器械”，聊聊射频美容仪注册那些事

时代的眼泪！苹果要彻底封杀3.5mm接口：相关转接设备已停售

曝海尔将收购汽车之家：明年1月后对其裁员30%

“苹果电视”传闻又起，竞争如此激烈的电视行业还有新品牌入局？

家庭互联网标签库

关于我们

微信扫一扫，加关注

商务合作

QQ:61149512