大模型已基本解决幻觉问题？--丁科技网

2024-11-13 09:19:36

来源：通信世界全媒体孙天

通信世界网消息（CWW）你是否经历过大语言模型一本正经“胡说八道”？大模型在发展初期的幻觉问题尤为严重，所回答问题基本属于“已读乱回”，至于哪家企业的大模型不在本文探讨之列，大家心知肚明，更重要的是大语言模型的幻觉问题有了最新进展。

今日，百度创始人李彦宏公开表示，“大模型基本消除了幻觉”，这对于大语言模型来说是一个巨大的进步，过去一年来大模型的幻觉问题为用户造成了很多困扰，笔者在参加某次业内会议时，有专家明确指出：“我们期望大模型即使不回答也不要输出误导性的错误答案。”

面对大语言模型的幻觉问题，各企业也在全力攻克，尤其头部的一些大模型开发厂商。OpenAl CEO Sam Altman曾指出：“我们正在努力解决幻觉问题，这将需要一年半到两年的时间。”

然而，信息技术行业发展到今天，已经步入到“日日新”的阶段，大型语言模型发展短短两年时间，就已在该领域上取得了巨大突破。

那么，为什么LLM会出现幻觉？360创始人周鸿祎曾一针见血地指出：“目前人工智能存在一个全世界公认的难题——它会产生幻觉，这是大模型本身固有的特性。”也就是说，幻觉问题是大语言模型与生俱来的。

此外，产生幻觉的原因可大致分为三个方面：数据源、训练过程、推理。

具体来看，大语言模型产生幻觉的原因包括数据质量、算法、专业领域知识丰富度、是否拟合等。

从数据质量上来看，大规模数据集中可能存在数据质量问题，例如缺失值、异常值或不一致性，这些问题可能会导致大文本模型输出错误结果。

从算法选择来看，目前大模型已经遍地开花，各家大模型选择的算法各不相同，不同的算法对于大规模数据的处理方式各不相同，选择不恰当的算法可能导致对数据的错误建模，从而产生幻觉。

从专业领域的知识的丰富程度来看，大语言模型在涉及某些专业领域时，会因为知识储备（语料）不充足或者不能理解专业领域的数据，产生对客观事实的错误解读。

从大语言模型训练的角度来看，存在过拟合的问题。模型在训练数据上表现良好，但是对样本外的数据进行测试时表现效果不佳，欠拟合和过拟合的大模型出现幻觉的概率一般较高。

虽然大语言模型幻觉一度困扰开发者和用户，但有人却持有不同的观点——大模型幻觉是非常宝贵的特性，之所以有这样的观点，是他们认为因为“幻觉和创新其实只有一线之隔”，未来，如何破除幻觉和创新的壁垒将是大模型努力的方向。

其实大语言模型发展到今天，面临的不止“幻觉”这一个挑战，如未来随着数据量的巨增，必须要进行模型压缩与优化；多模态模型与大语言模型的结合，将自然语言处理与计算机视觉、语音处理等多模态信息相结合，扩大应用场景。

原创文章

4年前理想李想和特斯拉陶琳说的话，值得所有人深思

TCL上新Mini LED电视，T7L为何“最能打”，Q9L为何“最值得买”？

八年前用A9带火屏幕发声技术的索尼，今年会有OLED新品吗？

都叫“养鲜”冰箱，格力、容声有啥不一样？

财报观察：2024全球智能家电销量第一品牌，讲好新故事？

添可做饭，追觅洗碗

海尔海信洗衣机听劝玩起“滚筒分身术”，三筒分区洗哪家强？

健康守护+空间革命+智慧服务，TCL冰洗创新“三重奏”击中时代刚需

最新文章

4年前理想李想和特斯拉陶琳说的话，值得所有人深思

TCL上新Mini LED电视，T7L为何“最能打”，Q9L为何“最值得买”？

八年前用A9带火屏幕发声技术的索尼，今年会有OLED新品吗？

海信视像发布2024年可持续发展报告：以绿色科技推动可持续发展

都叫“养鲜”冰箱，格力、容声有啥不一样？

财报观察：2024全球智能家电销量第一品牌，讲好新故事？

续航灭霸 +倍强大 vivo Y300 Pro+正式发布

BOE（京东方）f-OLED柔性显示技术策源地论坛举办携手中关村论坛共筑科技创新高地

海信视像2024年营收净利双增，高端稳步增长，蝉联世界第二

精装修热水系统市场外资占优，高端住宅需求点燃新增长（2025年1-2月）

AI家电：技术狂欢还是实用革命?

中国半导体并购潮起

小家电市场表现低迷，2025年小家电市场面临严峻挑战

全球首款！新型手机OLED面板问世：可发声、会变形

空调等家电冲击传统厂商！持股近10年美的彻底清仓了小米：合计套现20亿元

同期唯一2K直屏超大杯！OPPO Find X8 Ultra外观正式揭晓

添可做饭，追觅洗碗

海尔海信洗衣机听劝玩起“滚筒分身术”，三筒分区洗哪家强？

催更效果拉满！高对比度屏+万象分区，TCL T7L&Q9L系列全球首发

健康守护+空间革命+智慧服务，TCL冰洗创新“三重奏”击中时代刚需

家庭互联网标签库

关于我们

微信扫一扫，加关注

商务合作

QQ:61149512