一篇关于AI对话展现的数值判断问题

最近很热的话题是询问AI讨论:9.9和9.11哪个大?AI给出9.11更大 的错误答案。为什么会出现这种问题呢?
一种解释是:因为缺乏正确的语境理解能力和背景知识。提到“9.11”时,通常指的是2001年9月11日发生的美国恐怖袭击,而不是一个数值。比较时候AI会给出错误答案。
如果从技术的角度看,是什么原因导致的呢?
抛砖引玉一下,如果是单纯比较数值大小,因为浮点数在计算机中的存储和表示是有限的,可能会存在精度丢失的情况,进而出现比较的问题。例如代码

public class Example {
    public static void main(String[] args) {
        float num1 = 9.11f;
        float num2 = 9.9f;

        if (num1 < num2) {
            System.out.println(num1 + " 小于 " + num2);
        } else if (num1 > num2) {
            System.out.println(num1 + " 大于 " + num2);
        } else {
            System.out.println(num1 + " 等于 " + num2);
        }
    }
}

在精度丢失的情况下,9.11 被认为比 9.9 更大hhh,一种好的方式应该是用减法来规避精度丢失带来的问题。

同时也看到了比较权威的大牛回答:

文字是个有限集,数字是个无限集。GPT模型不善于处理无限集,GPT的设计就让它很难识数。

GPT模型,就是个“预测下一个词(next token prediction)”的“猜词游戏”。在预测的时候,需要计算每个候选词的概率,取最大那个作为下一个词。进而,控制候选词的数量,就能减小计算量。自然数是个无穷集合,就不可能每个数字都能成为一个候选词。实际的词表大小常常是5w-20w。而中文词、英文词是有限集合,而且还不大,所以,GPT能轻松处理得很好。
如果你问“既然是分词的问题,那我们换个分词的方法就好了?”答案是否定的。模型进行预训练之前第一件事就是确定词表。GPT的词表是结合BPE(byte pair encoding)编码方式来做的。把几个billion的文本,进行统计,如何用最少的token数覆盖整个文本。就像我国1956年确立了简体字,之后用起来了就不能随意改字了。搞数学最好的是woldfram模型,它是做文本分析,尝试精准提取数学符号,硬编码计算规则。它就和GPT的算法相去甚远了。

LLM在做特定计算任务的时候其实是并不理解计算规则,只是按next-token-prediction去预测下一个token,这样很难保证答案正确的稳定性。一般针对这类计算题会采用工具或者代码的方式来进行计算,也就是说LLM先根据题目生成代码,然后工具执行代码来得到答案。

例如腾讯云AI代码助手的回答结果是区别其他对话的结论的,可以尝试体验下解放双手的代码搭子!

 

内容概要:本文围绕可变桨叶四旋翼无人机的规范控制与点对点运动模拟展开,重点研究优化推力分配策略在翻转动作中的应用与性能比较。通过Matlab代码实现,构建了四旋翼动力学模型,并设计了多种控制算法以实现精确的姿态调整与轨迹跟踪。研究对比了不同推力分配方案在执行高机动性翻转动作时的稳定性、能耗效率与响应速度,旨在提升无人机在复杂飞行任务中的动态性能与控制精度。该仿真研究为无人机飞控系统的设计与优化提供了理论依据和技术支持。; 适合人群:具备一定自动控制理论基础和Matlab编程能力,从事无人机控制、飞行器动力学或机器人系统研究的科研人员及研究生。; 使用场景及目标:① 实现四旋翼无人机在三维空间中的精确点对点运动控制;② 对比分析不同推力分配策略在执行翻转等高难度动作时的控制效果与能耗表现,优化飞行性能;③ 为无人机自主飞行、特技飞行及复杂环境下的机动控制提供算法验证平台。; 阅读建议:此资源以Matlab仿真为核心,建议读者结合相关控制理论知识,深入理解代码实现细节,重点关注动力学建模、控制律设计与推力分配模块。在学习过程中,应动手调试参数,复现文中翻转动作的仿真结果,并尝试拓展至其他复杂飞行任务,以加深对无人机控制机理的理解。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值