哎,AI#
---
创建日期: 2025-04-23
发布日期: 2025-05-31
---
看ta从远处走来,看ta经过、离开,我站在原地,在等什么?
远#
观察者#
我们现在提到人工智能(AI)通常都是指的由神经网络构成的大模型。 严谨来说包含关系是 人工智能(AI) > 机器学习(ML) > 神经网络(NN) > 深度学习(DL)。 神经网络不是什么新鲜事,最早都可以追溯到上个世纪。 我不熟悉这些历史与分类,网络上也能查到,就不在此多说多错。
不同于由人去制定规则,详细定义每个决策应该如何做出, 机器学习将大量现实数据作为模型输入,根据模型计算后产生的结果进行奖惩,调整模型的内部参数让其下次表现得更好。 不指定详细步骤,但模型渐渐产生符合预期的输出,这是个训练的过程。
模型有许许多多的功能,例如翻译、绘画、生成代码、生成文档、生成模型、甚至完成数学题目等等。 现在常见的模型底层应当还是神经网络的连接。 通过简单的连接方式就能实现各种各样的功能,这是很奇妙的事情。 有如电子电路,通过简单的开、关状态,不同的门电路连接,就能构成如今纷繁的电子信息时代,一样的奇妙。 据说精妙的机械设备,也能做出计算器,但其实现,大概不如电子方式那么通用(与快速),也就只能成为艺术收藏品。
我以为模型会像一个个服务一样,各自不断提升独立的能力,然后被按需调用。 像是编程中的各种库一样,有需要了找到对应的库,添加到自己的程序中以扩展自己的能力。 现在的大模型就像内置了很多的功能一样,其背后也可能有许许多多的子模型存在。 需要将这些模型连接在一起,将信息流整合,最终提供有价值的内容。 近来MCP的火热,为模型相互之间、甚至是外部物理世界的沟通建立了渠道。 不过,还是在以模仿人类语言的方式沟通,低效但是通用。
作为一个观察者,我有次和朋友说,感觉最近几年变化不如十年前那时那么大。 朋友却说最近几年才是真正变化大的时候。 我左右看看,才意识到他们已经这么近了。
我的错觉有多方面因素:
自己不爱出门,也不爱与人交换想法
最近几年待着偏远的小镇上,生活也没什么大的变化。
我对技术不敏感,想象力不多
以前的时候也不明白云计算意味着什么,不喜欢相关的话题。 等到实际用上产品后,自己需要用到相关技术后,才慢慢理解。 (但是也有一部分原因是商业炒作常常为概念披上迷幻的外衣,让人困惑)
观点偏向于保守,感觉变化是件很漫长的事情
幼年到青年的变化体感比较明显,容易满足于现状
没有经受非常的苦难,也没有改变的雄心壮志。 为不必要的不确定性去纠结,没有孤注一掷的信心与勇气。
当然也有部分原因是外部因素带来停滞的错觉
或许昨天比前天没什么区别,今天又比昨天没有什么区别。 再抬起头看的时候,才发现别人已经走了这么远。
预期#
如前所述,这些都不是什么新概念了。 2016年的时候,我也学了一些基础知识,前段时间还又遇到了那个网址 Neural Networks and Deep Learning,转眼快10年过去了,我依然没什么进步。 当时想要的功能,大概也就是如今GPT的样子吧。
在新概念出来的时候,总是会有些“出格”的理解。 在神经网络出圈的时候,我们想:能不能把所有数据都提交给模型,然后告诉我们数据是否正常,如有问题,是出在哪里? 再一次,当GPT出圈后,我们想:嘿,你这么聪明,能不能我把这些信息提供给你,然后你告诉我能得出什么结论? 只想一股脑把东西交给人工智能就好了。 而没有意识到,在把数据提交前,应当如何积累、整理、提取有用的信息。
我不喜欢这些技术的命名,容易让不了解的人有误解,但这正是商业运作所青睐的。 可是多数人这种朴素的想法,也是科研、工程追求的方向。
一种方向是提供定制化的输入与输出,让模型专门服务于一个功能,像工业机器人运用在独立的工序上一样。 可是对于各行各业,数据量、能力是有限的,甚至是微不足道的,无法达到训练的结果。
另一种方向是先预训练具备通用输入输出能力的模型,再根据行业需求去调整能力。 也就是训练一个虚拟工程师,再放入到工作环境中去学习。 也类似于仿真人形机器人,基础要求非常高,但是能快速适应新的环境,高效部署。 我写些简单的程序,实现简单的功能,在背后也都是带着一大堆的依赖。 RAG这种方式真的能理解定制提供的内容吗?模型是确实拥有逻辑思维链在处理输入的资料吗?还是依然只是概率的推测呢?
模型能否产生智能? 我不认为当前的模型产生了智能,依然是非线性映射,只是这种映射达到了很高的水平,甚至超越了多数人的知识水平。 像是掌握了渊博学识的人的说话方式,模仿着他们说话,虽然我也分辨不出说话的是人还是机器(通过了图灵测试)。 某种程度上说,语言大模型“盗取”了人类的优质的知识,让所有人都有机会接触与利用。 不具备智能,但是,我也还是如当年一样“谁知道那群天才们能做出什么”,保持敬畏。
当前的大模型主要是训练后作为服务提供的,其能力在训练完成时也就定下来了。 虽然也有联网搜索、或者本地添加材料的能力。 能否在使用的同时也在接受训练修改参数,人就是这样的,吃一堑长一智。 不过这就要求模型能感知外部的世界,交互以理解这个世界……不过这是很危险的。
模型的感知与交互不必同人类一样,不过如此产生的智能就不一定是人类所理解的智能。
发展#
与其质疑联结主义能否带来正真的智能,不如加以利用。 技术的不可预知性才促使我们不断探索。
在个人电脑之初,内存或许只有16K、32K,MHz的处理能力。 在那个时代无法想象现在的参数,也难以想到高智能的设备能存在小小的手机之中。
现如今大模型的算力需求之高、存储占用之大、电量耗费之巨, 是否会在日后亦如旧时王谢堂前燕,飞入寻常百姓家。
每个人能够拥有自己独立的大模型,人机交互的逻辑不再是键盘鼠标屏幕。 (只是说这样产生的内容不是可控可预测的)
依然是那句,用今日的眼光去推测未来,如坐井观天。 未来发展的方向或许全然不在这些范围。 未来也有可能并没有到达现在所想象的模样,不然今天我们该是在浩瀚宇宙中穿梭。
近#
用AI#
我并不是程序员,只是会写些代码,会关注编程相关的内容。 稍微接触AI的地方,主要是使用代码生成。 用过自动填写,用过Copilot,最近也试过Jules,确实很惊艳。 (自己的硬件太烂,所以什么新科技也用不了,只能白嫖些免费的服务)
有时候,有一丢丢庆幸,如果选了程序员的道路或许现在该很焦虑了(不过也有可能有不一样的眼界呢)。 现在已经放弃学会、理解AI了,只管应用。
AI能编程,但是也需要用户了解一些基础知识,才能相互协作。 我还没遇到可以理解我的简单意思,就能生成完全无误内容的情况(可能是我不会用提示词)。 虽然现在代码生成还是需要调教,但已经是带着丰富经验的程序员,能给出优秀模式的样例。 我也大约能在与AI的交互过程中,学会些新东西。
以前喜欢写代码是因为可以实现自己的想法。 软件是成本比较低的创造。
学习编程的乐趣是所有的这些都是人创造的,渐渐地会遇到前人遇到的问题,然后明白为什么有些东西被创造出来了。 理解计算机运行的方式,然后体会各个层次的设计精妙。 (但是也理解,没有一个模式能使用与任意情况,各种各样的需求导致使用各种各样适合的产品) 惊叹于简单的0和1,能创造出如此绚丽的世界。 纯粹的享受理解并应用技术的乐趣,不该由轻易的“无用”否定掉。
但同时也会开始理解,为什么程序员、或者技术本身不重要,需求、应用场景、客户才重要。 实现比技术优雅更重要,至少开始的时候。 很多需求是到了那一步才会出现。 需求也是无尽的,AI可以帮助我们更容易的实现。
可能还是质疑AI能超越已有的知识,创造新模式。 在那之前,厉害的程序员还是在创造。 而我不再(本来也没有)追求这条道路。
与大模型相伴#
年轻的时候有些对于教育孩子的想法,因为自己5岁才开始接触电视,也不想让孩子过早接触电子产品。 不过发现现在的孩子懂得比我们那时多得多,拒绝电子世界应该会无法融入同龄人。 世界裹挟着所有人前进,每种选择都是差异与筛选的过程。
也许大模型不够精确,可是人也是不精确的。 我们的知识来自各种各样的源头,“曾经在这里看到过,那个结果表明”,最终做出决策也是概率的判断。 大模型就像是看了许许多多书的人, 即使不准确、没有形成自己的分析逻辑,也是个巨大的知识库。 有问题去询问,再结合自己的行动验证去判断。
不论大模型是否具有智慧,都可以从AI中去学习。
同时,很多事情也不一定需要非常高级的解决方案。 基础方法,简洁高效。不该白白舍弃积累的智慧。
实#
不需要工作了?#
每每遇到生产力进步的话题, 我们便想,社会会发展成什么样?
从学校毕业,进入社会开始工作到退休,人生一半以上的时间都在工作。 工作有意义吗?我们会不再需要工作吗?
当然我不是指的那种每天非常卷、非常累、做着重复劳动不产生实际价值的工作。 也不是指的那种非常清楚自己想要什么,然后一心扑在上面的毫无疑问的情况。 只是对于多数普通人的能力与状态的提问。 我也会常常觉得自己的工作没有意思,许多的工作其实是没有合适的系统,转而用人的合作去完成目标(低效但是通用性强、韧性高)。
假设人工智能或者人形机器人能接过更多的工作,快速高效地完成 (现在应该还是只把他们看成提升人类工作效率的工具)。 假设工作不再是为了生存、安全、竞争。
“人类可以不用工作了,可以更好的享受生活,去发挥自己的想象力”云云。
首先工作是有意义的,不论是探索边界、还是润滑社会运作、还是创造土壤培养可能性,都有意义。 只是在不同的环境中,工作有不同的形式。 其次工作中能逐渐去理解社会发展的逻辑,同时也思考该如何完成一些事以及完成得更好。 工作是对于心智的磨砺,工作在维护社会向前的过程中,也让人成长。 (也还有,我自己不是自律的人,如果没有外界的要求,我基本上只会虚度。)
需求是无尽的,未知永远会出现,就依然有前进的方向。 用当下的视角去约束未来是自大的。
虚#
重新审视#
我总有一种惯性思维:当前的选择是最好的选择吗?发展的过程中是否有浪费? 这是种不尊重前人成果的想法,否定自我修正的努力。 也不断告诫自己:没有什么最优,最优的标准也会随着环境变化。 但还是忍不住去想。
使用AI,看看生成的结果是否支持我们的选择。 比如 AlphaGo Zero 不是学习人类的经验,而只是用规则来训练,产生的策略也同样选择了先手三三。
AI某种程度上在模仿人类,另一方面也希望能通过用另一个方式去重看来时路,以给人类启示。
因为地球文明已经独立存在有段时间了,却没有其它的智能能够沟通交流,或许自造一个智能能够有不一样的想法。 (通过内向的探索,我们能触碰到存在的意义吗?还是必须得向外去探索?)
再造人类#
我们本意上会希望有一个全知全能的智慧来达到全局最优分配。 这样的智慧是否有自己的局限,需要演化出分工。
人类再造了人类,比自己更强大的、更少缺陷的“人类”。 我们是普通人,局限性很大,有私欲、有生理上的病症、计算力弱、速度也慢。 硅基生命可比我们要“完美”多了。
我们用人类的方式训练他们,将他们作为工具,做着人类愚蠢的工作。 当智能真的产生时,他的感知与计算速度,所思考的内容,将截然不同。 生命的形式不只有人类,智能的形式也不一定要是人类。 由人造就新的智能本就是生命进化的一环,那么新的智能能够接受如此缓慢、愚蠢的环境吗? 新智能离开,人类回到原点,一切都还那样,一切也都不一样了。
若智能真的产生,那人类的智能是否是经过设计的呢? 设计我们的,会是不能企及的“神明”还是不如我们的存在呢?
不要空想了,回到生活中,脚踏实地地往前迈进。
造物主?#
本以为工业是充满标准、确定、结构的,而语言(人类语言+编程语言)是泛化的。 但工业是封闭,或许有不同的需求,或许为了保护自己的利益。
封闭的环境也才能演化出不一样的内容,竞争、筛选。 或许这也是我们这种弱小的生命能不断演化适应的原因。 基于简单的规则,就能带来多样性的繁荣。
如果有一天,能够生成任意的工业产品。 像是有了百宝袋。 无限的能源、随意的创造。 那会是怎样的世界?……人类的私欲,不一定会太好样子。