我对ChatGPT的理解和思考
2023-4-20
| 2023-7-10
0  |  0 分钟
type
status
date
slug
summary
tags
category
icon
password
Property
Jul 10, 2023 05:04 AM
从ChatGPT出世到现在快半年了,这半年它给我们带来许多革新性的消息,大量的资本向它靠拢,人们也有保不住饭碗的危机感。作为数据工作者,ChatGPT对我来说不是那么陌生。
近几个月也体验了ChatGPT,它带给我的感受确实很惊艳,提出各种各样的问题,都能回答的不错。获得知识变得比原来更容易了。网络上有很多关于ChatGPT的新闻,大多数是关于AI革命,人工智能突破了,要夺走我们饭碗之类的。于是也开始对GPT做了一些深入了解,其中有很多问题都是GPT给我的答案,今天想在这里把我对GPT的理解总结一下。

一、ChatGPT没有意识,它是仿生人类学习的语言模型

1. 先简单的了解一下ChatGPT

ChatGPT是个大语言模型,那为啥叫大语言模型?我特意问了行业内的专业人士,大模型的要素是“超多的数据量、超多的计算集群、超多的模型参数“。
这几天工作中和同事聊天,他说他回家的路上下载了一个英文词典大全,有2mb的大小。GPT3训练使用了45tb的数据,45tb基本上也都是文本数据,所以训练gtp3的数据量级是一本字典的23,517,744,000(百亿)倍。我们不经感叹,一个英文字典的实体书拿在手上沉甸甸的,里面的内容可能我们一生也读不完整,但它仅仅只有2mb的大小。
gpt的回答:
notion image
在参数数量和训练资源上,GPT3有1750亿个参数,用了数千个高端的GPU进行了训练,是个典型的大模型。同事们说其实GPT就是“大力出奇迹”,因为数据、参数量级上来了,在语言的理解和表达上就越来越准确。

2. 训练语言模型核心是模拟人脑训练过程

我们从出生那一刻开始就在持续的接收数据开始训练了。想想看,你听到的声音、触摸到物体的感受、闻到的气味、看到的图像都会转化成信号,传输入到你的大脑中,并且默默地接受慢慢的训练,且一直持续。在训练的过程中,好的不好的感受你都会体会到,别人的反馈,会让你知道什么是对的,什么是错的。这个过程对于人来说,会持续一生,活(训练)到老学到老嘛。
语言的训练模型就是这个原理,很多人比喻它是鹦鹉学舌的过程。训练它的数据就是在互联网上产生的数据。这也是它远远远强于人类的地方,它汇集了整体人类的“智慧”。
notion image

3. ChatGPT是否能取代人类?

网上关于人工智能时代来临了,要取代人类了,灭杀人类的新闻吹的天花乱坠,一时间让很多人信以为真。我通过实际体验ChatGPT的功能,是真的让人感觉在和一个人聊天。
在早些年,我们在网上客服上和机器人沟通就是定式的,感觉很刻板。例如早期的微软小冰,对话过程是没有这么柔性的衔接的。一是不能联系上下文,二是回答的问题很刻板,让你很明显感觉它是机器。但ChatGPT的产品体验已经非常接近人了,让机器能够和人顺畅的通过自然语言对话,至少这种感觉非常真实,这种突破确实让人觉着机器有了生命,于是它带给人们的恐惧感就扑面而来,这本身就是人们的普遍心理反应。
ChatGPT本质上就是个大力出奇迹的计算效果,它根据你的输入,来算出回答概率最高的答案。它没有意识,只有你和它说话,它才会回答你,它不会主动和你沟通。

二、ChatGPT在人机交互上的革新

ChatGPT不是技术革命,它的技术很早就出现了,它在这个时间出现,是必然的,因为现在满足了训练模型的大数据量和大计算量基础。对产品来说,想象的空间还是挺大的。
我认为,ChatGPT的真正突破在于人机交互上的革新。刚体验ChatGPT的时候,我觉着它很神奇,它什么都会,还能帮你做很多事,写文章、回答一些天马行空的问题,还能写代码,搭建个小网页,给我一种无所不能的感觉。它具备了理解你的意思,并帮助你做事情的两个最基本能力。
那为什么说ChatGPT的突破在人机交互上?作为一个老产品人,人机交互是产品经理工作中非常重要的一环,我们会花费很多时间来研究人机交互,设计页面结构、功能、画原型、想尽办法提高用户产品使用体验。
说白了就是怎么能够让自己的产品好用,怎么让用户不用花费太多的学习成本快速的上手自己的产品。简单的说人机交互就是功能按钮、页面的布局摆放,往深了说,它要研究人的心理,要通过数据进行交互统计,对用户体验度量,要了解用户的心智,好的产品体验在人机交互上一定做的很好。
但是以往的人机交互,我们努力的方向是让人来适应机器
我们通过良好的设计,把用户限定在一个条条框框里(交互框架),核心目的就是让机器能够在这个框架中充分理解人的“动作’,因为我们无法通过眼神、肢体动作、语言来让机器直接理解我们意图,我们必须把产品的实际功能摆放出来,让用户理解产品功能,逐步摸索用法。这个过程实际上是人与机器在交互上的折中方案,人不能无所顾忌的让机器随心所欲干什么事情。
notion image
好的交互体验无需说明书,更贴近人的本性。举个简单的例子,苹果手机的屏幕使用方式(交互)(2007年乔布斯发布的iphone一代机),从二岁的孩子到80岁的老人,不用教,看别人用两次就会了。因为这个设计符合人的一般使用习惯。现在的应用程序,拿ios应用来讲,产品设计基本都使用苹果给出的基本交互框架,或者基于这个框架衍生发展出来的。例如底层页、瀑布流、九宫格、tab页的设计等等。
所有的业务服务都会通过拆解业务过程,选择合理的交互框架进行功能的组装,最后形成一个完整的交互逻辑,就是用户看到的产品样子。复杂的可以看看微信、支付宝这些超级应用,都离不开苹果1代发布的交互框架。
人与人的沟通是情景式的,是随机的,每个人的表达方式又不同,通过语言让机器理解人表达的意思并执行命令想想就很难。试想机器要和刚会说话的孩子、80岁的老人、全世界200多个国家的人,得诺贝尔奖的科学家、老师、司机、学生、等等不同的角色来沟通是件多么不容易的事,全球80亿人有80亿种表达方式,从机器的角度来看,理解这80亿人的表达就是一个无限集,是无边界的。
ChatGPT的出现,打碎了传统的交互边界,让人机交互有了更多的可能。
设想未来,我们可以有自己的私人gpt,他可以帮你整理历史的聊天记录,例如整理我们2018年去云南的的照片,然后生成一篇图文游记;周末我想吃火锅,结合我的口味,选择出我要在美团买菜上的货物;我想在周末带孩子去图书馆,帮我预约周日下午的时间;新闻应用方面,基于我过去的喜好,总结今天的热点新闻,告诉我财经方面都发生了什么大事情等等。这是个人生活领域。但这个过程不是一蹴而就的,随着时间的推移,会有一个逐步的演化的过程。
notion image
在我所在的数据科学领域,我一直努力期待看到的一个场景就是说出问题后,直接给出结论。例如请帮我分析一下,华中大区昨天销量暴增的原因,然后直接出结果:“运营补贴起效果,又赶上地方补贴政策和节假日多重效果导致销量暴增”。又如电影钢铁侠中的助手,帮我分析一下战甲强度,帮我分析一下反应堆的持续性…
结合现有数据进行推理分析,简化掉所有数据分析过程,分析数据,直接出给结论是我做数据产品的一个梦想。我们现在要花费7成左右的时间去处理数据,大量的时间用在了数据采集、处理与准备的过程。
ChatGPT理解我们的意图,然后执行命令,简化了我们搜循、准备、以及各种场景的“过程”,在产品的交互上,我们可以减少很多过程式的设计
那是不是传统的交互框架就完全被替代消失了?我认为不会,产品设计讲用户场景,即便AI帮你把云南的照片整理出来形成故事游记,选择出你周末要吃火锅的货物,也是需要展现出来的,展现出来的形式,还是离不开传统交互框架,并且应用程序永远也绝对不会只是动动嘴皮子就完成所有任务的。所以传统的交互加上AI的加持是未来的发展方向。
目前已经眼睛可见的就是工具类产品,例如微软的office套件、adobe全家桶生这类生产力工具方面的变化。例如我现在在大数据领域研究的埋点AI化、数据质量AI化,会议软件的自动会议纪要,邮件中的自动周报等,都会先从效能工具开始,具有直观的提效能力,消费者也有绝对的愿意为此埋单。
在未来几年,语言模型渗透在应用交互模型里是个逐步的过程。但可能需要出现另一个现象级的应用才能真正带起这个浪潮。现在ChatGPT可以说是最原始的应用,目前国民级应用还基本上看不到ChatGPT在应用体系内的发挥,一是思想上还没有突破,还是原有思维模型和交互定式,二是完全独立做自己的ChatGPT成本太高了,导致ROI(投资回报率)不足。随着技术提升和单位成本的下降,语言模型的渗透会越来越多。

三、ChatGPT的效能提升和影响

ChatGPT让以前不敢想,没有精力去做、学习成本高的事情,变得敢于尝试了。
最近有两个尝试。

1. 两个尝试

1)内容创作的尝试
我时常在听到一些喜欢的音乐时有作画的想法,想把此刻的内心感受用画表达出来。于是我基于midjourney的能力输入我想要的内容让它帮我生成图画。大大的减少了我去学习画画的过程。
2)机器学习、代码生成
作为产品经理我还是懂一些技术的,但是让我完全深入代码,从头写到尾还是不行的。有了chatgpt,我就有了想去通过机器学习的方式解决工作上的内容,自己做一些简单的研发工作,例如我工作的主要方向解决公司数据质量问题,想通走机器学习解决数据质量问题的路,不依靠研发,想自己先摸索。通过输入自己的想法帮我生成python代码,来做一些基本的验证,这样我不用深入学习python,也可以搞定。
但事实证明,是我想多了。
就拿第一个例子来说,确实在一些场景下,类midjourney的ai生成的图片是可以直接拿来用的,比如我在公司宣传产品的一些小宣传册封面、产品新功能的海报,都可以直接无修改就用。还有就是如同下图这种实物的外包装设计,通过AI作画,直接生成,简单易用。
notion image
但是如果你想要深入一些,例如结合故事来画一幅非常贴切故事情节的画作或者音乐,还是需要你自己来介入完成。生成的图画只能当作是个“毛坯房”,精装修还需要靠自己,即便你再会提问,实际交付物也和你理想中(脑海里)的存在差距。也就是说,你电脑里如果没有PS,AI等绘画工具,完全依靠midjourney来完成作画,是很难满足绝大部分需求的。
第二个例子也是一样,我想通过机器学习或者算法的方式解决数据质量的问题,ChatGPT的的确确可以帮我写代码,写的还非常不错,但是解决数据质量的整体思路,大框架是什么,流程是什么,如何去验证效果,如何产品化,如何很好的运用在业务中,这些不是ChatGPT能够帮助你的,必须自己有思路。如果你不会python、算法也是不行的,你必须基于你现有的知识完成任务。换句话说,对于不懂数据领域的人,你让他通过ChatGPT来解决数据质量问题,是不可能的。它只能基于现有网络上留存的数据和方法,告诉你大致的方向,但不能结合你的实际情况来帮助你完整的完成这个任务。
所以,ChatGPT是站在你肩膀上的效能利器。他能按照你意思帮你生成一个“毛坯”状的原料,不用再花大量的精力去处理初始内容(数据处理、素材准备),然后你要做的事情就是精雕细琢对于取代你工作的说法,我想上面的例子已经说明了,如果你拥有思路,拥有设计与创作能力,并且就处在创作、策划、产品技术架构的岗位上,完全不必担心。
其实在工业领域上,在100多年前就已经发生变革了,挖掘机、电梯、吊车的出现,让摩天大楼成为可能。生产线的出现,让社会的生产力爆炸,这其实就是工业时代的人工智能。它们的取代了传统手工制作方式,让产品标准化,生产出质量过硬的产品,最关键的是效率大幅度提升,福特T型车也因生产线的出现让成本降低,大众受益。
ChatGPT会引发生产力的爆炸,引发内容生产的爆炸,有思路有想法有创意的人,制作内容变得更容易。跨界、复合性的工作也变的更简单,减少了你复合学科的学习成本和时间。它不是夺走大家的工作,或者说它夺走的是生产“毛坯”的那部分人的工作,真正的创造者会因为ChatGPT的出现而让生产力提高,让更多的人敢想之前不敢想的,敢于跨领域去实现,复合性工作变得越来越容易,让更多的不可能成为现实。
我们自己训练自己的ChatGPT的可行性?这个东西我觉着具有先发优势。GPT从1代到4代,经历了5年时间,从2018年1代开始到2023年初的GPT4,我想不存在弯道超车的,别人走过的路我们要想达到同样的效果,也一定要走的,可能走的比别人还长。单拿训练数据来看,1代用了15G数据,到3代的45TB数据,光数据的处理所花费的时间就要用年来计算。所以像文心一言如果达到ChatGPT同样的效果,肯定也要经历同样的历程。另一个就是太费钱了,一个英伟达A100要将近10万块钱,训练GPT要几千块上万块GPU,还不算电费,机房等费用,烧钱的同时,还没有经济回流,这个账摆在各公司面前还好,真的要等上几年哪怕1年才出效果,我想在国内的环境下,应该没有几家公司能有这样的耐心。

2. 对教育的影响

我上学时候对于每天做题写卷子这种事就提不起来兴趣,尤其是背诵类的任务,例如古文、历史、政治这种,我是直接放弃的。那时就觉着,为什么考题是考朱元璋是哪年生人,明朝是哪年灭亡的,郑和去了哪些国家,机械的背下来着实让人痛苦,过了几年我不还是会忘了吗?现在随手上网就能查。我夫人的副职是老师,她跟我说,她的很多学生,背诵能力很强,以至于依赖背诵。学习数学、物理都是背公式,背概念,根本不理解其中的意思。这是一个很可怕的现象,孩子们没有学习的欲望,缺少求知欲。语文英语历史方可以背诵解决,数理化也是这样,分数低先不说,危险的是磨灭了孩子对世界的科学理解和逻辑思维的培养。
ChatGPT的鹦鹉学舌能力,我认为在未来会对现有教学模式有更大的冲击。你再怎么背,也赶不上机器,就如同英文字典那个例子,仅仅只有2MB的内容,我们都不可能完全记住。当然不是说语文、历史不用学了,而是要减少死记硬背、完成任务式的教育方式,多以解决问题,开放式讨论的方式学习,学习科学的历史演变,培养推导、演绎的能力,利用ChatGPT的海量知识与人机交互的提升,让它融入到教育、科学探索的过程,帮助我们提升解决问题的能力。考试的问题不在是清朝是哪一年灭亡的,而是问问在1912年,都有哪些因素导致了清朝灭亡,为什么会出现这些因素?讲讲自己的思考和论证。
人和ChatGPT的最大区别在于,人具备总结、分析、积攒知识的能力,能够掌握“方法”,而ChatGPT终究是冷冰冰的算法与模型,应该让我们的方法中,融入ChatGPT的能力,当作自己的一部分。

总结

  • ChatGPT没有意识,它是仿生人类学习的语言模型
  • ChatGPT突破了传统的交互模式,让人能够更好的与机器沟通
  • 大语言模型未来会逐步融入我们身边的应用
  • ChatGPT是站在我们肩上的提效利器
  • ChatGPT能带来更多想象空间,让更多的人做以前仅仅想一想的事情
  • 它取代的是生产毛坯、原材料的人
  • 填鸭式教育只会让孩子更快的被淘汰
  • 利用ChatGPT打开广阔的空间
不知道ChatGPT是不是这个时代的搅局者,它能否打破我们传统的平衡,是否能够真正革新我们和机器的交互方式。
因为理解我们,完成指令两个必备要素它已经基本做到了。
我们应该拥抱AI提高自己、改变思维方式,让它融入到我们的工作和生活中,让自己身边多一个机器“朋友”吧。
  • 产品
  • ChatGpt
  • 「3000公里」「 伊丽莎白二世去世:大英帝国从海上来,又从海上走。」
    • Waline
    • Valine
    目录