“AI”的部分挑战是我们不断提高机器智能意味着什么的标准。早期的机器学习模型在现实世界的影响方面非常成功。如今,机器学习的大规模应用包括谷歌搜索和广告定位、Siri/Alexa、地图应用程序的智能路由、自动驾驶无人机、Anduril等国防技术以及许多其他领域。一些领域,如自动驾驶汽车,已经取得了进步,但似乎每隔几年就会持续“几年”。正如智能手机的所有想法都存在于1990年代,但直到2007年iPhone推出才出现,自动驾驶汽车是未来不可避免的一部分。
我是斜杠青年,一个PE背景的杂食性学者!
与此同时,机器学习(ML)/人工智能(AI)世界在过去十年中因语音识别(Alexa),图像识别(iPhone解锁和机场的护照检查)的一系列进步而震惊。连续的发明和发现包括CNN,,,RNN各种形式的深度学习,GAN和其他创新。最近更大的突破之一是2017年出现了用于自然语言处理(NLP)的Transformer模型。变形金刚是在谷歌发明的,但很快在OpenAI上被采用和实施,以创建GPT-1和最近的GPT-3.5以及风靡全球的GPT-4。紧随其后的是其他公司或开源团体构建变压器模型,如Cohere,,,A21Eleuther,以及其他领域的创新,如图像和语音,包括Dall-E,MidJourney,StableDiffusion,,稳定的扩散,DiscoDiffusionImagen/Artbreeder等。
在8年变压器论文的2017个人中,有6人创办了公司(其中4人与人工智能相关,人是名为Near.ai的加密协议)。

变压器和NLP在今天的应用中仍处于起步阶段,但很可能是未来5年的关键浪潮。随着模型的扩展和自然语言理解的增强,可以预期企业将发生转变。企业的大部分世界都在有效地推动语言-法律合同,代码,发票和付款,电子邮件,销售跟进-这些都是语言形式。机器能够稳健地解释和处理文档中的信息,这将是自移动或云以来最具变革性的转变之一。
如今,大型语言模型(LLM)的应用包括用于代码的,或。GitHubCopilot等销售和营销工具Jasper或Copy.AI
预期的3种类型的公司:平台、从头AI和现任AI启用。
这个NLP市场的一个类比可能是2010年左右的移动革命。您最终拥有大约3种类型的公司:
1.平台和基础设施。移动平台最终是iPhone和Android。这里的类似公司可能是OpenAI,Google,Cohere,A21,Stability.ai或构建底层大规模语言模型的相关公司。还有许多新兴的开源选项。此外,像HuggingFace这样的基础设施公司正在做一些有趣的事情。
2.独立(基于平台构建的从头应用程序)。对于移动设备,它是由移动设备,GPS,相机等支持的新型应用程序。例子包括Instagram,Uber,Doordash和其他没有移动设备就不会存在的例子。对于变压器公司来说,这可能包括B2B上的Jasper/Copy以及消费者方面的其他令人兴奋的应用程序,如果没有先进的机器学习突破,这些应用程序将无法存在。
3.技术支持的现有企业(现有企业应该“只是添加人工智能”的产品,而初创公司将输给分销)。在移动革命中,移动的大部分价值都被现有企业所占据。例如,虽然许多初创公司试图构建“移动CRM”,但赢家是现有的CRM公司,他们增加了移动应用程序。Salesforce并没有被移动设备取代,它增加了一个移动应用程序。同样,Gmail,MicrosoftOffice等也没有被移动设备取代,他们增加了一个移动应用程序。最终,ML将被内置到今天的许多核心产品中-Salesforce很可能拥有ML智能CRM工具,而不是由于ML而取代Salesforce的全新CRM。Zendesk可能会有支持ML的票务路由和响应,而不是一个全新的客户服务票务工具取代Zendesk。
当然,这些产品的新ML驱动版本总是有可能比现有企业好得多,以允许初创公司取代现任者。或者,也许这家初创公司最终的规模是现任企业的1/10,作为一家公司和创始团队,这仍然是一个很好的结果(Salesforce的10%仍然是17亿美元的市值!)。
许多初创公司面临的挑战将是确定什么是从头产品/市场,而不是现有企业应该“只添加人工智能”。有时,解决这个问题的最好方法是简单地尝试一下。创业公司是关于迭代和“只是做”的,其中许多事情可能会被过度思考和错误分析。
感兴趣的区域示例
今天感兴趣的人工智能公司类型包括但不限于:
·平台-模型/API。正在进行一场军备竞赛,一组公司正试图建立更大比例的模型。在可扩展性和准确性上进行创新的同时,机器和计算次数越多,输出就越有用。这些公司的许多商业模式定义不明确,并且专注于通过API而不是应用领域获利。该领域的一些新进入者正在选择大规模的跨企业或跨消费者应用程序。示例公司包括OpenAI,,Cohere,,,A21Google,Stability.ai等。有许多开源模型和方法,包括Eleuther。
·工具。HuggingFace是该空间工具公司的一个很好的例子-将其视为变压器和其他模型的Github。
·法典。GithubCopilot是在OpenAI之上构建的以代码为中心的ML工具的一个例子。最终,所有需要一些代码的工具(IDE、终端、BI工具)都应该包括ML编码集成。或者,可以想象用英语(或任何您的母语)键入内容并将其转换为BI工具的数据或SQL查询。随着时间的推移,企业的任何成员都应该能够通过自然语言问题轻松查询任何分析工具[1]。
·销售和营销工具。LLM拥有各种销售工具的承诺-从算法启动内部销售电子邮件到像Jasper和Copy.AI今天所做的那样创建营销文案。未来一种可能的情况是,当天的所有销售电子邮件/回复都是在您的CRM中自动生成的,然后由销售代表批准-而销售代表必须从头开始编写所有内容。

·企业内垂直、RPA、数据基础设施。为财务、人力资源和其他团队提供更好的工具。将NLP添加到像UIPath这样的RPA工具应该会增强它们。随着时间的推移,像Snowflake和Databricks这样的数据基础设施公司可能会越来越多地包含ML工作流程。例如,参见Snowflakes收购Applica。预计短期内这一领域会有更多的并购。
·企业资源规划中断。了解数据和各个领域的实际含义可以创造增强或取代ERP系统的机会。想象一下,如果不再需要6个月的咨询工作来集成大型企业的ERP?
·测试、错误、安全。从自动化测试套件到搜索安全漏洞或漏洞,这里还有很多工作要做。可以想象,人工智能既用于黑客攻击,也用于从关键安全漏洞到网络钓鱼的所有事情的白帽方法。
·客户支持。智能路由,甚至用语音+NLP完全取代客户支持代表团队的一部分。
·消费者应用程序。增强的搜索。交互式语言原生聊天机器人。最终,人们可以想象智能代理可以替代谷歌搜索。智能商务等其他领域是大型应用。这里有很多令人兴奋的事情要做。在谷歌,LaMDA聊天机器人说服了它的一位用户是有知觉的!
·创建者和可视化工具。人工智能增强的写作和艺术。例如,参见Dall-E,MidJourney,DiscoDiffusion,,迪斯科扩散,StableDiffusionImagen或Artbreeder。同样,如果你点击作家块,人工智能可以建议5个不同的下一段。在某些时候,这些语言模型应该足够好,可以写出端到端的小说、诗歌等。

在DALL-E上以合成波风格生成的示例图像
·很好的演讲。对语音的强烈机器理解和生成。这可能会导致客户服务代表的整个销售更换。
·自动发送电子邮件。未来一种可能的情况是,收件箱中的所有电子邮件/回复都是由AI自动生成的,您只需单击即可批准或修改。人们可以想象你从未回复或审查电子邮件的人的整个列表。
·医生和律师助理。最终,卫生专业人员在诊断方面所做的大部分工作可能会被人工智能取代。律师和其他一些白领工作也是如此。
·还有很多。我们正处于革命的早期阶段。很难预测将要发生的一切。就像为移动应用程序构建明显的东西一样(文本替换=Whatsapp,使用相机=Instagram-尽管显然如何构建这些东西以及UI将工作的内容很难做到,并且闪现出出色的洞察力),有很多有趣的不明显的,比如Uber(“你按下手机上的按钮,车上的一个陌生人接你信任的人”)。人工智能的应用将是相同的-一些最有趣的有影响力的应用程序今天可能很难预测。
·其中一些公司将需要技术突破,其他公司今天可以在现有API之上构建。其中许多领域最终可能会以现有企业与新创业公司获胜而告终。然而,未来十年可能会在这一领域建立一些大型公司。激动人心的时刻。
科学与工程
关于大规模语言模型转化为新创业公司的一个大悬而未决的问题是,挑战在多大程度上是科学问题,而不是工程问题。从机器学习的算法和架构角度来看,还有很大的进步空间。然而,增量工程迭代和效率提升似乎也有很大的空间。许多以变压器为中心的公司希望在GPU上花费数亿美元来训练大型模型。迄今为止,LLM的大部分工作都在扩大规模。例如,这篇关于LLM参数的文章:
“PaLM540B与一些最大的LLM在参数数量方面处于同一联盟:OpenAI的GPT-3拥有175亿,DeepMind的Gopher和Chinchilla拥有280亿和70亿,谷歌自己的GLaM和LaMDA为1.2万亿和137亿,Microsoft-英伟达的威震天-图灵NLG与530亿”。
然而,成本效益高、以效率为中心的方法似乎也越来越有可能奏效。有时,当一个足够杰出的工程师出现并使其成为一个得到解决的工程问题时,技术问题似乎是一个科学问题。沃兹尼亚克在苹果早期就因此而闻名——如何最好地利用有限的计算、创建颜色输出等。
越来越多的LLM平台初创公司正在筹集较小的融资轮次(10万至50万美元对数亿美元),假设未来可能与更好的工程一样多,而不是纯粹的可扩展性。
例如,稳定扩散的训练成本仅为600万美元。我预计我们越来越多地看到大规模的模型和团队,但也看到小型的、灵活的、具有成本效益的模型有针对性的训练,并取得惊人的结果。现在存在如此多的大模型,工程可以有很大的回旋余地。
未来某些应用(包括真正的AGI)很可能需要技术突破和迭代工程。

人才转向更多产品/UI/应用程序构建者
随着我们从只有大型模型的时代转向更多的工程和应用程序的时代,细分市场的另一个转变将从博士和科学家转向产品、UI、销售和应用程序构建者。预计未来几年将以产品/应用程序/UI为中心的创始人涌入这一领域。如上所述,在AI/ML的使用中,将会有一系列新的应用和方法,因此从事人工智能/机器学习的人才类型将发生转变和增长。
在模型再前进一步之前,这个市场可能还为时过早。然而,在多年的时间范围内,一些非常大的公司将被建立起来。
半导体与软件
半导体创新可以显著提高各种系统的性能。每一次重大技术浪潮都倾向于出现一个潜在的主要半导体公司,例如Broadcomm和网络,Intel和AMD用于微型计算机,高通和ARM用于移动设备,NVIDIA用于图形处理和视频游戏。令人惊讶的是,NVIDIAGPU也已成为用于机器学习和加密挖掘的主要处理器。谷歌发明了TPU-张量处理单元-这是定制的ASIC,在许多模型中表现比GPU好得多。然而,谷歌并没有将它们作为独立芯片出售,而是在他们的云中提供它们。Cerebras,Groq,Tenstorrent等其他公司也在该领域进行了创新。
就当前的AI模型而言,大部分工作都是以矩阵乘法的形式进行的,并且为当前AI模型定制的芯片具有大部分表面积用于这种类型的数学。关于为什么NVIDIA继续主导AI芯片领域的争论包括:
·所有的初创公司都在原始性能上投入了过多,而在易于使用的软件堆栈上投资不足。这包括从内核到工具的所有内容。相比之下,NVIDA有CUDA。.
·互连允许数百或数千个芯片协同工作,而不是单芯片性能。
对于一家初创公司来说,要想在ML的硅领域竞争良好,强调软件和互连将是关键。这也表明,也许现任企业将更有能力在芯片与初创公司的芯片上与NVIDIA竞争。
像Microsoft、谷歌、AMD和其他了解软件和/或芯片大规模运行所需的堆栈的公司,如果他们下定决心,可能是真正的竞争对手。谷歌因其TPU而受到了很多关注,但从未将它们作为独立产品在外部销售(而且它们对某些人来说也很难使用)。也许这是他们出于其他战略原因放弃的数千亿美元机会?

DILIs:从工具到有机体的演变
机器在许多任务上已经胜过人类——从下棋到模拟化学品再到焊接汽车零部件。机器在其他领域仍然落后于人类,但这似乎不太可能持续下去-而且大多数领域的差距都在不断缩小。在某些时候,机器应该变得有自我意识和超智能。在那一刻,我们将在机器意识的概念上发生一些重大转变,我们将处理真正的数字生命形式(DILI)。
这些DILI将能够在服务器上自我复制并自我编辑(实际上,人们应该假设在某个时候,世界上大多数代码将由机器自我复制而不是人类编写)。这可能会加速它们的快速进化。想象一下,如果你可以创建100000000个自己的同时克隆,并修改自己的不同方面,并创建自己的效用函数和选择标准。DILI应该能够完成所有这些工作(假设有足够的计算/电源资源)。
一旦你拥有了一个快速进化的、有自我意识的数字生命形式,就会出现围绕物种竞争(DILI生命形式和人类之间合作和竞争的基础是什么?)以及伦理(如果你在有自我意识的DILI中模拟痛苦,你是在折磨一个有知觉的人吗?)。
这些问题对我们的影响可能比我们预期的要快。公开资料显示——OpenAI,Google和各种初创公司的许多核心AI研究人员都认为真正的通用人工智能(AGI)还需要5到20年的时间。这可能最终会像自动驾驶汽车一样(永远需要5年的时间,直到它不是),或者它可能会更早发生。无论哪种方式,似乎人类最终的潜在生存威胁之一是与其数字后代竞争的潜力。
人工智能研究社区一小部分中的一个模因是,我们将使用人机界面与人工智能融合。因此,未来的人工智能物种将是人类的一部分机器,爱我们,一旦完全有知觉和超级智能,就不想把我们抛在后面。这似乎是对人工智能的近乎宗教狂喜式的看法[2]。如果你看看生物学和进化的前因(或者就此而言,与人类相处了很多时间),不幸的是,似乎没有多少事情是这样解决的,尽管显然有很多共生关系。概率最高的事件似乎是,人类大致充当了人工智能作为我们太阳系中占主导地位的未来物种的引导加载器。这可能部分解释了费米悖论所捕获的宇宙中缺乏智能生命的原因——也许所有的有机生物最终都会被他们自制的人工智能和冯诺依曼探测器所取代[3]。
(下图是人工智能研究人员讨论机器-人机界面的最终狂喜,以及AGI会有多喜欢他们构建它。历史和生物学提出了一种可能性,最终的AGI对人类的感激程度可能不如人们的预期)

值得思考的一个有趣的问题是,不同的人工智能方法会产生哪些形式的智能和意识?今天的一些AI模型看起来非常像工具,而不是像代理。例如,像GPT-3这样的电流互感器模型在训练期间不断学习,但是一旦训练模型,就会设置其参数的所有各种权重。使用模型时不会发生新的学习(幸运的是,我们等到了GPT-4)。相反,一个潜在的无差别描述是模型醒来,被赋予一个输入,提供一个输出,然后回到睡眠状态。模型在下次唤醒时不会调用先前的输入。这样一个系统,不是持续学习,有意识吗?或者,也许这是一种没有新学习的智能意识,只有在醒来时才出现?想象一下,如果你的大脑被冻结在某个时刻和时间,可以处理信息并提供输入,但永远不会学到任何新东西。变形金刚模型现在就是这样工作的,如果它们变得有知觉,它们后来更高级的形式可能代表一种新的意识形式。
相比之下,具有持续意识和学习的智能意识代理感觉就像一种不同类型的意识。随着您的使用,它会不断学习、变化和发展。
如果你看看人脑的工作方式,你会发现你有一套不同的系统,用于运动技能、认知等各个方面。例如小脑,小脑,拉丁语为“小脑”,不启动运动,但控制平衡和学习的运动,如走路和扣紧按钮。相比之下,大脑涉及感官知觉、解决问题、学习和记忆以及其他领域的多个方面。运动、呼吸、睡眠、各种处理、记忆存储、理解、同理心等都有专门针对他们能力的大脑区域。同样,人们正在变压器之上构建模型,这些模型从新输入中学习,为底层变压器模型提供输入,并从变压器中获取输出进行训练。也许这些较小的“意识”模型将是机器感知的真正驱动力?或者,我们目前可能无法正确设想机器智能会是什么样子,因为它可能与人类的感知完全不同。
有关大脑中每个具有特定功能的系统的有趣示例,请参阅视觉系统的一些工作(这往往是实验室研究的,而其他一些系统易于实验室研究则不然),以及ML系统在短期内在实验室中对功能和建模的概括)。
很多事情都在进行
这个领域将继续快速发展,随着底层语言模型能力的加速,我们将看到应用程序的持续加速。我们仍处于早期阶段,许多令人兴奋的事情还没有到来。这将是一个数十年的转型,需要不断改进基础模型和工程,以充分发挥其潜力。
你认为,GPT-5什么时候真正面世???
[1]对于任何在企业中进行过数据拉取的人来说,挑战当然是显而易见的。总是有格式错误的表,忘记的连接,边缘情况等需要迭代。将语言简单转换为SQL或其他查询可能只是一部分情况的起点。但是,就像所有事情一样,你需要从某个地方开始。
[2]事实上,宗教狂喜的语言既让人联想到人工智能社区的一小部分,也让人联想到奇点。有人可能会争辩说,与宗教相比,两者都包含良性宗教目前现代政治极端主义(其本身似乎是宗教性质)取代形式的子集。
[3]最终,无论如何,它都是回形针。
未经允许不得转载:头条资讯网_今日热点_娱乐才是你关心的时事 » 人工智能革命 - 转换器和大型语言模型 (LLM)
头条资讯网_今日热点_娱乐才是你关心的时事








