5月11日凌晨,GoogleI/O2023开发者大会如期举行。作为汇聚了大部分核心内容的Keynote主题演讲,Google以「让人人都能从AI中受益」为主题,围绕大模型、搜索体验、生成式AI以及软硬件新品展开并分享了诸多内容。
本文为你汇总Keynote演讲亮点。

改进知识与学习、加速创意与生产力、激励创新以及负责任地构建与部署,是Google的主要原则
▍GoogleAI的基石,不只有PaLM2
2022年4月,早在ChatGPT一夜爆红出圈之前,Google便推出了自家的大语言模型PaLM。PaLM基于Google于2021年推出的Pathways模型架构,在语言理解、生成,逻辑推理以及代码生成方面有着不俗的能力,但此前仅以API的方式面向企业用户开放。
而在大模型应用层出不穷的2023年,作为Google基础大模型的PaLM本次也迎来了第二个大版本——PaLM2。

PaLM2
PaLM2支持100多种语言,在常识推理、逻辑运算以及数学能力方面优势明显,此外还能根据不同专业领域的知识信息进行调优(Fine-Tuning),比如基于信息安全信息的Sec-PaLM2可以帮助开发者定位恶意脚本内容并排查安全风险,基于医疗领域专业知识进行调优的Med-PaLM2则是首个在医疗许可测验中表现超过人类专家水平的大模型。

Med-PaLM2
根据模型体量的不同,PaLM2又以不同动物为名分为壁虎(Gecko)、水獭(Otter)、野牛(Bison)与独角兽(Unicorn)四大类别。比如Gecko所需要的算力和存储空间最小,支持在移动设备上离线运行。根据SunderPichai的介绍,本次Keynote演讲中共有25项新功能基于PaLM2进行打造,基于PaLM2的API也将以预览体验的方式向用户开放。
值得一提的是,近期由两个部门合并而成的GoogleDeepMind目前正在为Google训练下一代多模态大模型Gemini。
▍Bard编程能力增强,第三方接入在路上
作为基于GPT-4的微软Bing聊天机器人的直接竞争者,GoogleBard自今年2月上线以来并没有太多明显动作。而随着本次PaLM2的发布,Google也宣布Bard已完全基于PaLM2运行。
得益于此,Bard在编程能力方面有了巨大进步。最新版Bard熟练掌握了20多种编程语言,在代码注释、代码释义、代码改进以及代码格式化方面均能提供直观、快速的辅助支持;为了照顾开发者的使用体验,Bard还新增了暗色模式并支持直接导出至Colab、Gmail或GoogleDocs在线文档。
除了基于PaLM2的代码能力,Google同时也宣布为Bard带来Tools扩展支持。首波扩展主要为Google应用,如直接调用Google搜索的知识图谱和图片搜索结果,基于GoogleLens提供图片内容识别能力,调用Google地图等服务提供更加丰富的反馈结果等。

Bard已支持20+编程语言
此外Bard还将接入更多第三方服务,如Spotify、可汗学院、Instacart等。在接下来的几个月时间内,Bard将首先整合基于AdobeFirefly的图像生成能力。

Bard将支持更多第三方扩展接入
最后,Google也宣布从即日起移除Bard的等待名单候补机制,正式面向180多个英语语言国家和地区的用户开放;此外,Bard也将从即日起正式支持日语和韩语,未来还将额外扩展40多种语言支持并迁移至Gemini模型。

中文支持在右上角
▍更多面向Workspace的生成式AI服务
如果说PaLM2和Bard是对GPT-4、Bing聊天机器人的回应,那针对GoogleWorkspace的一系列生成式AI服务,则更像是直接对标不久前高调亮相的Microsoft365Copilot的。
针对Gmail和GoogleDocs用户的Helpmewrite功能自3月份开始已经在部分用户中开启了测试,Helpmewrite功能用于写作建议,比如在撰写招聘启事时输入职位名称,PaLM2模型便会生成一份基于对应职位、包含岗位要求的招聘文案;

Helpmewrite
而在GoogleSheets中,侧栏面板中的Helpmeorganize功能能够基于文本提示语内容快速生成可用的表格模板:

Helpmeorganize
至于GoogleSlides,则基于Helpmevisualize功能实现了图片素材生成功能,和MicrosoftDesigner类似,Helpmevisualize还允许用户手动调节图像生成的风格和样式。除了这些功能,GoogleWorkspace还将从下个月开始向部分用户推送6项额外的生成式AI功能。

Helpmevisualize
所有功能还将以DuetAIforWorkspace的名义,在今年晚些时候面向所有企业用户和普通消费者开放。
不难看出,和同类产品类似,Google所有Workspace套件的生成式AI服务也都是围绕提示语(prompt)工作的,所以Google还在本次Keynote演讲中展示了一段demo,在这段demo中,用户可随时通过主界面右上角的Bard图标启动名为Sidekick的侧面板功能。Sidekick能够在打开时自动汇总、识别当前内容并生成实时的提示语建议,进一步辅助内容创作、文章配图、邮件摘要、快速回复等需求,在此过程中,用户Workspace中在线文档、表格的内容也能根据需求随时、快速调用。

Sidekick侧边栏的提示语建议
为了方便用户体验新功能,Google还上线了一个名为Labs的新页面用于功能预览和等候名单注册。值得一提的是,微软也于5月10日开启了Copilot的抢鲜体验计划并将Copilot拓展到了Outlook、OneNote和Viva产品线中,而可以预见的是DuetAIforGoogleWorkspace将会遭到与Copilot同等的质疑——如何妥善处理企业的机密信息、如何确保生成内容的准确性又如何保证AI在企业工作中的实际效率?
▍AI时代的搜索体验:自然、直观、可对话
除了PaLM2、Bard以及DuetAI,基于生成式AI的新版Google搜索体验也在本次Keynote演讲中亮相。和隔壁的新版Bing类似,Google搜索在AI的加持下,主打更聪明、更简单的信息检索体验,在单次搜索请求中可以理解更加复杂的长句子关键字输入了。

新版Google搜索宣传片截图
新的搜索页面则由有明显标识的广告、生成式AI信息面板以及常规搜索结果排名组成。其中生成式AI面板还将提供话题跟踪和对话聊天支持,方便用户像使用GoogleAssistant语音助手的手动输入模式那样使用Google搜索。

新版搜索结果界面
不同于GoogleAssistant以语音为主的反馈方式,整合在Google搜索中的对话功能不仅能理解上下文语境,还会根据Google搜索引擎海量、实时的信息整理各种图文并茂的回答,向用户提供更加直观易懂的结果和建议。和DuetAI类似,基于生成式AI的新版Google搜索体验也将借助名为SGE的测试项目,在接下来几周时间开始通过Labs向用户开放测试。

对话模式
▍从快速、低成本搭建,到稳定、负责任落地
除了面向企业用户和普通消费者的生成式AI服务与功能,Google也用了一个单独的环节来宣传其GoogleCloud业务对生成式AI的支撑,借助VertexAI平台提供的聊天、文本和图像API,开发者可以快速打造生成式AI服务,并且无需担心模型训练数据的隐私安全;随着越来越多的厂商接入生成式AI解决客服、售后等需求,GoogleCloud将提供更多满足不同规模、延迟和成本需求的基础设施供开发者选用。

VertexAI平台
对普通用户而言,Google宣布将与character.ai合作,方便普通用户打造深度定制、个性化、可互动的AI角色;同时Google也将与Salesforce、Jasper等厂商合作,借助VertexAI融合不同数据模型的能力提供协同服务。

使用GoogleCloud生成式AI服务的厂商
在PaLM2之外,VertexAI还将提供Imagen、Codey和Chirp三种额外模型,分别对应图像、代码和语音转文字能力;Google同时还将为开发者提供基于人类反馈的强化学习服务,借助更精确的训练反馈对模型能力进行精细化调优,以及DuetAIforGoogleCloud,为开发者的代码和开发工作提供自动补全、纠错等功能。
Google同时也透露,所有生成式AI模型均构建在经AI架构优化后的GoogleCloud服务器上,包括本次主推的A3虚拟机。相比传统服务器,这些服务器在执行大规模训练任务时的算力提升了80%、费用开销则节省了50%——换句话说,GoogleCloud在AI架构优化的帮助下,以50%的成本实现了近乎翻倍的算力提升。
为了宣传GoogleCloud强大的开发支持能力,Google展示了一个由5名软件工程师花数周时间搭建的新应用——ProjectTailwind。Tailwind是一个基于PaLM2API的笔记应用,它以用户存储在云端的在线文档为基础,自动生成摘要、问答等信息卡片。Tailwind同样将在晚些时候通过Labs页面开放测试。

Tailwind
经历了一系列AI产品发布灾难以及AI道德与伦理团队变故之后,「负责任的AI」(responsibleAI)一词在Keynote演讲中被GoogleCEOSundarPichai多次提及——和微软在新版Bing以及GPT聊天机器人方面近乎狂热的投入不同,Google在去年年底到今年这场生成式AI的热潮中似乎总有些迟钝和慢热。
所以本次Keynote主题演讲的另一大主线,是向人们解释这种策略背后的思考:AI能够帮助人更好地理解知识、完成工作甚至实现学术研究方面的新突破,但易得、易用的AI工具也在社会层面引发了不小的争议,从AI数据来源的合法性到AI生成信息的真实性,越来越多的事件已经证明,与AI相关的安全、伦理与社会责任问题不可小视。

由AI生成的教皇穿羽绒服照片
或许你也看过教皇穿羽绒服的图片,在后续的产品更新中,Google将通过图片搜索结果注明AI生成的相关信息、提供更多图片相关的元数据(比如该图片首次被收录索引的时间及来源)等方式,帮助用户识别AI生成的图片、限制虚假信息传播。

图片初始来源信息检索
▍Android14:跨设备体验补全、AI助力个性化
相比AI,Android14在本次Keynote主题演讲中的戏份明显减少。在本部分开头,Google首先强调了一波围绕Android生态的跨设备体验:目前已有50多款Google应用进行了平板适配,同时Spotify等不少第三方应用也已经推出了大屏版本;而自自两年前与三星合作公布WearOS3以来,WearOS实现了近5倍的用户增长,是近年增速最快的可穿戴系统。今年夏天,国外用户的「微信」WhatsApp也将正式登录WearOS,将你的朋友从掌上屏幕带入腕上设备。
同时,酝酿许久的FindMyDevices众寻网络终于在主题演讲中官宣,追踪器、耳机等市面上在售的第三方设备将会接入由Android设备组成的Google众寻网络;同时,作为上周宣布的与Apple合作制定反跟踪标准的成果,FindMyDevices服务还会检测并提醒你身边发现的未知追踪器,AirTags亦在其列。FindMyDevices的相关功能将于今年夏季向用户推送。

FindMyDevices
Android14这边,GoogleMessage将基于生成式AI提供不同风格的消息回复建议:

整合了生成式AI能力的回复建议
同时个性化定制功能在AI的加持下也得到了加强,除了MaterialYou的自动取色、锁屏时钟样式与锁屏快捷方式定制外,Android14还支持Emoji壁纸和基于AI的CinematicWallpaper,CinematicWallpaper会自动区分图片中的前景和背景,让普通图片在解锁或晃动手机时呈现视差动效。

Emoji壁纸功能演示
Emoji壁纸和CinematicWallpaper预计将于下月通过Android14Beta3向Pixel设备推送,此外Google还将在今年秋季上线完全基于结构化提示语生成的壁纸服务。

基于文本图像生成功能的壁纸创建服务
▍三款新硬件亮相,这次没有新机预告环节
最后,Google也在本次主题演讲中一口气发布了三款Pixel硬件新品:Pixel7a、PixelTablet和PixelFold,三款设备均搭载GoogleTensorG2处理器。
其中GooglePixel7a配备了8GB运行内存以及更大尺寸的6400万像素主摄传感器,定价方面和爆料相同为499美元,GoogleStore还有专属的珊瑚红配色,即日开售。

Pixel7a定价
PixelTablet则配备一块11英寸2560×1600分辨率屏幕、3枚远场优化麦克风、4组立体声扬声器、集成式指纹识别电源键以及800万像素前置、后置摄像头;借助充电音箱底座以及Hub模式,可实现更多智能显示屏功能,如智能家居控制;同时还内置Chromecast,支持从其他设备进行媒体内容投射播放。PixelTablet提供三种可选配色,定价499美元,售价包含充电音响底座。

PixelTablet配置信息
Google的首款折叠屏设备PixelFold则提供IPX8防水防尘支持,定价1799美元,即日起开始预定,下月正式发售,预定用户还将获赠一块PixelWatch。

PixelFold
关于硬件部分的详细配置参数,因为与此前的爆料基本一致,本文不再赘述,感兴趣的朋友请移步至前瞻。另外,本次主题演讲并未发布Pixel8系列以及下一代PixelWatch的相关预告。
少数派一直秉持「高效工作,品质生活」的价值观,对于能够帮助提升生活品质的洞察与思考,都是我们的热情所在。
我们诚挚地邀请你参与这次关于家居环境乃至心理环境的一次扫描和思考,希望借助这份小问卷,能够帮助我们理解家居环境跟心理环境之间的关联,人对洁净生活的向往是基础需求还是精神需求?你会跟我们一样好奇吗?
https://sspai.com/post/79751?utm_source=wechat&utm_medium=social
作者:克莱德&潮玩生活加
责编:克莱德
未经允许不得转载:头条资讯网_今日热点_娱乐才是你关心的时事新闻 » Google 全新 AI 模型超越 GPT-4?今年 Google I/O的7 大亮点别错过
头条资讯网_今日热点_娱乐才是你关心的时事新闻








