2023人工智能全景报告《State of AI Report》出炉!AI未来一年的10大预测:GPT-4仍是全球最强,GenAI 大爆发,...
文章目录
2023 人工智能全景报告《State of AI Report》出炉!给出AI未来一年的10大预测,GPT-4仍是全球最强,GenAI 大爆发,…
10月12日,我们迎来了2023年的《人工智能全景报告》(《State of AI Report 2023》),该报告已连续六年发布,成为AI行业流行的风向标。
今年的《State of AI Report》由AI投资人 Nathan Benaich 和 Air Street Capital 团队制作,报告超过160页,涵盖了研究进展、行业趋势、现有政策、安全问题、未来预测五个方面,对最新的 AI 发展现状和未来预期进行了深度分析。
传送门:回顾2022年人工智能全景报告
下载完整报告:2023 人工智能全景报告《State of AI Report》
1. 研究进展
报告第一部分总结了 2023 年以来的人工智能技术突破及它们的能力。
-
GPT-4的发布表明专有技术与次优开源方案之间存在能力差距,同时验证了通过人类反馈强化学习的有效性。
-
许多人试图用更小的模型、更好的数据集、更长的上下文来克隆或击败专有模型。
-
不清楚人类生成的数据能维持人工智能扩展趋势多久,也不清楚添加合成数据会产生什么影响。企业中的视频和数据可能是下一个目标。
-
LLM和扩散模型继续为生命科学界提供助力,多模态成为新的前沿,各种智能体热度增加。
1.1 GPT-4仍是全球最强
2023年是LLM之年,OpenAI的 GPT-4 仍是全球最强大的大型语言模型,成功击败了所有其他LLM———无论是在经典的AI基准测试上,还是在为人类设计的考试上。
1.2 闭源模型趋于技术封闭,开源模型紧追不舍
不过大模型厂商越来越趋于技术封闭,或许是出于安全和竞争方面的考量,闭源模型的开放性有所减弱。
OpenAI 公布了的 GPT-4 技术报告,可参考的内容非常有限,几乎没有发布什么有价值的信息,Google的 PaLM 2 技术报告亦是如此,而 Anthropic 直接选择不发布 Claude 和 Claude 2 的技术报告。
然而,Meta 高举开源AI的旗帜,先后发布开源大模型 Llama、Llama2,选择向公众开放模型权重等技术细节,掀起了一场开放竞争的大语言模型竞赛,并形成了开源与专有大模型之间的抗衡。尤其是 Llama2 可以直接商用,2023 年 9 月,下载量达到了 3200 万。
从模型流行度来看,ChatGPT 在推特上被提及的次数最多,为 5430 次。其次是 GPT-4 和 LLaMA。虽然专有闭源模型最受关注,但人们对开源且允许商业用途的 LLM 的兴趣在增加。
从Hugging Face的排行榜来看,开源比以往任何时候都更加活跃,下载量和模型提交量飙升至历史新高。
1.3 小模型的逆袭
除了LLM,包括微软在内的研究人员一直在探索小规模语言模型的可能性。基于 Llama 和 Llama2,业界不断努力通过开发更小的模型、更好的数据集和更长的上下文来实现媲美或超越专有模型的性能。
有研究发现:使用高度专业化的数据集训练的小型语言模型,性能可以与大50倍的模型相媲美。
1.4 生成式AI推动生命科学的进步
LLM 和扩散模型为分子生物学和药物发现带来新突破。比如受到图像和语言生成模型成功的启发,扩散模型可以从头开始设计多种功能蛋白,为生命科学带来了更多可能。
2. 行业趋势
报告第二部分总结了 AI 相关的行业发展趋势。
- 英伟达凭借各国、初创公司、大型科技公司和研究人员对其GPU的巨大需求,跻身市值万亿美元俱乐部。
- 主要芯片供应商开发了不受出口管制影响的替代产品。
- 在ChatGPT的带领下,GenAI的程序在图像、视频、编码、语音或CoPilots等领域取得了突破性的进展,带动了180亿美元的风险投资和企业投资。
2.1 英伟达赢麻了
生成式AI高速发展的同时带动了AI硬件行业的高歌猛进,GPU的巨大需求量,让英伟达成了目前赚钱最多的AI公司,使之跻身「一万亿市值」俱乐部。
报告指出,英伟达 A100、H100 GPU 集群的数量不断增加,它的芯片使用量是「所有替代方案总和」(AI 研究论文中所有其他同类芯片总和)的 19 倍!
目前,英伟达仍在持续推出新芯片,但旧芯片展现出非凡的生命周期价值。
2017年,英伟达发布的 V100 是2022年AI研究论文中最受欢迎的GPU。
2.2 GenAI大爆发
随着生成式 AI 迅速崛起,OpenAI 的 ChatGPT 成为增速最快的互联网产品之一。
特别地,ChatGPT 在开发人员中特别受欢迎,取代了Stack Overflow成为了开发人员寻找编码问题解决方案的首选资源。
但是,根据红杉资本的数据,生成式AI产品的持久力不太稳定。
与 YouTube、Instagram、TikTok 或 WhatsApp 等目前最受欢迎的应用程序相比,ChatGPT、Runway 或 Character.ai 等 GenAI 应用程序的中值留存率和每日活跃用户数较低。
除了消费软件,各种迹象表明生成式AI(GenAI)可以加速整体AI行业的进步。比如自动驾驶领域,Wayve 推出了用于生成逼真驾驶场景的 AI 大模型 GAIA-1。
更多行业努力寻找和AI技术结合,且都出现了大手笔的交易。比如许多传统制药公司已All In人工智能,与Exscientia和InstaDeep等公司达成了价值数十亿美元的交易。还有风险投资行业也押宝在GenAI上,如果没有GenAI的繁荣,人工智能投资将比去年下降40%。
2.3 AI 中坚力量集体出走?
各科技大厂的AI大佬们也迎来了集体出走?
谷歌和 DeepMind 合并为谷歌 DeepMind,谷歌《Attention is all you need》论文作者全部离职创业。Transformer的这八位作者已累计融资了至少8.7亿美元!
百度硅谷AI实验室的DeepSpeech 2团队也面临相似的情况。该团队的大部分成员后来成为领先的机器学习公司的创始人或者高管。
OpenAI、Anthropic 等 AI 企业正在成为大模型这波技术浪潮的中坚力量。GenAI 企业筹集的种子资金比所有初创企业多 33%,融资金额比所有初创企业多 130%。
英伟达又赢麻了!
3. 现有政策
报告第三部分介绍了人工智能领域的政策制定情况。
- 世界已划分出明确的监管阵营,但全球治理的进展仍较缓慢,最大的人工智能实验室正在填补这一空白。
- 人工智能可能影响选举和就业等一系列敏感领域,但目前尚未看到显著的影响。
报告指出,数十亿美元的投资和能力上的巨大飞跃已经将人工智能置于政策制定者议程的首要位置。
全球正在围绕少数几种监管方法展开,从轻微监管到高度限制性的都有。一些关于全球治理的潜在建议已经浮出水面,例如英国人工智能安全峰会可能会有助于将这些想法具体化。
因此,报告总结称,人工智能领域的政策制定已经引起了全球关注,未来可能会有更多的监管措施出台。
4. 安全问题
报告第四部分总结了 AI 领域讨论最多的安全问题。
- 关于生存风险的讨论首次进入主流,并明显加剧。
- 许多高性能模型容易“越狱”,为解决RLHF挑战,研究人员正在探索替代方案,例如自对齐(self-alignment)和带有人类偏好的预训练。
- 随着模型性能的提升,一致地评估SOTA模型变得越来越困难。
在之前的 State of AI 报告中作者就警告过,大型实验室和公司忽视了AI的安全性。
2023 年,关于 AI 风险的辩论集中爆发,尤其是「灭绝风险」或灾难性风险,关于这些话题的讨论经常占据头条。
5. 未来预测
报告的最后部分,作者提出了他们对未来一年AI发展趋势的一些预测:
▶ 1. 好莱坞级别的电影将使用生成式人工智能制作视觉效果。
▶ 2.一家生成式人工智能媒体公司因在2024年美国大选中滥用人工智能而受到调查。
▶ 3. 可以自我改进的AI智能体在复杂环境中击败SOTA。
▶ 4. 科技IPO市场解冻,至少有一家专注于人工智能的公司上市,比如Databricks。
▶ 5. 在GenAI扩展热潮中,一个集团花费超过10亿美元来训练一个大型模型。
▶ 6.美国联邦贸易委员会或英国竞争和市场管理局以竞争为由调查微软与OpenAI的交易。
▶ 7.全球人工智能治理进展有限。
▶ 8. 金融机构推出GPU债务基金,以取代用于计算融资的风险投资股权资金。
▶ 9. 人工智能生成的歌曲进入Billboard Hot 100前10名或Spotify Top Hits 2024。
▶ 10. 随着推理工作量和成本的大幅增长,一家大型人工智能公司如OpenAI将收购一家专注于推理的人工智能芯片公司。
这些预测不一定完全正确。对比去年的10大预测,我们来看看今年实现了几个?
去年报告预测的 9 项,有 5 项被证明是准确的。
下载完整报告:2023 人工智能全景报告《State of AI Report》查看文末口令
参考:
https://www.stateof.ai/
https://docs.google.com/presentation/d/156WpBF_rGvf4Ecg19oM1fyR51g4FAmHV3Zs0WLukrLQ/edit?usp=sharing
欢迎各位关注我的个人微信公众号:HsuDan,我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。