OpenAI劲敌出手!Claude 3正式发布,超越GPT-4,一口气读15万单词
发布时间:2024-03-08    分类:行业资讯

  OpenAI创始人奥特曼都还没来得及和马斯克掰扯完新仇旧恨,没关系,还有其他人会悄悄出手——

 

  北京时间3月4日晚间,Anthropic,毫无预警地发布了一代大模型Claude 3,距离上一代的Claude 2发布,仅相隔8个月。

 

  Anthropic是OpenAI的劲敌,其核心团队同样是OpenAI的创业原班人马。团队因为与OpenAI理念不合而分家,于2021年成立了新公司Anthropic。

 

  仅在2023年,Anthropic就连续获得五轮,共计73亿美元的融资。在大模型训练上,Anthropic可以说是业内一梯队,同样备受硅谷关注。

 

  这次,毫无疑问,Claude 3直接对标OpenAI当前最强大的模型GPT-4,多模态能力配齐,并且直接甩出超过46页的技术报告,自豪表示:

 

  全面超越GPT-4!

 


  来源:Claude新一代的Claude 3分为三个版本,分别为Haiku、Sonnet、Opus三款模型。从模型尺寸来看,可以理解为模型的中杯、大杯、超大杯。

 

  虽然Anthropic并没有给出模型的具体参数,不过给出了三款模型所适用的场景:

 

来源:Claude

 

  Haiku:是相应速度最快的模型,也是成本低的选项,在大多数纯文本任务上的表现仍然相当出色,也同时包含多模态能力(比如视觉)

 

  Sonnet:适用于需要平衡性能和成本的场景,它在纯文本任务上的表现与后面的Opus相当,但在成本上更为经济,适合于那些需要性能稍微好点,但预算有限的企业和个人用户

 

  Opus:具有强大的推理、数学和编码能力,接近人类的理解能力,适用于需要高度智能和复杂任务处理的场景,如企业自动化、复杂金融预测、研究和开发等。

 

  从本周开始,Claude会向159个地区开放。其中,Opus和Sonnet模型的API均已上线,开发者已经可以直接使用。经济性能兼顾的Sonnet,就在官网上提供免费体验,Opus则可供Claude Pro订阅者使用。

 

  尽管OpenAI凭借Sora在文生视频领域打了一场漂亮的翻身仗,但视频赛道所在的发展阶段更早。如今的主战场仍在大语言模型(LLM)上,离产品化也更近。

 

  圈内人也看热闹不嫌事大。近期不少报道显示,马斯克将OpenAI告上法庭,让OpenAI不得不内部推迟有关GPT-5的发布——GPT-5被认为能够实现AGI(通用人工智能)。AI圈网红、英伟达的首席AI科学家Jim Fan就表示:

 

  Claude 3刚刚发布了,坐等几个小时后OpenAI精心安排的GPT-5发布。来源:Twitter(X)2024年才刚刚过去两个月,我们就已经见证谷歌Gemini Pro、OpenAI的Sora,再到如今的Claude发布……巨头混战再度拉开序幕,大有愈演愈烈之势。

 

  一口气读15万单词,还能拆解复杂问题

 

  如果是OpenAI是大模型领域的“六边形战士”,无论是模型视频、商业化综合水平一骑绝尘,那么Anthropic从风格上看更为低调,也更强调专才,但这次的能力提升确实巨大。

 

  有看客甚至表示:

 

  Claude 3终结了GPT-4时代。

 

  这次Claude 3的两大更新亮点,一个是长文本,二是多模态能力。

 

  长文本就是Anthropic的一个显著优势,体现为在读论文、小说等字数更多的文本时,Anthropic更擅长理解和回答用户的相关问题。

 

  这次,Claude 3大大提升了上下文对话窗口,达到200k——可以理解为单次和模型对话能够输入的文本。

 

  具体而言,Claude 3 200k的对话长度,相当于能够单次处理超过15万英文单词,而GPT-4 Turbo的上下文窗口为128k,大约是9.6万个英文单词。

 

  并且,Claude 3也一次允许图像和文档上传。和ChatGPT一样,Claude 3能够“认”出来图里的是什么东西,直接描述,回答用户的问题。

 

  而更令人印象深刻的还是,Claude 3在分析一些复杂问题时,已经能够和人一样,先拆解问题,并且交由子模型来进行调度。

 

  在Anthropic的演示视频里,就举了一个需要用python模拟经济形势走向的例子。当把“分析美国十年GDP未来趋势”的任务交给Claude 3之后,Claude就默默地做了这些事:

 

  先打开一个名为“webview”的工具,跳到这个问题相关的资料网址里

 

  因为有多模态能力,所以能够把“看到”的信息,无论是文字还是图表,都扒拉下来,用来解决问题

 

  然后自己写python程序、渲染趋势图,让人类看是否正确

 

  最有趣的就是,网页中如果看到一个数据图表,没有明确数据的,Claude 3甚至能通过识别图像,来估算每个阶段大概数据是多少,进行还原。

 

 

搜索引擎中的数据图表

 

 

Claude 3还原的折线图,估算了每个时间节点的具体GDP

 

  AI安全也是Anthropic区别于OpenAI的一点。在OpenAI和Anthropic团队分家的时候,其最重要分歧正是包含对AI安全的考虑,Anthropic希望建立一个“更可信”的模型,而OpenAI显然希望用商业化驱动模型更快地前进,路线上更为激进。

 

  对此,Anthropic采取的措施包括但不限于:制定了一套框架,用于评估和减轻 AI 模型可能带来的潜在灾难性风险,比如继续拧自动化评估和红队测试,以确保AI不会发展出可能造成伤害的能力。

 

  2023年4月,Anthropic甚至开源宪法人工智能(Constitutional AI)引起了圈内轰动,这是一个限制模型行为遵守特定宪法原则的AI。

 

  以及2024年也是美国大选年, Anthropic也在准备开发和执行关于在政治和选举背景下使用工具的政策,评估模型对选举错误信息、偏见和其他滥用的反应,确保用户能够在选定地区获得准确和投票信息。

 

  不过,Anthropic也因为太过重视AI安全,很多问题的评估上很谨慎,甚至直接不回答,惹来一片用户吐槽。这次,Anthropic表示,Claude 3在这个问题上大有改进。

 

  比如,Claude 3的对无害信息的拒绝回复率,普遍来到了10%附近,比Claude2.1和2.0都有进步。

 

 

来源:Anthropic

 

  据CNBC,Anthropic拒绝透露训练 Claude 3到底花了多少时间和多少钱,但表示Airtable和Asana等知名SaaS公司有帮忙对模型进行了A/B测试,让模型的可控性也有所改善。

 

  技术以外,Anthropic商业化还要再提速

 

  尽管Anthropic技术上又一次拿出了看家实力,但大模型领域如今已经走过了一年多时间的技术竞争。如何从模型走向实际的产品落地,创造更大的商业价值,是悬在所有厂商头上的剑。

 

  如今Anthropic背后站着谷歌云、亚马逊,已经和OpenAI(背靠微软)形成鲜明的阵营对比。但从商业化角度,当前Anthropic远赶不上OpenAI,这意味着Anthropic在2024年会面临更大压力。

 

  和ChatGPT一样,Anthropic也是To B和To C两条腿走路。在企业侧,Anthropic已经服务了包括Slack、Notion和Quora等用户。

 

  而据The Information 2023年12月报道, Anthropic预计到2024年底将产生超过8.5亿美元的年化收入。相比起来,同样截至2023年底,OpenAI由于ChatGPT的强劲增长,年化收入从10月中旬的13亿美元就增至16亿美元。

 

  往后,随着OpenAI商业化提速,差距还可能越来越大。The Information援引一些 OpenAI 观点,到 2024 年底,他们预计OpenAI年化收入可以达到50亿美元,而其他人则认为可以达到更高的数字。

 

  技术上的军备竞赛远未结束。在2023年12月,Anthropic还在进行新一轮高达7.5亿美元的融资,估值为184亿美元,相比2023年初41亿美元的估值,涨了4.5倍。

 

来自:36氪,侵删

热门新闻
您的大力支持,是我们前进的动力

以策略、设计、技术、服务为核心 为客户持续创造价值

为您提供优质的网络营销解决方案

凤星科技专注于提供互联网平台定制开发,网络营销推广,企业运营管理等一站式服务,让科技为企业信息化赋能。欢迎联系咨询,开启我们的双赢合作吧!

服务咨询
友情链接:
广师大艺高 中普陀寺 迈博家具 阳诚机械 道氏家具 柚美空间 佛山禅城民办教育协会 法坚尼门窗 金牌卫浴 南国鼎峰装饰 欧远声学 玄憬龙博物馆 同喜瓷砖 澳星洲卫浴 新居缘装饰 迴龙灯饰 好来客食品 顺辉岩板 南华禅寺 栩烽医疗 良裕五金 卫欧卫浴 龙浩谢晓阳律师网 天欣科技集团
网站首页
全网营销
个性定制
小程序开发
抖音运营
成功案例
新闻资讯
关于凤星
Copyright©2013-2024 佛山市凤星科技有限公司
粤公网安备 44060402001033 粤ICP备13046912号