clash网站怎么用
【新智元导读】GPT-5更近了!今天,神秘模型Horizon Alpha火遍全网,编码首测性能逆天,各种三方基准实测相继放出。就在发布前夕,OpenAI核心大脑专访坦言模型还有瓶颈,但坚信Scaling Law没有尽头。
今早,一款神秘模型Horizon Alpha突然上线OpenRouter,各种榜单和测试席卷了全网。
它可以一句话生成「水果忍者」、「外星人抓奶牛」等各种游戏,能根据logo图直出广告,还能轻而易举地通过「六边形物理模拟」测试。
此前被爆料的各种代号模型,比如lobster、zenith、summit等,在多项测试中惊艳了所有人。
再上点难度,20个球在旋转的七边形内弹跳。网友惊讶地表示,「这是自己目前见过最出色的版本之一」。
Horizon Alpha能够在3分48秒中,创建一个展示一系列简单有趣的浏览器小游戏的网页。
给Horizon Alpha同一个提示,「创建一个视觉上有趣的着色器,可以在 twigl 应用中运行,让它看起来像暴风雨中的海洋」。
沃顿商学院CS教授Ethan Mollick惊叹道,这是迄今为止最好的,而且创建速度非常快。
当网友要求其「创建一个与遛狗的商业网站」clash网站怎么用,Horizon Alpha爱问一大堆需要提前确认的问题;Sonnet 4则会直接给出解决方案。
最终,从搭建的效果来看,Horizon Alpha输出的质量高且简洁。Sonnet 4输出的更长,内容更全面,也更具创意。
此前,AI圈大神Simon Willison曾表示,从一张「骑自行车的鹈鹕」就可以看透AI进化史。
需要注意的是,虽然各种测试表现不凡,不过根据多方推测,Horizon Alpha可能只是一款小模型。
Mark Chen,曾经的华尔街量化交易员,着装考究,谈吐间挥洒自如,可以说与AI毫不搭界。
入职OpenAI后,他迅速成长为DALL·E和GPT-4多模态能力、Codex背后的关键推手,擅长将复杂的研究转化为人人可用的产品。
而Jakub Pachocki,一位低调的理论计算机科学家,接替了离职后的Ilya,痴迷于突破AI逻辑与创造力的极限。
关于内部的角色分工,Pachocki是这么说的,「Chen负责组建和管理研究团队,而我负责设定研究路线图,并确立我们长期的技术愿景」。
采访中,Mark Chen虽未直面GPT-5问题,却坦言「我们始终在努力理解深度学习的技术瓶颈,即便是当前最强推理模型,也无法有效将知识串联起来」。
同时,在他们看来,Scaling Law远未触及天花板,通过投入更多计算资源、数据,模型就会变得越来越好。
被问题如何看待AGI时,Mark Chen提出了一个指标——模型能更长时间地自主工作的能力,即「自主时间」。
这个概念简单却深刻,它代表着AI在面对复杂问题时,能持续取得进展,而无需人类干预的时间长度。
这个愿景,远远超出了当前模型的能力,自主时间仅限于几分钟到一小时,遇到陌生场景往往会「卡住」。
在AtCoder比赛中,Psyho的胜利展现了人类独有的创造性思维,类似AlphaGo当年击败李世石的围棋比赛。
Pachocki表示,「我们在这里谈论的是编程和数学,但它实际上关乎创造力,提出新颖的想法,将不同领域的想法联系起来」。