关于 Llama 3,又有测试结果新鲜出炉 —— 大模型评测社区 LMSYS 发布了一份大模型排行榜单,Llama 3 位列第五,英文单项与 GPT-4 并列第一。 ...
3 月 28 日消息,根据 LMSYS Org 公布的最新基准测试报告,Claude-3 得分以微弱优势超越 GPT-4,成为该平台“最佳”大语言模型。 ...
3 月 21 日消息,旨在提供从编程辅助到健身建议等各种功能的 GPT 模型的 OpenAI GPT 商店正面临质量和合规性问题。 ...
OpenAI 不可战胜的神话,已经被打破了。 随着 Claude 3(支持中文)一夜登陆,榜单性能跑分全面超越 GPT-4,成为首个全面超越 GPT-4 的产品,也坐上了全球最强大模型新王座。 ...
  新智元报道   编辑:编辑部 【新智元导读】谷歌放出的 Gemini,在对标 GPT 的道路上似乎一直处于劣势,Gemini 真的比 GPT-4 弱吗?最 ...
谷歌 Gemini 实力到底如何?卡耐基梅隆大学来了场专业客观第三方比较。为保证公平,所有模型使用相同的提示和生成参数,并且提供可重复的代码和完全透明的结果。 ...
  新智元报道   编辑:编辑部 【新智元导读】近期,关于 GPT-4.5 提前泄露的消息在全网疯传,逼的 OpenAI 研究员甚至 Altman 本人下场否 ...
小模型的风潮,最近愈来愈盛,Mistral 和微软分别有所动作。而网友实测发现,Mistral-medium 的代码能力竟然完胜了 GPT-4,而所花成本还不到三分之一。 ...
感谢网友 软媒新友2203184 的线索投递! 12 月 3 日消息,据 The Information 当地时间周六报道,两位知情人士透露称谷歌已经悄然将自家 AI 大模型 Gemini 的公开亮 ...
【新智元导读】马里兰大学发布首个专为 VLM 设计的基准测试 HallusionBench,全面测试 GPT-4V 视觉错误和语言幻觉。 ...
【新智元导读】斯坦福学者发现,GPT-4 对于 Nature、ICLR 的论文给出的审稿意见,竟然和人类审稿人有超过 50% 的相似性。看来让大模型来帮我们审论文,并不是天方夜谭啊。 ...
8 月 14 日消息,微软研究团队日前表示,GPT-4 此类大型模型在医疗领域有巨大的潜力,这些模型可以帮助加快医疗流程,并通过汇集大规模患者数据,建立更加精准的病理模型,以提高医疗药物的开发效率。 ...
IT 之家 6 月 9 日消息,家乐福目前在其法国官网推出了 Hopla 购物资讯机器人,据称,该机器人基于 GPT-4 模型,顾客可以使用该机器人改善自己的购物体验。 ...
5 月 10 日消息,语言模型是一种人工智能技术,可以根据给定的文本生成自然语言。OpenAI 的 GPT 系列语言模型是目前最先进的代表之一,但注意到它们也有一个问题:它们的行为很难理解和预测。 ...
GPT-4 太强,甚至已经化身“主考官”了! 给其他市面上主流的大模型打分,结果自己给了自己最高分: 95.5。(好,给自己留点努力的空间) 不过随后就没有上 90 的选手了。 ...

关注我们的公众号

微信公众号