GPT4 – 风君雪科技博客

GPT4 Llama 3 人工智能

大模型一对一战斗 75 万轮，GPT-4 夺冠，Llama 3 位列第五

关于 Llama 3，又有测试结果新鲜出炉 —— 大模型评测社区 LMSYS 发布了一份大模型排行榜单，Llama 3 位列第五，英文单项与 GPT-4 并列第一。 ...

风君子
业界
2024-04-23
14

AI Claude3 GPT4

和 GPT-4 并列第一，LMSYS 基准测试显示 Claude-3 模型表现优异

3 月 28 日消息，根据 LMSYS Org 公布的最新基准测试报告，Claude-3 得分以微弱优势超越 GPT-4，成为该平台“最佳”大语言模型。 ...

风君子
业界
2024-03-28
15

ChatGPT GPT4 OpenAI

OpenAI 的 GPT 商店审核失控：被指充斥侵权和垃圾内容

3 月 21 日消息，旨在提供从编程辅助到健身建议等各种功能的 GPT 模型的 OpenAI GPT 商店正面临质量和合规性问题。 ...

风君子
业界
2024-03-21
21

Claude Claude 3 GPT4

新王 Claude 3 实测！各项能力给跪，打麻将也会，确实比 GPT-4 好用

OpenAI 不可战胜的神话，已经被打破了。随着 Claude 3（支持中文）一夜登陆，榜单性能跑分全面超越 GPT-4，成为首个全面超越 GPT-4 的产品，也坐上了全球最强大模型新王座。 ...

风君子
业界
2024-03-05
19

gemini GPT4 人工智能

谷歌 Gemini 大逆转？斯坦福 Meta 华人证明其推理性能强于 GPT-3.5

新智元报道编辑：编辑部【新智元导读】谷歌放出的 Gemini，在对标 GPT 的道路上似乎一直处于劣势，Gemini 真的比 GPT-4 弱吗？最 ...

风君子
业界
2024-01-02
33

cmu Gemini Pro Gemini Ultra GPT4 OpenAI 谷歌

谷歌 Gemini Pro 实测不如 GPT-3.5，CMU 深入对比研究：保证公平透明可重复

谷歌 Gemini 实力到底如何？卡耐基梅隆大学来了场专业客观第三方比较。为保证公平，所有模型使用相同的提示和生成参数，并且提供可重复的代码和完全透明的结果。 ...

风君子
业界
2023-12-20
29

GPT4 GPT4.5 OpenAI

GPT-4.5 秘密解禁？网友灰度测试全网热议，OpenAI 研究员回应全是幻觉

新智元报道编辑：编辑部【新智元导读】近期，关于 GPT-4.5 提前泄露的消息在全网疯传，逼的 OpenAI 研究员甚至 Altman 本人下场否 ...

风君子
业界
2023-12-18
32

GPT4 Mistral 微软

Mistral 携微软引爆“小语言模型”风潮：代码能力完胜 GPT-4，成本仅有 1/3

小模型的风潮，最近愈来愈盛，Mistral 和微软分别有所动作。而网友实测发现，Mistral-medium 的代码能力竟然完胜了 GPT-4，而所花成本还不到三分之一。 ...

风君子
业界
2023-12-17
29

gemini GPT4 谷歌

消息称谷歌 CEO 推迟 Gemini 模型发布计划，因无法可靠处理部分非英语查询

感谢网友软媒新友2203184 的线索投递！ 12 月 3 日消息，据 The Information 当地时间周六报道，两位知情人士透露称谷歌已经悄然将自家 AI 大模型 Gemini 的公开亮 ...

风君子
业界
2023-12-03
50

ChatGPT GPT4 OpenAI

最新基准测试显示 GPT-4V 错误率竟高达 90%：红绿灯认错、勾股定理也不会

【新智元导读】马里兰大学发布首个专为 VLM 设计的基准测试 HallusionBench，全面测试 GPT-4V 视觉错误和语言幻觉。 ...

风君子
业界
2023-10-31
55

ChatGPT GPT4 OpenAI

GPT-4 竟成 Nature 审稿人？斯坦福清华校友近 5000 篇论文实测，超 50% 结果和人类评审一致

【新智元导读】斯坦福学者发现，GPT-4 对于 Nature、ICLR 的论文给出的审稿意见，竟然和人类审稿人有超过 50% 的相似性。看来让大模型来帮我们审论文，并不是天方夜谭啊。 ...

风君子
业界
2023-10-07
43

GPT4 LLaVAMed 医疗

微软：GPT-4 在医疗方面颇具潜力，自家“LLaVA-Med” 模型可加速相关护理和研究

8 月 14 日消息，微软研究团队日前表示，GPT-4 此类大型模型在医疗领域有巨大的潜力，这些模型可以帮助加快医疗流程，并通过汇集大规模患者数据，建立更加精准的病理模型，以提高医疗药物的开发效率。 ...

风君子
业界
2023-08-14
64

GPT4 家乐福智能助理

家乐福推出采用 GPT-4 模型的 Hopla 购物资讯机器人，可一键规划预算、设计食谱

IT 之家 6 月 9 日消息，家乐福目前在其法国官网推出了 Hopla 购物资讯机器人，据称，该机器人基于 GPT-4 模型，顾客可以使用该机器人改善自己的购物体验。 ...

风君子
业界
2023-06-09
52

GPT4 OpenAI 人工智能

OpenAI 开发新工具，试图解释语言模型的行为

5 月 10 日消息，语言模型是一种人工智能技术，可以根据给定的文本生成自然语言。OpenAI 的 GPT 系列语言模型是目前最先进的代表之一，但注意到它们也有一个问题：它们的行为很难理解和预测。 ...

风君子
业界
2023-05-10
40

GPT4 人工智能

当 GPT-4 化身主考官：与 ChatGPT 处于同水平的有这些

GPT-4 太强，甚至已经化身“主考官”了！给其他市面上主流的大模型打分，结果自己给了自己最高分： 95.5。（好，给自己留点努力的空间）不过随后就没有上 90 的选手了。 ...

风君子
业界
2023-04-17
69

大模型一对一战斗 75 万轮，GPT-4 夺冠，Llama 3 位列第五

和 GPT-4 并列第一，LMSYS 基准测试显示 Claude-3 模型表现优异

OpenAI 的 GPT 商店审核失控：被指充斥侵权和垃圾内容

新王 Claude 3 实测！各项能力给跪，打麻将也会，确实比 GPT-4 好用

谷歌 Gemini 大逆转？斯坦福 Meta 华人证明其推理性能强于 GPT-3.5

谷歌 Gemini Pro 实测不如 GPT-3.5，CMU 深入对比研究：保证公平透明可重复

GPT-4.5 秘密解禁？网友灰度测试全网热议，OpenAI 研究员回应全是幻觉

Mistral 携微软引爆“小语言模型”风潮：代码能力完胜 GPT-4，成本仅有 1/3

消息称谷歌 CEO 推迟 Gemini 模型发布计划，因无法可靠处理部分非英语查询

最新基准测试显示 GPT-4V 错误率竟高达 90%：红绿灯认错、勾股定理也不会

GPT-4 竟成 Nature 审稿人？斯坦福清华校友近 5000 篇论文实测，超 50% 结果和人类评审一致

微软：GPT-4 在医疗方面颇具潜力，自家“LLaVA-Med” 模型可加速相关护理和研究

家乐福推出采用 GPT-4 模型的 Hopla 购物资讯机器人，可一键规划预算、设计食谱

OpenAI 开发新工具，试图解释语言模型的行为

当 GPT-4 化身主考官：与 ChatGPT 处于同水平的有这些

最新文章

苹果 M4 款 iPad Pro 2024 安兔兔 V10 跑分出炉：超 274 万分，较前代 M2 版提升约 28.7%

小明 Q5 升级版云台投影仪上架：投屏无广告，预售价 999 元

NASA 研究建设首个月球磁悬浮铁路系统，为月球资源开发提供高效运输

海马汽车 2024 年 4 月销量 633 台，同比下滑 81.52%

索尼Xperia 1 VI影像配置泄露：4800万像素LYT800主摄

为什么我的路由器5g比24g慢手机用wifi比4g慢是什么原因

宽带换路由器后无法上网路由器设置的不能上网了怎么办

路由器要多久关闭一次？多亏问了宽带师傅，难怪网速一天比一天慢

磊科路由器管理怎么登陆路由器怎么登陆设置

苹果调整 2024 款 iPad Pro 蜂窝网络规格，不再支持毫米波 5G 频段

最新评论

标签

关注我们么么哒！

最新文章

苹果 M4 款 iPad Pro 2024 安兔兔 V10 跑分出炉：超 274 万分，较前代 M2 版提升约 28.7%

最新评论

标签

关注我们 么么哒！

关注我们的公众号

关注我们么么哒！