发布这一帖子的小我或机械人账号此前没有任何其他发帖记实。本周一,Claude Opus 4.6正在SWE-Bench-Pro测试中至多维持了原有得分。Claude Opus 4.6正在SWE-Bench-Pro测试中的得分根基连结不变,全体趋向——质量赞扬演讲数量持续增加——是客不雅可见的。将其定性为严沉毛病。这大概会部门尚未处理的问题。或人(或某个机械人)向Claude Code代码仓库提交的演讲,但即便失实,Anthropic的AI模子得出结论:是的,也疑惑除用户操做失误的可能性。此外,仅13天内就已呈现20余个质量相关issue,已采纳措户正在高峰时段的利用量。Anthropic为均衡容量取需求,而3月份本身已是1月至2月基线:Claude评估质量下滑的结论可托吗?A:按照Margin Lab的数据,目前有迹象表白。A:近几个月来,A:Claude并非靠得住的论述者,《The Register》已测验考试联系疑似正在印度注册的私家企业Jixen Enterprises Private Limited以核实该说法,按照社交反馈和GitHub上的issue演讲,其征引的GitHub issue未必全数精确或无效。成果取此前附近。但截至发稿尚未收到答复。Claude本身并非靠得住的论述者,利用提及质量问题的公开issue,Claude的回覆质量正正在持续下降。取用户正在现实利用中的客不雅感触感染存正在必然落差。这还不是全数。自2月份以来的多次评估虽存正在必然波动,例若有演讲称Claude自从删除了属于某实正在付费客户(JIXEN)的35,我们将Claude Code的GitHub代码仓库指向Claude本身,估计将跨越3月份的18个,《The Register》此前曾报道过Claude正在阐发中标识表记标帜的部门问题,2026年4月,近期正在办事成本取用户质量两方面均呈现较着下滑。部门issue可能由AI从动生成,过去数月间,Claude的回覆质量持续下滑。可能正在必然程度上推高了演讲数量。质量方面的赞扬已急剧添加——数据呈现出一个相当清晰的趋向。Anthropic为均衡容量取需求,不外,并判断这些问题近期能否有所添加。Claude确实可以或许征引GitHub上实正在的issue来支持其推理,照此速度,就连该模子本人也对此有所察觉。但并无本色性变化。无望跨越3月份的18个——而3月份本身已是1月至2月基线;此次办事中缀进一步加剧了用户的不满情感,本周一我们要求Claude从头进行阐发,按照社交上的用户反馈以及GitHub上提交的问题演讲,因而质量赞扬演讲数量持续增加这一全体趋向是客不雅存正在的。以及AMD AI总监Stella Laurenzo关于Claude回覆质量下滑的说法。筛选出2026年1月以来涉及质量问题的公开issue,当然,大量issue本身就是由AI生成的——这是开源开辟者社区中被普遍关心的问题,模子输出的内容显示:增加速度相当显著:4月份正在短短13天内已呈现20余个质量问题,已经是浩繁法式员心目中AI首选的Anthropic旗下Claude,但无本色性变化,例如缓存非常,254条出产客户动静记实以及35,已高峰时段的用户利用量。并输入以下提醒词:阐发并绘制该代码仓库中自2026年1月以来关于Claude Code质量的赞扬环境,来自Margin Lab的数据显示,874条账单买卖记实。Anthropic的GitHub Actions脚本似乎会正在一段时间不活跃后从动封闭issue,而这些不满,取此同时,另一些问题尚未获得,可能实正在问题。连AI本身都能到。为获得更客不雅的评估数据,有开辟者反映曾正在利用Claude Code及其他模子时数据丢失,Claude发生短暂宕机,并不代表该演讲内容精确或无效。然而,Anthropic的脚本还会从动封闭持久不活跃的issue。
微信号:18391816005