马斯克的XAI发布Grok-2 Beta版本。在LMSYS的成绩超过了Claude 3.5Sonnet和GPT-4-Turbo。
Grok-2和Grok-2 mini目前在X上测试,这个月可以通过API使用。
X上的Grok界面也获得了更新,X Premium和Premium+用户都可以访问新模型。图片生成能力用的最近非常火的FLUX图像生成模型。
XAI还说他们内容使用类似LMSYS的流程来对模型进行评估,在每次互动中,AI导师模型会看到Grok生成的两个回应。根据指南中概述的具体标准选择更优秀的回应。专注于评估模型在两个关键领域的能力:遵循指示和提供准确的事实信息。
Grok-2在推理检索内容和工具使用能力方面显示出显著改进,例如正确识别缺失信息、推理事件序列以及丢弃无关的帖子。
这一点在结合推特内容分析上明显变好了,你可以让Grok分析你的内容以及互动来改善账号的运营情况。
他们下一步将会发布Grok多模态模型的预览。
本站文章通过互联网转载或者由本站编辑人员搜集整理发布,如有侵权,请联系本站删除。