LG AI Research 推出韩国首个开源 AI 模型 EXAONE 3.0,基于 Decoder-only Transformer 架构,参数数量为 7.8B,训练数据量(tokens)为 8T,是英语和韩语双语模型。提前开源 7.8B 指令调整模型用于研究,希望助力国内外 AI 研究人员及推动 AI 生态系统发展。官方测试显示,该模型英语能力达全球顶级水平,真实用例平均分第一,在数学和编码方面平均得分也排第一,推理能力较强;在韩语方面,实际用例和单一基准的平均得分均排第一。与上一代产品相比,EXAONE 3.0 推理时间缩短 56%,内存使用量减少 35%,运营成本降低 72%;与首次发布的 EXAONE 1.0 相比成本降低 6%。该模型已在 6000 万个与专利、代码、数学和化学相关的专业数据案例上训练,计划年底前扩展到各领域的 1 亿个案例。
开源地址:
https://github.com/LG-AI-EXAONE
https://huggingface.co/LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct
本站文章通过互联网转载或者由本站编辑人员搜集整理发布,如有侵权,请联系本站删除。