BiLLa是开源的推理能力增强的中英双语LLaMA模型。模型的主要特性有:
- 较大提升LLaMA的中文理解能力,并尽可能减少对原始LLaMA英文能力的损伤;
- 训练过程增加较多的任务型数据,利用ChatGPT生成解析,强化模型理解任务求解逻辑;
- 全量参数更新,追求更好的生成效果。
因个人精力有限,我未能将BiLLa与当前主流的开源大模型进行充分的对比评测。以下是经过有限的评测分析得出的结论:
- BiLLa-7B-LLM 中英语言建模能力显着优于 Chinese-LLaMA-7B ;
- BiLLa-7B- SFT 中文推理能力显着优于 BELLE-LLaMA-Ext-7B 等模型;
- 由GPT4打分,BiLLa-7B-SFT 在英文指令上得分显着高于 ChatGLM-6B ,中文得分持平,但解题与代码得分更高。
官网:
https://github.com/Neutralzz/BiLLa
软件收集于互联网和粉丝上传,仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。
本站信息来自网络和网友,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。
本站如果侵犯你的利益,请务必携带权利证明请发送邮箱到doraera@163.com ,我们会第一时间为您处理。
[…] 地址:BiLLa – 阿噜噜同学 (arlulu.com) […]