由百川智能开发的一个开源可商用的大规模预训练语言模型,支持中英双语,基于Transformer结构,训练于约1.2万亿tokens,具有70亿参数,提供4096的上下文窗口长度,在标准的中文和英文权威benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。
baichuan-7B的特点:
1. 支持中英文双语
2. 70亿参数的规模
3. 基于Transformer结构
4. 上下文窗口长度为4096
5. 在C-EVAL和MMLU等benchmark上表现优异
baichuan-7B的功能:
1. 文本生成
2. 自然语言理解
3. 对话系统
4. 机器翻译
5. 问答系统
6. 文本摘要
相关推荐
暂无评论...