my-anki-reviews

Day02 笔记

1 GPT-1 模型

2 GPT-2 模型

3 GPT-3 模型

4 ChatGPT 模型

5 ChatGLM模型



配置 数据
参数 6.2B
隐藏层维度 4096
层数 28
注意力头数 32
训练数据 1T
词表大小 130528
最大长度 2048

2.7 迭代版本


6 LLaMA模型


配置 数据
参数 6.7B
隐藏层维度 4096
层数 32
注意力头数 32
训练数据 1T
词表大小 32000
最大长度 2048

7 Qwen模型



8 Baichuan-7B模型


配置 数据
参数 7B
隐藏层维度 4096
层数 32
注意力头数 32
训练数据 1.2T
词表大小 64000
最大长度 4096