Stanford CRFM

2个月前发布 39 00

网站整体介绍 该页面是斯坦福大学基础模型研究中心(CRFM)发布的关于Alpaca 7B模型的研究介绍页面,核心内容围绕这款低成本、易复现的指令跟随语言模型展开,旨在为学术社区提供研究指令跟随模型的基础工具。 核心内容与功能模块 1. 模型背景与目标 此前学术圈缺乏能力接近闭源模型(如OpenAI textdavinci003)的易用开源...

所在地:
中国
语言:
zh
收录时间:
2025-10-06
其他站点:
Stanford CRFMStanford CRFM

网站整体介绍
该页面是斯坦福大学基础模型研究中心(CRFM)发布的关于Alpaca 7B模型的研究介绍页面,核心内容围绕这款低成本、易复现的指令跟随语言模型展开,旨在为学术社区提供研究指令跟随模型的基础工具。

核心内容与功能模块
1. 模型背景与目标
此前学术圈缺乏能力接近闭源模型(如OpenAI textdavinci003)的易用开源指令跟随模型,CRFM团队因此开发Alpaca 7B——基于Meta LLaMA 7B模型微调而成,旨在降低学术研究门槛。

2. 训练方法与成本
数据生成:基于selfinstruct方法,用textdavinci003从175条人工指令种子集扩展生成52K条独特的指令输出演示数据,成本低于500美元。
模型微调:使用Hugging Face框架,在8张80GB A100显卡上微调3小时,成本低于100美元;整体复现成本不足600美元。

3. 初步性能评估
通过人类盲评(5位学生作者)对比textdavinci003与Alpaca在selfinstruct评估集(覆盖邮件写作、社交媒体等用户场景)的表现,结果显示两者性能相近——Alpaca获胜90次,textdavinci003获胜89次。

4. 已知限制
Alpaca存在语言模型常见缺陷:
幻觉问题:例如错误声称坦桑尼亚首都是达累斯萨拉姆(实际为多多马,1974年迁都);
错误信息传播:可生成看似合理但不准确的内容(如关于“随机种子42”的错误解释);
此外还存在毒性内容、社会刻板印象等问题。

5. 发布资产与后续计划
已发布内容:互动demo(因托管成本和内容过滤不足已关闭)、52K训练数据、数据生成代码、模型微调代码;
未来计划:向Meta申请指导后发布模型权重(包括7B及更大规模LLaMA微调版本)。

6. 发布决策与风险管控
发布目的:推动学术研究,让社区能研究指令跟随模型的缺陷与改进方向;
风险 mitigation:
内容过滤:用OpenAI内容审核API过滤有害内容;
输出水印:用Kirchenbauer等人2023年提出的方法为输出加水印,便于识别模型生成内容;
使用条款:限制非商用,要求遵循LLaMA模型许可协议。

7. 未来研究方向
评估优化:用CRFM的HELM(语言模型整体评估框架)开展更严格的生成式场景评估;
安全研究:通过自动红队测试、审计等方法提升模型安全性;
能力解读:研究基础模型属性、数据规模、训练流程对模型能力的影响,探索selfinstruct方法的替代方案。

其他信息
页面还介绍了作者团队(来自CRFM、HAI等机构)、致谢(感谢Meta、selfinstruct团队、Hugging Face等),以及CRFM的其他研究项目(如HELM、Levanter等)链接。

相关导航

腾讯生命科学实验室 – iDrug

腾讯生命科学实验室 – iDrug

iDrug, 人工智能药物发现平台, AI 驱动的临床前新药研发开放平台,基于腾讯生命科学实验室自主研发的深度学习算法,同时提供数据库和云计算支持,致力于帮助用户大幅度减少寻找潜在活性药物的时间和成本。iDrug, AI driven drug discovery platform, A drug discovery software platform that integrates molecular database, AI modeling and cloud computation, as well as workflow optimization, in one place.
GitHub – nilsherzig/LLocalSearch: LLocalSearch is a completely locally running search aggregator using LLM Agents. The user can ask a question and the system will use a chain of LLMs to find the answer. The user can see the progress of the agents and the final answer. No OpenAI or Google API keys are needed.

GitHub – nilsherzig/LLocalSearch: LLocalSearch is a completely locally running search aggregator using LLM Agents. The user can ask a question and the system will use a chain of LLMs to find the answer. The user can see the progress of the agents and the final answer. No OpenAI or Google API keys are needed.

LLocalSearch is a completely locally running search aggregator using LLM Agents. The user can ask a question and the system will use a chain of LLMs to find the answer. The user can see the progress of the agents and the final answer. No OpenAI or Google API keys are needed. - nilsherzig/LLocalSearch

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...