GitHub – XiaoMi/MiLM-6B

8个月前更新 155 00

Contribute to XiaoMi/MiLM-6B development by creating an account on GitHub.

所在地:
中国
语言:
zh
收录时间:
2025-04-05
其他站点:
GitHub – XiaoMi/MiLM-6BGitHub – XiaoMi/MiLM-6B

项目背景
小米集团开源的MiLM6B大语言模型项目,作为中文自然语言处理领域的重要实践,基于Transformer架构打造60亿参数规模的预训练模型。该项目通过GitHub平台持续更新,2023年内已迭代3个主要版本,提供从模型权重到完整训练框架的开源解决方案。

核心能力
模型在CEval中文评测中展现出超越同规模竞品的语言理解能力,特别强化中文成语与诗歌生成场景。支持FP16量化压缩技术,实现消费级GPU(如RTX 3090)的流畅部署,配套RLHF对齐工具链和LoRA微调方案,满足企业私有化部署需求。

开发者支持
项目维护团队保持每月12次文档更新频率,通过GitHub Issues提供24小时内响应的技术支持。技术文档采用结构化README设计,包含微调示例、训练参数配置说明等实战指导,助力AI工程师快速实现业务场景适配。

行业影响
已入选CLUE中文语言理解基准测评体系,获得机器之心等科技媒体深度报道。作为小米”技术普惠”理念的实践载体,该项目为中文NLP领域提供可媲美ChatGLM、ERNIE Bot的轻量化替代方案,特别适合需要自主可控AI能力的企业用户。

相关导航

EUREKA科研大模型-ReadPaper – 轻松读论文 | 专业翻译 | 一键引文 | 图表同屏

EUREKA科研大模型-ReadPaper – 轻松读论文 | 专业翻译 | 一键引文 | 图表同屏

ReadPaper是深圳学海云帆科技有限公司推出的专业论文阅读平台和学术交流社区,收录近2亿篇论文、近2.7亿位科研论文作者、近3万所高校及研究机构,包括nature、science、cell、pnas、pubmed、arxiv、acl、cvpr等知名期刊会议,涵盖了数学、物理、化学、材料、金融、计算机科学、心理、生物医学等全部已知学科,打造专业的学术讨论社区。科研工作离不开论文的帮助,如何读懂论文,读好论文,这本身就是一个很大的命题,我们的使命是:“让天下没有难读的论文”。
腾讯生命科学实验室 – iDrug

腾讯生命科学实验室 – iDrug

iDrug, 人工智能药物发现平台, AI 驱动的临床前新药研发开放平台,基于腾讯生命科学实验室自主研发的深度学习算法,同时提供数据库和云计算支持,致力于帮助用户大幅度减少寻找潜在活性药物的时间和成本。iDrug, AI driven drug discovery platform, A drug discovery software platform that integrates molecular database, AI modeling and cloud computation, as well as workflow optimization, in one place.
曹植大模型管理平台 – 一站式企业级大模型生产平台,自研或开源大模型集中管理、训练—达观

曹植大模型管理平台 – 一站式企业级大模型生产平台,自研或开源大模型集中管理、训练—达观

曹植大模型管理平台(LLMP,large language model platform)可应用于对自研及开源大模型集中管理、调度、扩展;实现模型fine-tuning;实现训练数据管理、模型训练、模型评估、模型服务、指令Prompt工程、模型训练监控、GPU集群监控等的全方位管理,广泛应用于金融、工业制造、政府等具有文本内容 生成场景、知识管理及问答场景的行业,为企业构建规范的大模型管理及训练执行流程,将数据、模型、服务、指令管理及系统监控等流程规范化并实现有效闭环,手把手式引导企业构建完善的大模型运维模式及管理体系。

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...