您现在的位置是:广西1022 >>正文
趋境科技KTransformers+LLaMA
广西10227人已围观
简介常规LoRA微调千亿模型的成本高达数百万,这让高校、中小型实验室、初创公司甚至个人研发者难以参与。而趋境科技KTransformers与LLaMA-Factory的深度集成,彻底转变了这一现状,为大模 ...
常规LoRA微调千亿模型的成本高达数百万,这让高校、中小型实验室、初创公司甚至个人研发者难以参与。而趋境科技KTransformers与LLaMA-Factory的深度集成,彻底转变了这一现状,为大模型微调给予了低成本、高效率的新挑选。
该方案支撑顾客应用 LoRA 等轻量级微调方法,在极少量 GPU 资产下完成模型定制。经实测,仅占用约 41GB 显存,协作 2T 内存,就能达成 46.55 token/s 的微调吞吐量。关于研发者而言,操作流程也十分简便:只需与此同时安装KTransformers与LLaMA-Factory环境,配置好Kimi-K2的yaml文件并运行,即可开启微调任务。更关键的是,这是目前在花费级显卡上达成微调超大参数MoE模型的唯一可行方案。

在性能对比测试中,KTransformers微调方案长处显著。在较小规模的MoE模型(DeepSeek-14B)测试中,其吞吐速率超出常规方案1.8倍,显存占用较常规方案减少 82%。常规方案多依赖H100等高端 GPU,而KTransformers可支撑4090级花费级显卡,大幅减少了硬件门槛。这一方案让革新门槛显著减少,学术研发领域能尝试更多样化的念头,公司应用层面可针对自身需求迅速微调出定制化模型,且成本和周期大幅缩减,产品迭代更灵活高效
Tags:
相关文章
中标!首个“量子计算+保险”工程!玻色量子中标平安产险量子计算采购工程
广西10222025年12月,我国平安保险集团)股份有限公司发布保险领域量子计算综合应用探讨业务采购工程中选通知书。通知书上表明,北京玻色量子科技有限公司以下简称“玻色量子”)胜利中标我国 ...
【广西1022】
阅读更多信然空压机、真空泵、鼓风机、中央空调助力零碳产业园建设
广西1022信然空压机、真空泵、鼓风机及中央空调等产品经过技术革新与系统集成,在零碳产业园建设中展现出显著的节能降碳实力设备节能均大于30%以上),其核心应用与长处可归纳如下:第一、信然空压机经过永磁变频多级压缩 ...
【广西1022】
阅读更多人保寿险郑州中心支公司协同惠济区人社局开展二三支柱养老保险宣讲
广西10229月17日,2025年度郑州市二三支柱养老保险宣讲行动开启仪式顺利举行。当做本次行动的协办方之一,人保寿险郑州中心支公司协同对接单位郑州市惠济区人力资产和公众保证局,为辖区公司职工搭建养老保证方针沟通 ...
【广西1022】
阅读更多