分享到:
发表于 2025-06-30 08:27:21 楼主 | |
Mu模型是一个3.3亿参数的编码器-解码器语言模型,专为在神经处理单元(NPU)上高效运行而设计,能够实现每秒处理超过100个tokens。 与类似大小的仅解码器模型相比,Mu在首次token延迟上降低了约47%,解码速度提高了4.7倍,此外,Mu通过在某些组件中使用权重共享来减少总参数数量,从而优化性能。尽管Mu的大小仅为Phi-3.5-mini的十分之一,但其性能几乎相当,尤其在处理多词查询时表现出色。 这一功能已向Windows Insider计划的用户开放,用户可以通过下载Windows 11 Build 26120.3964(KB5058496)或更高版本来体验这一新的AI驱动的代理功能 |
|
个性签名:无
|
针对ZOL星空(中国)您有任何使用问题和建议 您可以 联系星空(中国)管理员 、 查看帮助 或 给我提意见