当前位置: 首页 >
如何评价面壁新发布的端侧模型 MiniCPM-4,该模型有哪些技术亮点?
- 人气:
最近几年精力有限比较少在知乎上回答问题了,不过每次看到精彩的问题和回答还是会手痒。
趁这次MiniCPM-4模型发布,集中分享下最近一年多来的感悟和想法,也是最近跟同学朋友经常探讨的话题,抛砖引玉一起交流。
为什么做端侧模型 规模法则可持续发展问题。
大模型在规模法则(Scaling Law)的指引下,参数规模从2018年的千万量级发展到2024年的千亿量级(Llama3.1-405B)。
到了2024年下半年,逐渐出现规模法则是否可持续的大讨论…。
推荐资讯
- 2025-06-25微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?
- 2025-06-25小区楼下的自动售水机的水干净吗?
- 2025-06-25现在写 J***aScript 的是不是已经没人在用 class 这个关键字了?
- 2025-06-25如果在山上挖一个池塘不放鱼,里面会慢慢有鱼吗?
- 2025-06-25请问HDFS、TFS、GFS等分布式文件系统,哪个更适合用来做***存储?
- 2025-06-25systemd吞并了什么?
- 2025-06-25真的没有人觉得2k是一个很尴尬的分辨率吗?
- 2025-06-25印度是真的烂还是咱们在信息茧房里面?
- 2025-06-25j***aer总是说有分布式了,单体性能就不重要了,这种说法对吗?
- 2025-06-25为什么 mac mini 的 m4 版本价格这么低呢?
- 2025-06-25为什么不用rust重写Nginx?
- 2025-06-25龙芯在.NET上帮微软做CPU指令集适配,为什么到国内.NET开发者这里成了维护龙芯.NET版本?
- 2025-06-25俄罗斯为什么宁愿死磕欧洲也不经营远东地区?
- 2025-06-25你从别人的旧硬盘里发现了什么有趣的东西?
- 2025-06-25苹果电脑的 macOS 系统有多难用?
- 2025-06-25为什么 Linux 软件安装包会有依赖关系,而 Windows 软件安装包不需要?
推荐产品
-
如何看待 Rust 写的 PNG 解码器比 C 实现更快?
现在的“快”跟二十年前的“快”已经不是一个概念了。 “无畏并 -
豆包推出 AI 编程,在「编辑模式」下可以直接前端改图和文字,体验如何?对行业会带来怎样的影响?
坏消息是做前端的人更加水深火热了,好消息是后端暂时还比较安全 -
为什么广东人敢生?对别的省份提高生育率有哪些可借鉴学习之处?
在广州住了几年,搬到上海,发现在广州基本同事都已结婚生子,到 -
如何评价鸿蒙电脑无法编写其自身运行的程序?
因为现有的DevEco Studio不是自研的。 Inte
最新资讯




