另外关于NPU,从samples拿了个llama.cpp,prompt processing / text generation 的功耗大概是图里这样。
7B q4_0的实际性能:prompt processing大约20 token/s和火力全开的28W 4+8 CPU差不多,text generation大约6 token/s是2CCX CPU的一半(NPU内存带宽也相当于单个CCX)
跑LLM只能说聊胜于无吧。
7B q4_0的实际性能:prompt processing大约20 token/s和火力全开的28W 4+8 CPU差不多,text generation大约6 token/s是2CCX CPU的一半(NPU内存带宽也相当于单个CCX)
跑LLM只能说聊胜于无吧。
至于为什么等效延迟是1而不是0.5,这是我目前遇到的一个主要问题。
目前版本的微码似乎单个线程是无论如何都看不到两个解码器的,也就是出了op$或者关掉op$之后前端直接就变成4-wide并且只能每周期1 taken了(无论带不带分支跳转)。这个显然跟AMD宣传的单线程可以用两个decoder不符,需要更多调查。
目前版本的微码似乎单个线程是无论如何都看不到两个解码器的,也就是出了op$或者关掉op$之后前端直接就变成4-wide并且只能每周期1 taken了(无论带不带分支跳转)。这个显然跟AMD宣传的单线程可以用两个decoder不符,需要更多调查。
果然不出所料的看到知乎上有人分析地洋洋洒洒,讲Intel是个好公司,它越来越不行本质上是美国不行了。
嗯,我觉得他说的全都对,因为抢走Intel营收的NVIDIA是印度公司,AMD是越南公司,Apple是朝鲜公司。先进半导体行业早就没美国什么事了,散了散了。
嗯,我觉得他说的全都对,因为抢走Intel营收的NVIDIA是印度公司,AMD是越南公司,Apple是朝鲜公司。先进半导体行业早就没美国什么事了,散了散了。
David's random thoughts
服了华硕,新机器发出来不给驱动下载,于是我wipe掉自带的预装系统弄了个24H2 LTSC之后就有个谜之ACPI设备感叹号在这儿…… 我在犹豫要不要去UEFI菜单里联网恢复自带系统,就为了捞这一个驱动出来!
实在忍不住强迫症还是下载了个原版镜像,看起来是这玩意,给触摸板实现手势用的HID filter。
LNL本身整体综合看表现还是不错的,但是唯独定低价这一点完全不可能……全身上下都在打金币弹的金贵玩意
https://x.com/cherylnatsu/status/1820032097253490968
https://x.com/cherylnatsu/status/1820032097253490968
更新Ryzen AI 9 HX 370 (名字真难念)的大/小核心测试成绩。大核能摸到M2附近,小核是8cx gen 3的大核水平,正好这两组对比的缓存容量接近,不过ARM两家有一些SLC
目前测的内容感觉凑不齐一篇文章,后面等桌面出了再慢慢凑吧…其实PMC比较让人意外,还需要一些时间来分析。
目前测的内容感觉凑不齐一篇文章,后面等桌面出了再慢慢凑吧…其实PMC比较让人意外,还需要一些时间来分析。
HX370不同环境下的Geekbench 5/6测试也更新在了我的Geekbench Browser个人资料页面:https://browser.geekbench.com/user/391511
当我跑了好几天脚本把Strix Point大小核的高负载能效曲线分别画出来之后,我只能说我从未见过比Zen5c更纯粹的刷分小核。2GHz以上完全找不到任何同频下有能效优势的场景,哪怕排除一切缓存敏感的子项。
想了想可能只有CC0状态下的漏电功耗有优势,拿来断断续续地跑点轻度后台应用?
想了想可能只有CC0状态下的漏电功耗有优势,拿来断断续续地跑点轻度后台应用?
前些年反智战狼自媒体还说星链是太空垃圾抢占轨道,结果轮到自家发的时候真变成太空垃圾占轨道了😅
据说8月六号发射的长征六号甲火箭发生末端解体,真的假的?
据说8月六号发射的长征六号甲火箭发生末端解体,真的假的?
Zen 5 补充测试 (2/2): 性能与能效 (移动端)
https://blog.hjc.im/zen-5-more-details-2.html
https://blog.hjc.im/zen-5-more-details-2.html