WWW.YOUINFO.SITE
标签聚合 DS4

/tag/DS4

LinuxDo 最新话题 · 2026-06-10 01:55:45+08:00 · tech

这里我修改了我的问题,不知道切换到第一次回答为什么问题没有恢复显示 我第一次问的是:我只是因为不会读那个单词,所以我用了缩写,这你都看不懂吗 这一句话是缩写 你们不会也看不懂吧 佬友也说了这一句,所以我还特地把前一个M5改成了my AI这都看不懂,我没辙了 我提示了一下,我用的是缩写 结果还是没救了,抬走吧 智谱glm5.1秒了:(回答的也是一开始的问题) 还贴心的告诉了我读法~ 换了个问法,还是秒了: 没有让他重新回答这个问题,是因为我怕他根本就不提这个事,因为他看得懂… 看懂的话,这个事就没什么值得谈的地方 人家合作伙伴的事,跟我们有什么关系 话题内容来自这里: 通过官方文档解析fable5|千万上下文? 我整理了16个要点(一点一句话 只说核心) 1 个帖子 - 1 位参与者 阅读完整话题

v2ex · 2026-05-27 14:28:41+08:00 · tech

AirPods4 的优点就不说了,每个人佩戴感受不一样,但是降噪真得说道说道。 最难受的是那种突发冲击声,比如地铁关门、轨道撞击声,不但压不住,甚至会突然被放大把你吓一跳 次要难受的是从通透切到降噪的时候,过渡特别不自然,整个声音的变化非常让人难受,反观 AirPods pro1 线性很多 很多细碎噪音还是会不断漏进来,降噪效果不如 AirPods pro1 另外,AirPods4 的电池仓盖子感觉也没有那么扎实,盒盖的声音空空的,没法当作解压工具一直开合 如果是冲着在地铁中降噪使用,我强烈不推荐。 我能想到的一种使用场景是:在一个稳定的噪音环境下,把这个空间里面的噪音给隔绝。但这听起来真的有点扯!

v2ex · 2026-05-27 14:28:41+08:00 · tech

AirPods4 的优点就不说了,每个人佩戴感受不一样,但是降噪真得说道说道。 最难受的是那种突发冲击声,比如地铁关门、轨道撞击声,不但压不住,甚至会突然被放大把你吓一跳 次要难受的是从通透切到降噪的时候,过渡特别不自然,整个声音的变化非常让人难受,反观 AirPods pro1 线性很多 很多细碎噪音还是会不断漏进来,降噪效果不如 AirPods pro1 另外,AirPods4 的电池仓盖子感觉也没有那么扎实,盒盖的声音空空的,没法当作解压工具一直开合 如果是冲着在地铁中降噪使用,我强烈不推荐。 我能想到的一种使用场景是:在一个稳定的噪音环境下,把这个空间里面的噪音给隔绝。但这听起来真的有点扯!

v2ex · 2026-05-27 14:28:41+08:00 · tech

AirPods4 的优点就不说了,每个人佩戴感受不一样,但是降噪真得说道说道。 最难受的是那种突发冲击声,比如地铁关门、轨道撞击声,不但压不住,甚至会突然被放大把你吓一跳 次要难受的是从通透切到降噪的时候,过渡特别不自然,整个声音的变化非常让人难受,反观 AirPods pro1 线性很多 很多细碎噪音还是会不断漏进来,降噪效果不如 AirPods pro1 另外,AirPods4 的电池仓盖子感觉也没有那么扎实,盒盖的声音空空的,没法当作解压工具一直开合 如果是冲着在地铁中降噪使用,我强烈不推荐。 我能想到的一种使用场景是:在一个稳定的噪音环境下,把这个空间里面的噪音给隔绝。但这听起来真的有点扯!

LinuxDo 最新话题 · 2026-05-27 02:14:00+08:00 · tech

(「依旧完美」夸的是 MiMo2.5p ) 哈基米3.5闯的祸 由 deepseek glm mimo gemini3.1p gpt5.5 来救场… 难绷 永远永远 不要太信任哈基米2.5以后的任何模型 gemma4-31b是可以信任的 略低配且更慢的2.5p 总之,靠这五员大将 最终的对话结果还是挺好的 22万token… 提示词占了一大部分 尤其是我自己的提示词更新审查网站提供的日志大概就占了几万… https://textflux.stellafortuna.dpdns.org/ 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-11 09:39:53+08:00 · tech

最近随着ds4的出现,越来越多的人们开始使用cc+ds的工作流。笔者感觉这是一件大好事,保证了国人的编程下限。所以既然未来是vibe coding的时代,那么我们在巩固自己能力的同时,也要去接触这些工作流。 1、前置工作,检查电脑是否下载了git,node.js 2、利用node.js下载claude code,具体命令可以在网上搜。大概是命令行 npm install -g @anthropic-ai/claude-code 3、下载cc-switch,这个开源软件能够方便你在cc与codex中使用多供应商的api,并且丝滑管理聊天记录。 4、在cc-switch新建供应商并进行测试,此处以deepseek官网为例,在cc-switch中选择deepseek 在对应的地方填入自己的key(该key需要上deepseek官网获取) 注意这里可能是最新版ccs有些小bug,或者接口不通用。点开完整url可以获取模型列表,但是实际使用需要关掉完整url。 plus:cc-switch另一个好处就是能充分使用公益站的能力,佬友们可以大大探索,但是要注意是公益站支持cc与codex使用的才行。 5、通过在命令行输入claude,此时如果出现一些别的报错可以查看ai,如果没有别的问题应该是需要登录,这个时候我们去自己的C:\Users{用户名}.claude.json,在其中加入 "hasCompletedOnboarding": true 6、再次登录即可丝滑使用,如果不喜欢相应终端,可以在vscode中下载claude code插件,目前已经能正常使用。但是点击插件启动的时候需要耐心等待,可能会先是登录界面但随后就不需要登录直接问问题。 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-10 23:54:02+08:00 · tech

最近看到redis之父antirez 专门为 DeepSeek V4 写了一个 Apple Metal 专用本地推理引擎 ds4.c,项目发布3天,立马收获了5.5k Star,据说性能优化提升很大,既然这么火热,那就本地部署看看能不能实现token自由~ 在本地跑 DeepSeek V4 Flash ; 用 Apple Metal 加速; 提供 OpenAI / Anthropic compatible API; 可以接 Claude Code / coding agent; 我的机器配置: cpu: M5 Max Memory: 128GB Backend: Metal Model: DeepSeek V4 Flash q2 GGUF Project: https://github.com/antirez/ds4 第一步:克隆源码 git clone https://github.com/antirez/ds4.git 第二步:编译 make -j"$(sysctl -n hw.ncpu)" 成功后会生成: ./ds4 ./ds4-server 检查一下: ls -lh ds4 ds4-server 第三步:下载 q2 模型 cd ~/ds4 ./download_model.sh q2 下载完成后应该看到: gguf/DeepSeek-V4-Flash-IQ2XXS-w2Q2K-AProjQ8-SExpQ8-OutQ8-chat-v2.gguf 并且会自动创建: ds4flash.gguf -> gguf/DeepSeek-V4-Flash-IQ2XXS-w2Q2K-AProjQ8-SExpQ8-OutQ8-chat-v2.gguf 检查: ls -lh gguf ls -lh ds4flash.gguf 模型大小80G我下载耗时15分钟~ === attempt 12 Sun May 10 21:26:30 CST 2026 resume=5541790312 pct=6.39% === ** Resuming transfer from byte position 5541790312 % Total % Received % Xferd Average Speed Time Time Time Current Dload Upload Total Spent Left Speed 100 1435 100 1435 0 0 314 0 0:00:04 0:00:04 --:--:-- 412 100 75.6G 100 75.6G 0 0 83.4M 0 0:15:27 0:15:27 --:--:-- 79.7M === attempt 12 ended rc=0 Sun May 10 21:41:58 CST 2026 size=86720111200 === === q2 download complete Sun May 10 21:41:58 CST 2026 === 第四步:启动 ds4-server 下载完成后先检查: cd ~/ds4 ls -lh gguf/*IQ2XXS*.gguf ls -lh ds4flash.gguf 然后启动: cd ~/ds4 ./ds4-server \ --ctx 100000 \ --kv-disk-dir /tmp/ds4-kv \ --kv-disk-space-mb 16384 启动参数说明 ctx 我选择100000,也就是100k tokens 上下文 先试试水 kv-disk-dir kv缓存路径 kv-disk-space-mb kv缓存大小,我的mac有1T大小,很宽裕,那么我就用16384 也就是16G 那么就写一个快速启动的脚本 #!/bin/sh set -e cd "$(dirname "$0")" usage() { cat <<EOF Usage: ./start-server-q2-custom.sh [CTX_TOKENS] [KV_MB] [PORT] Defaults: CTX_TOKENS = 100000 KV_MB = 16384 PORT = 8000 Examples: ./start-server-q2-custom.sh ./start-server-q2-custom.sh 100000 16384 ./start-server-q2-custom.sh 200000 32768 ./start-server-q2-custom.sh 65536 8192 8001 EOF } case "${1:-}" in -h|--help|help) usage exit 0 ;; esac CTX="${1:-100000}" KV_MB="${2:-16384}" PORT="${3:-8000}" KV_DIR="${DS4_KV_DIR:-/tmp/ds4-kv}" HOST="${DS4_HOST:-127.0.0.1}" is_pos_int() { case "$1" in ''|*[!0-9]*) return 1 ;; *) [ "$1" -gt 0 ] ;; esac } if ! is_pos_int "$CTX"; then echo "ERROR: CTX_TOKENS must be a positive integer, got: $CTX" >&2 usage >&2 exit 1 fi if ! is_pos_int "$KV_MB"; then echo "ERROR: KV_MB must be a positive integer, got: $KV_MB" >&2 usage >&2 exit 1 fi if ! is_pos_int "$PORT"; then echo "ERROR: PORT must be a positive integer, got: $PORT" >&2 usage >&2 exit 1 fi if [ ! -x ./ds4-server ]; then echo "ERROR: ./ds4-server not found or not executable. Run make first." >&2 exit 1 fi if [ ! -e ./ds4flash.gguf ]; then echo "ERROR: ./ds4flash.gguf not found. Download q2 first: ./download_model.sh q2" >&2 exit 1 fi mkdir -p "$KV_DIR" echo "Starting ds4-server..." echo " URL: http://$HOST:$PORT" echo " ctx: $CTX" echo " KV dir: $KV_DIR" echo " KV budget: ${KV_MB} MB" echo " model: ds4flash.gguf" echo exec ./ds4-server \ --host "$HOST" \ --port "$PORT" \ --ctx "$CTX" \ --kv-disk-dir "$KV_DIR" \ --kv-disk-space-mb "$KV_MB" 通过脚本快速启动 ./start-server-q2-custom.sh 100000 16384 8123 接入工具实测 终于到了实测的时候 欢迎我们的老朋友~ CC Switch 这里key随便填写即可 准备进入claude code 性能查看 首次对话会加载系统提示词,所以会稍微慢一点,让我们观察log 查看一下性能如何 首次加载系统提示词 耗时 3m13s 后续对话性能实测 第二次对话 耗时 12s,因为已经把claude code系统提示词缓存至了kv,所以速度大大提升 干活实测 现在让他干点活试试,因为我一般不会只用对话问题来测模型智商,我只在乎实战时是否能够干活~ 目标: 网站: https://outlook.tw/ , 使用python,实现用目标网站生产临时邮箱,和使用临时邮箱接收邮件,已知 生产邮箱是: https://outlook.tw/api/generate?length=8&domainIndex=0,响应:{“email”:“[email protected]”,“expires”:1778426900490,“anonymous”:true},获取邮件是:https://outlook.tw/api/emails?mailbox=2ndfmaet%40outlook.tw 最终耗时大概15~20分钟左右完成,但是我发现其实启动参数时还有可以优化的地方,并且claude code本来系统提示词就很重,还有我发现一个比较有意思的现象,就是当ds4.c在常驻后台是,内存占用并不大,从活动内存/常驻内存观察,闲置时占用很低;ds4.c 使用 mmap/按需加载,真正推理时内存占用会上来 干活中: 闲置时: ds4.c不像omlx或者lm studio,模型常驻后台就占用很大的内存,这一点优化做的真的是很棒 性能调优 我发现其实还可以在不降智的情况下,将速度调快 我发现每次工具调用后,大概都有3分钟左右的 重建等待,因为默认是从更长的上下文中去找工具调用的缓存,这个其实在硬盘充裕的情况下,可以 加大 kv容量 和 缩短 缓存保存频率 当前git项目里,默认的kv-cache-continued-interval-tokens 是10000 那么我们就激进一些,设置为2048 每增长多少 tokens 存一次 live KV。数值越小,每次工具调用 后 重建时 可回退的位置越近,但是代价就是增加了读写硬盘的频率,速度和硬盘寿命的平衡,这个就因人而异了,我们只是测试的前提下,暂时就先不考虑硬盘寿命 最终我选择的启动参数如下 ./ds4-server \ --ctx 100000 \ --kv-disk-dir "$HOME/ds4-kv" \ --kv-disk-space-mb 131072 \ --kv-cache-cold-max-tokens 100000 \ --kv-cache-continued-interval-tokens 2048 128G kv缓存 长 prompt 也建立缓存 每 2048 tokens 存一次 kv 那么现在我来删除上次任务的kv,重新跑一次任务试试 rm -rf /tmp/ds4-kv 然后使用调优过的参数启动 同样的任务 重新实测 这次明显可以看到已经根据2048的要求是进行写入kv 首字耗时依旧在 3m12s 左右 任务完成! 这次总耗时 9m12s - 首字3m12s = 6m ! 结论: 相同的任务,kv-cache-continued-interval-tokens 2048 执行任务的速度基本提升了3倍左右! 假设如果不用claude code,而是用其他工具,我想首字速度应该还能再提升1m~2m左右,毕竟claude的系统提示词太大了! 最终m5 max 128g 跑DeepSeek V4 Flash q2,速度在20~27 t/s 浮动,如果只是用来养虾或者养马,或者做点小工具,日常问答,已经实现了token自由 至于其他工具调用本地ds v4 那就等到下次再测~ 制作不易,希望点赞~ 7 个帖子 - 6 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-05-08 20:49:45+08:00 · tech

我想着一边用codex写后端,一边使用opencode配合中转站用ds4或者claude写前端,但是配置oc时碰到点问题,就是它如果想加中转站的话是不是选择自定义,然后这个它有好多必填空我不知道怎么填才对。中午的时候我试着在提供商id那里填了anyrouter,模型的话写了claude-opus-4-7,baseurl填的地址后面加了/v1,但是对话时一直重试。问问佬友们如何准确配置呢,我查了一下站内好像没找到攻略 8 个帖子 - 5 位参与者 阅读完整话题