API key: tp-cbe22u57gjkd760x6u6msndint0q35nrz94mkflvzcqfz133 速蹬! 2 个帖子 - 2 位参与者 阅读完整话题
api key(base64):dHAtYzFkYmg1NnlxbG13MTM2eWs4eHJjajZydXVsdjZydzFpNmJ2MWV1ODdpbXp4M3dh 4 个帖子 - 4 位参与者 阅读完整话题
tp-clbxj37fm4pd3k794u2s4m37wvnyjte64zkrqw0jlnvajxdm 1 个帖子 - 1 位参与者 阅读完整话题
BASEURl: https://free.routix.top/v1 base64 转换一下key:c2stZDY3MGM3NDdmNzBlOTllYzQ5Yzc2MmQzZTE5YWNjM2Q4MzkxMmJiNWY2ZjA4YzYzMjllMTYxYTZkYTY2MTI3Mg== 13 个帖子 - 10 位参与者 阅读完整话题
99998.shop 啾 - AI API Gateway c2stNDdkNzVmMzIyMDk1NjViMDI0YmYxNjRiMzU4MmVkODcwOTM1NDcwOGJhZDczN2UwNjIwOTUyNDQ5NGVlNGFiZQ== 加入佬们的狂欢 冲啊 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 6 月 8 日消息,创客硬件品牌 WisdPi 近日在其官网上线了一款基于 AMD Promontory 21 芯片组的 PCIe AIC 扩展卡,标价 199.99 美元(IT之家注:现汇率约合 1359 元人民币)。 WisdPi 的这款 PROM21 扩展卡长 170mm、高 70mm。其上行接口为 PCIe Gen4 ×4“金手指”;下行接口方面则包括 1 个 USB-C 20Gbps、4 个 USB-A 10Gbps、3 组一分二 USB 480Mbps 接针、4 个 M.2、1 个 OCuLink。 该扩展卡的 四个 M.2 盘位共享 PCIe Gen4 ×8 通道 ,可配置为启用 2 个 ×4 或启用 4 个 ×2 的模式;OCuLink 接口则可配置为 SATA 或 PCIe 模式。
IT之家 6 月 7 日消息,飞利浦 EVNIA 弈威 24M2N2200PK 显示器现已开售,新品配备 23.8 英寸 FastIPS 面板,拥有特调 OD 模式, 到手价 599 元 。 据介绍,这款显示器拥有飞利浦 & 京东方联合研发圆偏光技术,可通过模拟太阳光螺旋扩散原理显著减缓视疲劳。采用 23.8 英寸电竞黄金尺寸,分辨率为 FullHD(1080P),刷新率最高可达 260Hz(原生 240Hz)。 规格方面,这款显示器的 GTG 响应时间可达 1ms,拥有特调 OD 软件算法,可减少拖影、过冲现象。支持暗部增强、辅助准星、智能同步等电竞功能。兼容 HDR10 技术,最高亮度可达 300nits。DeltaE<2,覆盖 99.8% sRGB 色域。 此外,这款显示器采用小底座设计,可节约桌面空间,支持 P Center 控制软件,具备 HDMI 2.1、DP 1.4 接口。 IT之家附该显示器详细参数如下: 目前这款显示器已在京东开售,标价 659 元,到手价 599 元。 京东 飞利浦 EVNIA 弈威 24M2N2200PK 显示器 599 元 直达链接 京东 618 无门槛红包 面额至高 26618 元,每天抽 3 次: 点此抽红包 淘宝 618 无门槛红包 面额至高 26888 元,每天抽 1 次: 点此抽红包
dHAtY3Rkd3Fqa2dyZ3JubW0x删除YnM3bWM4dGo2aWYwdGhzb3d4MjFtamtlamJhOHczajRi 1 个帖子 - 1 位参与者 阅读完整话题
IT之家 6 月 3 日消息,科大讯飞 AI 录音卡今日正式开售, 售价 999 元 。 京东 科大讯飞 AI 录音卡 999 元 直达链接 讯飞 AI 录音卡采用无卡套直吸手机设计,机身内置磁铁,可直接吸附于手机背面使用;厚度 4 mm,重量约 33 g。 这款产品支持 20 小时连续录音,支持无线充电与 Type-C 有线两种充电方式;搭载 0.95 英寸 OLED 屏幕,操作不盲按。 据介绍,讯飞 AI 录音卡搭载讯飞自研听感降噪算法,可有效过滤空调声、键盘声等环境干扰;支持线下会场 8 米远距离收音,支持 200+ 方言及语言实时转文字,并支持中文与 10 种语言互译,佩戴耳机还可实现实时听译。 IT之家附这款新品详细参数如下: 京东 618 无门槛红包 面额至高 26618 元,每天抽 3 次: 点此抽红包 淘宝 618 无门槛红包 面额至高 26888 元,每天抽 1 次: 点此抽红包
自助畅饮套餐CDK:MmMxYTVlNjhhMDY1ZmZiN2U2NzZiMDVhY2M3MmZiODg= RPM兑换+15CDK:Y2NmMGFhOGU1MzYxY2M3NmNlYmM4MGRlMDExYWQzNzk= 注:base64编码 兑换麻烦留言我好改标题 7 个帖子 - 7 位参与者 阅读完整话题
今天想起来还有个这东西,密钥dHAtYzI3N3djd2t2YjJuZ2gzenZ4M2E2dDBoc2RmaW1tcHpnZWl3Ym9idjNlZ2FkanJw 需要base64解码 蹬到的佬友请不要吝啬自己的赞 1 个帖子 - 1 位参与者 阅读完整话题
海尔 · 小红花四开门冰箱 500L 官方定价 3710 元,今日按下方步骤下单仅需 2129 元破冰新低。 点击下方卡片领 300 元券 下单时选择“以旧换新 → 厨房小电 → 普通餐具”立减 260 元 以旧换新实付 2129 元,晒单再返 20 元京豆,折合低至 2109 元。 一线城市 2129 元(返现后 2109 元) 非一线城市 2028 元(返现后 2008 元) 京东 海尔 小红花 四开门冰箱 500 升 594mm 超薄 以旧换新 2129 元 领 300 元券 京东无门槛红包至高 26618 元,支持即领即用: 点此抽取 。 另外今日下单赠品可 6 选 1,支持 10 年核心元器件质保服务。 官方简介 下单时选择“以旧换新 → 厨房小电 → 普通餐具”立减 260 元: 京东 海尔 小红花 四开门冰箱 500 升 594mm 超薄 以旧换新 2129 元 领 300 元券 京东 618 无门槛红包 面额至高 26618 元,每天抽 3 次: 点此抽红包 淘宝 618 无门槛红包 面额至高 26888 元,每天抽 1 次: 点此抽红包
使用AI找了一下发现都是要钱的,我需要转换的音频为4min,单乐器,可以翻墙。 各位佬有没有什么推荐的软件/网页 非常感谢各位佬提供的网页,虽然准确率不高但是还是帮我减少了制作时间 8 个帖子 - 5 位参与者 阅读完整话题
IT之家 5 月 29 日消息,显卡品牌西风 (ZEPHYR) 今日介绍了其显卡新品 RTX 5070 风神 MX。该产品 三维 234×125×50 (mm) ,满足 NVIDIA 界定的 SFF-Ready 要求。 IT之家注: 西风宣称这一产品是“最短的双风扇 5070”,不过公开资料显示微星 (MSI) 的 GeForce RTX 5070 12G SHADOW 2X OC 长度仅有 231mm。 西风表示,RTX 5070 风神 MX 可满足小机箱爱好者对“一张可塞入 ITX 机箱的高性能显卡”的需求。按照品牌方提供的数据,该型号 27.5℃ 室温下开放式机箱烤机 30min,GPU-Z 显示 GPU 温度约 74℃、显存温度约 56℃。
最近在看 Kubernetes 上 AI 推理服务的冷启动问题,发现很多时候慢的不只是模型加载,容器镜像本身也很夸张。 比如 vLLM 这类镜像,里面有 PyTorch 、CUDA 、Python 依赖、系统库,动不动就是 10GB+。传统 containerd / overlayfs 路径下,节点要先完整下载并解压镜像,Pod 才能真正起来。对 Karpenter 这种弹性扩容场景来说,这部分时间会很明显。 我们做了一个小项目 Hermes: https://github.com/cloudpilot-ai/hermes 想法是:不让业务团队改 Dockerfile 、不重建镜像、不改 CI/CD ,也不改原来的 image reference 。平台侧定义一个 HermesPolicy ,controller 在集群内自动为匹配到的镜像构建并缓存 SOCI index ,节点上的 daemon 再用这些 index 做 lazy loading 。 这次用 EKS + Karpenter 跑了一个简单对比,镜像是: 763104351884.dkr.ecr.us-east-1.amazonaws.com/vllm:0.9-gpu-py312-ec2 大概 10.8GB 。 普通节点上,从 Pod 调度到节点后,到容器 Running/Ready: 5m04s - 29s = 4m35s 开启 Hermes 的节点上,在 HermesPolicy 已经 Ready 、SOCI artifact 已经构建好的前提下: 44s - 30s = 14s 也就是这个场景里,镜像拉取/挂载到容器启动这段,从 4m35s 降到了 14s 。 需要强调一下:这个结果不包含首次 index 构建耗时,也不等于 vLLM first token latency 。Pod Ready 变快,只说明容器镜像这条路径被 lazy loading 优化了。后面还需要继续测 vLLM readiness 、first request TTFT 、warmup 后真实请求延迟。 Hermes 现在的定位更像一个集群侧能力:应用继续发原来的 OCI image ,平台通过策略决定哪些镜像需要被 lazy load 。类似: apiVersion: hermes.cloudpilot.ai/v1alpha1 kind: HermesPolicy metadata: name: prod-large-images spec: paused: false imageSelectors: - imageRegex: ".*vllm.*" platforms: - linux/amd64 目前还比较早期,欢迎大家关注项目: https://github.com/cloudpilot-ai/hermes
最近在看 Kubernetes 上 AI 推理服务的冷启动问题,发现很多时候慢的不只是模型加载,容器镜像本身也很夸张。 比如 vLLM 这类镜像,里面有 PyTorch 、CUDA 、Python 依赖、系统库,动不动就是 10GB+。传统 containerd / overlayfs 路径下,节点要先完整下载并解压镜像,Pod 才能真正起来。对 Karpenter 这种弹性扩容场景来说,这部分时间会很明显。 我们做了一个小项目 Hermes: https://github.com/cloudpilot-ai/hermes 想法是:不让业务团队改 Dockerfile 、不重建镜像、不改 CI/CD ,也不改原来的 image reference 。平台侧定义一个 HermesPolicy ,controller 在集群内自动为匹配到的镜像构建并缓存 SOCI index ,节点上的 daemon 再用这些 index 做 lazy loading 。 这次用 EKS + Karpenter 跑了一个简单对比,镜像是: 763104351884.dkr.ecr.us-east-1.amazonaws.com/vllm:0.9-gpu-py312-ec2 大概 10.8GB 。 普通节点上,从 Pod 调度到节点后,到容器 Running/Ready: 5m04s - 29s = 4m35s 开启 Hermes 的节点上,在 HermesPolicy 已经 Ready 、SOCI artifact 已经构建好的前提下: 44s - 30s = 14s 也就是这个场景里,镜像拉取/挂载到容器启动这段,从 4m35s 降到了 14s 。 需要强调一下:这个结果不包含首次 index 构建耗时,也不等于 vLLM first token latency 。Pod Ready 变快,只说明容器镜像这条路径被 lazy loading 优化了。后面还需要继续测 vLLM readiness 、first request TTFT 、warmup 后真实请求延迟。 Hermes 现在的定位更像一个集群侧能力:应用继续发原来的 OCI image ,平台通过策略决定哪些镜像需要被 lazy load 。类似: apiVersion: hermes.cloudpilot.ai/v1alpha1 kind: HermesPolicy metadata: name: prod-large-images spec: paused: false imageSelectors: - imageRegex: ".*vllm.*" platforms: - linux/amd64 目前还比较早期,欢迎大家关注项目: https://github.com/cloudpilot-ai/hermes
最近在看 Kubernetes 上 AI 推理服务的冷启动问题,发现很多时候慢的不只是模型加载,容器镜像本身也很夸张。 比如 vLLM 这类镜像,里面有 PyTorch 、CUDA 、Python 依赖、系统库,动不动就是 10GB+。传统 containerd / overlayfs 路径下,节点要先完整下载并解压镜像,Pod 才能真正起来。对 Karpenter 这种弹性扩容场景来说,这部分时间会很明显。 我们做了一个小项目 Hermes: https://github.com/cloudpilot-ai/hermes 想法是:不让业务团队改 Dockerfile 、不重建镜像、不改 CI/CD ,也不改原来的 image reference 。平台侧定义一个 HermesPolicy ,controller 在集群内自动为匹配到的镜像构建并缓存 SOCI index ,节点上的 daemon 再用这些 index 做 lazy loading 。 这次用 EKS + Karpenter 跑了一个简单对比,镜像是: 763104351884.dkr.ecr.us-east-1.amazonaws.com/vllm:0.9-gpu-py312-ec2 大概 10.8GB 。 普通节点上,从 Pod 调度到节点后,到容器 Running/Ready: 5m04s - 29s = 4m35s 开启 Hermes 的节点上,在 HermesPolicy 已经 Ready 、SOCI artifact 已经构建好的前提下: 44s - 30s = 14s 也就是这个场景里,镜像拉取/挂载到容器启动这段,从 4m35s 降到了 14s 。 需要强调一下:这个结果不包含首次 index 构建耗时,也不等于 vLLM first token latency 。Pod Ready 变快,只说明容器镜像这条路径被 lazy loading 优化了。后面还需要继续测 vLLM readiness 、first request TTFT 、warmup 后真实请求延迟。 Hermes 现在的定位更像一个集群侧能力:应用继续发原来的 OCI image ,平台通过策略决定哪些镜像需要被 lazy load 。类似: apiVersion: hermes.cloudpilot.ai/v1alpha1 kind: HermesPolicy metadata: name: prod-large-images spec: paused: false imageSelectors: - imageRegex: ".*vllm.*" platforms: - linux/amd64 目前还比较早期,欢迎大家关注项目: https://github.com/cloudpilot-ai/hermes
tp-ca6jlpz74zlqkre7a43nupktmh8my9fo5r75x3r2wmfci24m 5 个帖子 - 4 位参与者 阅读完整话题
虽然说是6.2号 但今天已经不能用了 3 个帖子 - 3 位参与者 阅读完整话题
codex free 账户 3:05 还正常调用 5.4 但是现在测了下只支持 5.5 & 5.4mini 了,其他都返回类似提示 API returned 400: {"detail":"The 'gpt-5.4' model is not supported when using Codex with a ChatGPT account."} 26 个帖子 - 18 位参与者 阅读完整话题