0点刷到有佬友说甲骨文OCI现在这个时段很好开 我二话不说,抄起备用iphone就是干,选项和之前的完全一致(经历了n次abc……)主区域选的大阪,edge浏览器内打开邮箱验证,配合招行万事达,第一次顺利进入跑道 接着就是顺利升级账户 接着就是顺利抢到了一台4C24G 下面就问题来了,有了服务器该干点什么好呢 29 个帖子 - 9 位参与者 阅读完整话题
skill信息: GitHub - op7418/guizang-social-card-skill: 🪧 Claude Code / Codex skill — generate Xiaohongshu carousels & WeChat 21:9+1:1 cover pairs. Editorial × Swiss visual systems, 28 layouts, 10 themes, single-file HTML → PNG. 小红书图文 + 公众号封面对 · GitHub 大家有什么好玩的skill 吗,最近在尝试这些 2 个帖子 - 2 位参与者 阅读完整话题
5.23日新开的甲骨文春川 1-1 两台。 其中一台部署了 **oci-helper 抢机,还有一台真就啥也没干。然后今天收到扣款689新币(不是人名币) /上去拉了一眼账单 防火墙每小时SGD 3.8新元…一起280多小时,无语了。防火墙这东西不都免费的吗,我是刚开的机器联不通就去放行了端口啥的。真没搞明白这甲骨文。还好设置了限额1500..不然一下子三四千没了。 12 个帖子 - 8 位参与者 阅读完整话题
最近在看 Kubernetes 上 AI 推理服务的冷启动问题,发现很多时候慢的不只是模型加载,容器镜像本身也很夸张。 比如 vLLM 这类镜像,里面有 PyTorch 、CUDA 、Python 依赖、系统库,动不动就是 10GB+。传统 containerd / overlayfs 路径下,节点要先完整下载并解压镜像,Pod 才能真正起来。对 Karpenter 这种弹性扩容场景来说,这部分时间会很明显。 我们做了一个小项目 Hermes: https://github.com/cloudpilot-ai/hermes 想法是:不让业务团队改 Dockerfile 、不重建镜像、不改 CI/CD ,也不改原来的 image reference 。平台侧定义一个 HermesPolicy ,controller 在集群内自动为匹配到的镜像构建并缓存 SOCI index ,节点上的 daemon 再用这些 index 做 lazy loading 。 这次用 EKS + Karpenter 跑了一个简单对比,镜像是: 763104351884.dkr.ecr.us-east-1.amazonaws.com/vllm:0.9-gpu-py312-ec2 大概 10.8GB 。 普通节点上,从 Pod 调度到节点后,到容器 Running/Ready: 5m04s - 29s = 4m35s 开启 Hermes 的节点上,在 HermesPolicy 已经 Ready 、SOCI artifact 已经构建好的前提下: 44s - 30s = 14s 也就是这个场景里,镜像拉取/挂载到容器启动这段,从 4m35s 降到了 14s 。 需要强调一下:这个结果不包含首次 index 构建耗时,也不等于 vLLM first token latency 。Pod Ready 变快,只说明容器镜像这条路径被 lazy loading 优化了。后面还需要继续测 vLLM readiness 、first request TTFT 、warmup 后真实请求延迟。 Hermes 现在的定位更像一个集群侧能力:应用继续发原来的 OCI image ,平台通过策略决定哪些镜像需要被 lazy load 。类似: apiVersion: hermes.cloudpilot.ai/v1alpha1 kind: HermesPolicy metadata: name: prod-large-images spec: paused: false imageSelectors: - imageRegex: ".*vllm.*" platforms: - linux/amd64 目前还比较早期,欢迎大家关注项目: https://github.com/cloudpilot-ai/hermes
最近在看 Kubernetes 上 AI 推理服务的冷启动问题,发现很多时候慢的不只是模型加载,容器镜像本身也很夸张。 比如 vLLM 这类镜像,里面有 PyTorch 、CUDA 、Python 依赖、系统库,动不动就是 10GB+。传统 containerd / overlayfs 路径下,节点要先完整下载并解压镜像,Pod 才能真正起来。对 Karpenter 这种弹性扩容场景来说,这部分时间会很明显。 我们做了一个小项目 Hermes: https://github.com/cloudpilot-ai/hermes 想法是:不让业务团队改 Dockerfile 、不重建镜像、不改 CI/CD ,也不改原来的 image reference 。平台侧定义一个 HermesPolicy ,controller 在集群内自动为匹配到的镜像构建并缓存 SOCI index ,节点上的 daemon 再用这些 index 做 lazy loading 。 这次用 EKS + Karpenter 跑了一个简单对比,镜像是: 763104351884.dkr.ecr.us-east-1.amazonaws.com/vllm:0.9-gpu-py312-ec2 大概 10.8GB 。 普通节点上,从 Pod 调度到节点后,到容器 Running/Ready: 5m04s - 29s = 4m35s 开启 Hermes 的节点上,在 HermesPolicy 已经 Ready 、SOCI artifact 已经构建好的前提下: 44s - 30s = 14s 也就是这个场景里,镜像拉取/挂载到容器启动这段,从 4m35s 降到了 14s 。 需要强调一下:这个结果不包含首次 index 构建耗时,也不等于 vLLM first token latency 。Pod Ready 变快,只说明容器镜像这条路径被 lazy loading 优化了。后面还需要继续测 vLLM readiness 、first request TTFT 、warmup 后真实请求延迟。 Hermes 现在的定位更像一个集群侧能力:应用继续发原来的 OCI image ,平台通过策略决定哪些镜像需要被 lazy load 。类似: apiVersion: hermes.cloudpilot.ai/v1alpha1 kind: HermesPolicy metadata: name: prod-large-images spec: paused: false imageSelectors: - imageRegex: ".*vllm.*" platforms: - linux/amd64 目前还比较早期,欢迎大家关注项目: https://github.com/cloudpilot-ai/hermes
最近在看 Kubernetes 上 AI 推理服务的冷启动问题,发现很多时候慢的不只是模型加载,容器镜像本身也很夸张。 比如 vLLM 这类镜像,里面有 PyTorch 、CUDA 、Python 依赖、系统库,动不动就是 10GB+。传统 containerd / overlayfs 路径下,节点要先完整下载并解压镜像,Pod 才能真正起来。对 Karpenter 这种弹性扩容场景来说,这部分时间会很明显。 我们做了一个小项目 Hermes: https://github.com/cloudpilot-ai/hermes 想法是:不让业务团队改 Dockerfile 、不重建镜像、不改 CI/CD ,也不改原来的 image reference 。平台侧定义一个 HermesPolicy ,controller 在集群内自动为匹配到的镜像构建并缓存 SOCI index ,节点上的 daemon 再用这些 index 做 lazy loading 。 这次用 EKS + Karpenter 跑了一个简单对比,镜像是: 763104351884.dkr.ecr.us-east-1.amazonaws.com/vllm:0.9-gpu-py312-ec2 大概 10.8GB 。 普通节点上,从 Pod 调度到节点后,到容器 Running/Ready: 5m04s - 29s = 4m35s 开启 Hermes 的节点上,在 HermesPolicy 已经 Ready 、SOCI artifact 已经构建好的前提下: 44s - 30s = 14s 也就是这个场景里,镜像拉取/挂载到容器启动这段,从 4m35s 降到了 14s 。 需要强调一下:这个结果不包含首次 index 构建耗时,也不等于 vLLM first token latency 。Pod Ready 变快,只说明容器镜像这条路径被 lazy loading 优化了。后面还需要继续测 vLLM readiness 、first request TTFT 、warmup 后真实请求延迟。 Hermes 现在的定位更像一个集群侧能力:应用继续发原来的 OCI image ,平台通过策略决定哪些镜像需要被 lazy load 。类似: apiVersion: hermes.cloudpilot.ai/v1alpha1 kind: HermesPolicy metadata: name: prod-large-images spec: paused: false imageSelectors: - imageRegex: ".*vllm.*" platforms: - linux/amd64 目前还比较早期,欢迎大家关注项目: https://github.com/cloudpilot-ai/hermes
今天无意间看到deepseek的招聘 https://app.mokahr.com/social-recruitment/high-flyer/140576#/jobs,14号发布的,这种大概率会上市的公司,能进去还是蛮不错的,发出来给各位佬友看看 2 个帖子 - 1 位参与者 阅读完整话题
要发力了吗 https://app.mokahr.com/social-recruitment/high-flyer/140576#/job/54f386a9-913b-4626-9bf4-e1709b62fcda
要发力了吗 https://app.mokahr.com/social-recruitment/high-flyer/140576#/job/54f386a9-913b-4626-9bf4-e1709b62fcda
Hello, An internal investigation of suspicious signals associated with your account indicates a violation of our Usage Policy. As a result, we have revoked your access to Claude. To appeal our decision, please fill out this form or learn more about the appeals process here. Regards Anthropic's Safeguards Team
Hello, An internal investigation of suspicious signals associated with your account indicates a violation of our Usage Policy. As a result, we have revoked your access to Claude. To appeal our decision, please fill out this form or learn more about the appeals process here. Regards Anthropic's Safeguards Team
IT之家 5 月 6 日消息,GlobalFoundries(GF、格罗方德)美国纽约州当地时间 4 日宣布推出业界首个符合 OCI MSA 协议规范的技术平台 —— 采用宽带可插拔光纤的 SCALE CPO(光电合封 / 共封装光学)光学模块解决方案。 IT之家了解到,SCALE CPO 基于格罗方德先进的硅光子 (SiPh) 技术, 相较传统铜线互连可显著提升带宽密度和系统可扩展性 ,兼顾维护便利性。该解决方案采用粗波分复用 (CWDM) 和密波分复用(DWDM)技术,单根光纤实现双向数据传输,原生 8λ/16λ 双向 DWDM 传输已得到展示验证。 格罗方德的 SCALE CPO 由一系列器件 IP 组成,包括 50Gbps / 100Gbps 微环调制器、耦合环形谐振器、集成光电二极管、经由 TSV 的高速信号与电源传输等, 缩短了客户定制方案的落地用时 。
Hello, An internal investigation of suspicious signals associated with your account indicates a violation of our Usage Policy. As a result, we have revoked your access to Claude. To appeal our decision, please fill out this form or learn more about the appeals process here. Regards Anthropic's Safeguards Team
Hello, An internal investigation of suspicious signals associated with your account indicates a violation of our Usage Policy. As a result, we have revoked your access to Claude. To appeal our decision, please fill out this form or learn more about the appeals process here. Regards Anthropic's Safeguards Team
Hello, An internal investigation of suspicious signals associated with your account indicates a violation of our Usage Policy. As a result, we have revoked your access to Claude. To appeal our decision, please fill out this form or learn more about the appeals process here. Regards Anthropic's Safeguards Team
Hello, An internal investigation of suspicious signals associated with your account indicates a violation of our Usage Policy. As a result, we have revoked your access to Claude. To appeal our decision, please fill out this form or learn more about the appeals process here. Regards Anthropic's Safeguards Team
Hello, An internal investigation of suspicious signals associated with your account indicates a violation of our Usage Policy. As a result, we have revoked your access to Claude. To appeal our decision, please fill out this form or learn more about the appeals process here. Regards Anthropic's Safeguards Team
Hello, An internal investigation of suspicious signals associated with your account indicates a violation of our Usage Policy. As a result, we have revoked your access to Claude. To appeal our decision, please fill out this form or learn more about the appeals process here. Regards Anthropic's Safeguards Team
Hello, An internal investigation of suspicious signals associated with your account indicates a violation of our Usage Policy. As a result, we have revoked your access to Claude. To appeal our decision, please fill out this form or learn more about the appeals process here. Regards Anthropic's Safeguards Team
Hello, An internal investigation of suspicious signals associated with your account indicates a violation of our Usage Policy. As a result, we have revoked your access to Claude. To appeal our decision, please fill out this form or learn more about the appeals process here. Regards Anthropic's Safeguards Team