关于太初电子科技 太初(无锡)电子科技有限公司,自 2019 年成立以来,始终坚持以“铸造中国算力基石,构建未来智能世界”为使命,立足于高性能计算产业核心基座,布局自主可控、通用开放、性能完善的先进智能计算生态。面向政府和企业用户,建设高性能、高能效、高可靠的智能算力系统,深度定制 HPC+AI 关键领域解决方案,覆盖软硬件研发、算力系统设计和集成等智算中心建设全流程。 We are hiring 系统架构师 岗位职责: 参与并主导 Tecorigin 异构众核加速器架构下的操作系统整体架构设计与实现; 负责异构众核片上操作系统的内核开发、裁剪、移植与性能优化,服务于高效的并行编程模型; 支持软硬件协同设计,深入参与从硬件接口定义到操作系统支撑的一体化方案设计;参与或指导面向异构加速平台的系统生态,包括驱动、运行时等系统软件栈的设计; 跟踪操作系统及系统软件领域的最新技术演进趋势,参与下一代软硬件协同架构的创新与实现; 分析与解决系统级疑难问题,支持关键业务系统的稳定性与性能优化; 任职资格要求: 1. 重点本科及以上学历,计算机、软件工程、微电子等相关专业; 2. 5 年以上操作系统内核开发经验,精通 Linux 内核架构与核心子系统(内存管理、进程调度、IO 子系统等); 3. 熟悉 Linux 驱动开发、性能调优,具备良好的内核调试能力; 4. 熟悉异构多核、众核架构,理解 SoC 中 CPU 、加速核、DMA 、互联总线等协同机制; 5. 有 RISC-V 或 ARM 架构背景者优先,理解 PCIe 、高速互联等底层机制; 6. 熟悉高并发、并行计算或分布式系统软件设计,了解异构加速编程模型(如 CUDA/GPU 软件栈、OpenCL 、OpenMP 等); 7. 具备良好的技术视野和系统级思考能力,能够从平台角度提出架构改进建议。 芯片验证工程师 岗位职责: 1.负责芯片的整体验证; 2.制定验证规格和验证方案,并搭建验证平台; 3.制定验证计划,整体负责项目验证工作,管理验证进度; 4.负责覆盖率收敛,并设计和编写测试用例完成 signoff 前的 cross-check ,输出整体验证报告; 5.负责组织项目的前、后仿工作; 6.负责 FPGA 和 emulator 的验证环境; 7.支持芯片的样片和量产测试。 职位要求: 1.5 年以上 IC 验证经验,微电子、计算机、电子、通信等相关专业,重点大学硕士及以上学历; 2.熟悉 SoC 验证流程,具备丰富的 IP/SOC 验证以及成功流片的经验; 3.熟悉 SystemVerilog 和 UVM 验证方法学; 4.熟悉 AXI/APB/AHB 等总线协议; 5.熟悉时钟、复位以及低功耗验证; 6.熟悉门级时序仿真; 7.能够识别项目风险点,具备团队协作精神,思路清晰,爱钻研,具备抗压能力; 8.具有较好的脚本编程能力。 AI 编译工程师 岗位职责 1.在太初 AI 架构上适配和优化 Triton 编译器; 2.基于 MLIR + Linalg 框架,提升编译器代码执行效率; 3.参与 图优化、后端代码生成、调度策略、指令优化、流水并行化 相关优化工作; 4.研究和优化 Kernel 计算性能,降低计算开销,提高吞吐率; 5.研究算子融合( Op Fusion )、自动调优( Auto-Tuning )、代码生成( CodeGen ) 相关优化策略; 6.与 硬件团队、AI 框架团队(如 PyTorch ) 协作,提升 AI 编译器的支持能力; 7.跟踪 LLVM 、Triton 、TVM 、XLA 、TorchInductor 等 AI 编译器前沿技术,优化编译性能。 任职要求 1.优秀的学习能力,对 AI 编译器、AI 计算优化有浓厚兴趣; 2.熟悉 C++/Python ,具备编译器或 AI 编译优化开发经验,熟悉 Triton 编译流程; 3.熟悉 MLIR 、Linalg 等基础设施; 4.具备 ai 编译优化(如 TVM 、XLA 、TorchInductor ) 经验者优先; 5.熟悉 Kernel 计算优化、算子融合、自动并行化等高性能计算优化策略者加分。 加分项(优先考虑) 1.参与过 Triton 、MLIR 、IREE 、XLA 、TVM 、TorchInductor 等编译器的开发,或在 GitHub 提交过相关 PR 。 2.具备 MLU/NPU/GPU 相关的编译优化经验。 更多岗位可以查看社招和校招官网: 社招: https://app.mokahr.com/social-recruitment/tecorigin/47401#/ 校招: https://app.mokahr.com/campus-recruitment/tecorigin/47402#/ 内推联系:Z290b3Jpb24=
据两位直接知情人士透露,谷歌正与美满电子科技(Marvell)洽谈合作,研发两款全新芯片,旨在更高效地运行人工智能模型。其中一款为内存处理单元,设计用于配合谷歌张量处理单元(TPU)协同工作;另一款则是专为运行 AI 模型打造的全新 TPU 芯片。 这些举措凸显出,用于支撑智能体等商用产品的 AI 推理芯片需求正急剧攀升。英伟达在 3 月的 GTC 大会上发布了一款旨在提升推理任务效率的芯片,名为语言处理单元(LPU),该芯片基于英伟达以 200 亿美元从初创公司 Groq 获得授权的技术打造。 谷歌此前也曾向美满电子采购过数据中心芯片,但均为现货标准产品;而本次洽谈旨在开发专为谷歌定制的半导体芯片。这一动向再次表明,谷歌希望摆脱长期以来作为其 TPU 唯一设计合作伙伴的博通,实现合作方多元化。 据《信息》(The Information)2023 年报道,谷歌曾考虑将美满电子替换为博通,作为其数据中心内连接服务器与以太网交换机的网络接口芯片供应商。 一位谷歌员工透露,谷歌原本就计划研发新型推理芯片,而在英伟达推出 LPU 后,相关工作进一步加速。美满电子正是 Groq 第一代 LPU 的芯片设计合作伙伴,这使其具备设计推理芯片的成熟经验。 Funda AI 此前曾报道过谷歌与美满电子就全新 TPU 展开洽谈的消息。 谷歌此前已向美满电子采购过 CXL 控制器芯片,据两位谷歌员工介绍,这类芯片用于管理服务器在数据中心间的内存共享。双方过往的合作经历,也让谷歌对美满电子与其联合设计更多新芯片的能力抱有信心。 两位知情人士称,谷歌全新的内存处理单元将与 TPU 协同工作,根据算力与内存需求与 TPU 分担 AI 运算任务。双方计划最快于明年完成该内存处理单元的设计,随后交付试产。 两人还补充道,谷歌计划生产近 200 万颗内存处理单元,不过由于洽谈仍处于初期阶段,这一数字可能发生变动。作为对比,摩根士丹利预计谷歌 2027 年将生产约 600 万颗 TPU。目前尚不清楚全新 TPU 的设计工作何时完成,以及谷歌计划的量产规模。该内存处理单元可与现有 TPU 兼容使用。 谷歌目前的芯片均由台积电生产,新款芯片将由台积电还是其他厂商代工仍未可知。 多年来,谷歌仅在自有数据中心内部使用 TPU,支撑搜索、YouTube 与 Gemini 模型等业务,并仅向谷歌云客户开放使用。这一局面在去年被打破,谷歌开始向客户出租 TPU 用于非谷歌数据中心,直接挑战英伟达在 AI 芯片领域的主导地位。谷歌 TPU 也已赢得 Anthropic、元平台(Meta)与苹果等客户的青睐。 专用推理芯片的兴起,源于 AI 企业陆续推出智能体等更复杂的产品,这类产品所需算力远超聊天机器人等传统 AI 应用。 不过,并非所有推理任务都具有相同特性。生成回复的部分环节需要大量算力,而另一些环节则受限于芯片在内存中读写数据的速度。针对不同任务使用不同类型的推理芯片,而非仅依靠单一处理器完成所有运算,已成为 AI 企业提升效率、降低成本的关键方式。 例如,OpenAI 近期达成协议,将向英伟达与 Groq 的竞争对手 Cerebras 采购超过 200 亿美元的推理芯片,同时也在使用其他企业的推理芯片。OpenAI 还在与博通联合研发自研推理芯片。 美满电子主营数据中心所用的标准网络、存储与光互联芯片设计,目前为客户定制芯片的业务规模持续扩大,已成为其增长最快的业务板块。 自 2023 年起,谷歌便试图摆脱对博通的依赖,主要原因是博通收费高昂。博通会对每一颗量产的 TPU 收取费用,随着 TPU 需求激增,谷歌向博通支付的费用也水涨船高。 去年,谷歌引入台湾企业联发科参与 TPU 芯片的设计与生产,但博通仍是谷歌核心的芯片设计合作伙伴。本月早些时候,博通与谷歌签署新协议,将在 2031 年前为谷歌下一代 AI 数据中心机柜开发并供应定制化 TPU 与网络组件,这表明博通在谷歌芯片业务中仍占据核心地位。 查看评论
36氪获悉,天眼查App显示,近日,杭州暖芯迦电子科技有限公司发生工商变更,原股东上海明赫创业投资合伙企业(有限合伙)退出,新增腾讯旗下上海启善投资有限公司、杭州君联良道股权投资合伙企业(有限合伙)等为股东,同时,注册资本由约1504万人民币增至约1689万人民币。官网显示,该公司是一家专门从事神经接口与生物传感研发的技术型企业。
36氪获悉,据思特威消息,近日,思特威(上海)电子科技股份有限公与紫光展锐(上海)科技股份有限公司正式达成战略合作。双方联合布局MicroLED高速光互连领域,围绕光互连芯片设计与系统解决方案落地展开深度协同,为AI算力集群短距高速互连场景,提供高带宽、低功耗、高集成、高可靠的国产化核心解决方案。