WWW.YOUINFO.SITE
标签聚合 privacy

/tag/privacy

LinuxDo 最新话题 · 2026-06-08 19:43:21+08:00 · tech

privacy-filter 纯 Go 实现,零依赖,单个二进制文件 支持三种接入方式:import 包、HTTP 接口、gRPC 两层检测机制:结构化 PII 识别 + Gitleaks 全套 222 条规则 之前在 PackyCode 上线隐私过滤功能后,收到不少反馈和需求,所以直接开源了。 欢迎大家 star、试用、提 issue、PR 项目地址: https://github.com/packyme/privacy-filter 为了省事我直接照搬推特发的内容了 这个玩意儿已经在packyapi 上面内置了,有需要的可以自取 10 个帖子 - 9 位参与者 阅读完整话题

cnBeta全文版 · 2026-06-04 13:36:47+08:00 · tech

苹果最新一则围绕“Privacy, That’s iPhone”的宣传片,延续了其长期主打的隐私主题。 这支短片名为“Privacy on iPhone: Safari helps block data trackers”,采用带有喜剧色彩的表现手法,把网络追踪者塑造成身穿“Chrome”风格服饰、紧跟用户不放的角色。 广告的核心信息很明确:当用户从 Chrome 之类的浏览器切换到 Safari 后,这些象征性的追踪者会立刻消失,化作银色闪光。 苹果借此突出 Safari 能减少用户在浏览过程中遭遇的数据追踪,并把这一点包装成直观、易懂的视觉叙事。 这并不是苹果首次围绕 Safari 隐私能力展开宣传。早在 2024 年,苹果就推出过一则带有希区柯克式惊悚风格的广告,以“头部装着摄像头的机械鸟”来影射跟踪与监视。 文章指出,这次的新广告并没有提出全新的技术卖点,而是在重复苹果围绕 Safari 的既有重点。 报道还提到,Safari 自 2019 年起就在默认状态下阻止所有第三方 Cookie,成为首批这样做的主流浏览器之一。 此外,Safari 目前还具备智能防跟踪、隐私报告、反指纹识别,以及 iCloud Private Relay 等功能,用于进一步隐藏用户 IP 地址。 苹果也没有把这次宣传局限在短片本身,而是同步投放了数字广告和户外广告,预计用户在网络浏览和城市街头都可能看到相关内容。 文章同时提到,6 月 8 日举行的 WWDC 2026 可能会延续苹果的隐私叙事,尤其是在 Apple Intelligence 成为焦点的背景下,苹果大概率会进一步强调其在 AI 时代对隐私的重视。 查看评论

IT之家 · 2026-05-12 22:03:35+08:00 · tech

IT之家 5 月 12 日消息,近年来有大量黑客在各大项目托管平台设立山寨项目,意在让不知情的开发者上钩。例如 AI 安全公司 HiddenLayer 近期披露,他们在 Hugging Face 上发现一个名为“Open-OSS / privacy-filter”的恶意仓库,其主要伪装成 OpenAI 近期发布的隐私脱敏模型“Privacy Filter” 。 具体来看,该仓库在被安全公司投诉下架前, 下载量已超过 20 万次 。仓库中的文件目录与正版项目几乎完全一致,但其中实际暗藏有信息窃取类木马(Infostealer)。如果不知情的受害者按照页面说明下载并运行了库中的文件,便会遭到黑客入侵。 该安全公司建议,受影响的用户最好优先考虑彻底重建开发环境,而不是仅尝试手动清理恶意软件。在确认系统完全清理之前,用户不要继续登录电脑或输入任何敏感信息。 相关阅读: 《 微软警告有黑客假借 DeepSeek V4 名义,在 GitHub 建立虚假仓库传播木马 》

www.ithome.com · 2026-04-27 14:01:36+08:00 · tech

IT之家 4 月 27 日消息,OpenAI 于 4 月 22 日发布了一款用于脱敏文本中个人身份信息 (PII) 的前沿模型 Privacy Filter。 该模型已以 Apache 2.0 许可协议在 Hugging Face 和 GitHub 平台同步开源,供开发者下载、定制及商业部署。 OpenAI 表示,开发者在自己的环境中运行这一模型后,可针对特定用例进行微调,在训练管线、索引流程、日志记录和审核环节中构建更强的隐私保护机制。 与传统依赖规则匹配的隐私过滤工具不同,OpenAI Privacy Filter 内置了更深层次的语言理解能力,能够根据上下文语境识别非结构化文本中的个人信息,在准确保留公开信息的同时,对与特定个体相关联的敏感数据进行遮盖或脱敏。 据 OpenAI 介绍,该模型采用了双向 Token 分类架构,版本总参数规模为 15 亿,但每次仅激活约 5000 万个参数,这一混合专家(MoE)设计使其能够运行于笔记本电脑甚至浏览器等资源受限的设备上。 该模型支持高达 12.8 万个 Token 的上下文窗口,单次前向传播即可对整个输入序列完成标注,并采用受限维特比算法解码出连贯的片段。 在隐私分类体系方面,Privacy Filter 可识别八类个人敏感信息:姓名(private_person)、地址(private_address)、邮箱地址(private_email)、电话号码(private_phone)、URL 链接(private_url)、日期(private_date)、账号信息(account_number,涵盖银行卡号、信用卡号等金融信息)以及机密信息(secret,如密码和 API 密钥)。 评估过程中,该模型在 PII-Masking-300k 基准测试中取得了 96% 的 F1 分数(准确率 94.04%,召回率 98.04%)。 由于 PII-Masking-300k 数据集的初始注释存在多处遗漏,OpenAI 在对评估中发现的标注问题进行修正后,模型在该修正版基准测试上的 F1 分数进一步提升至 97.43%(准确率为 96.79%,召回率为 98.08%)。 OpenAI 指出,该模型在少量数据上进行微调即可快速提升在特定领域的准确性,且能够在高精度与高召回率之间按需调整。 OpenAI 承认,Privacy Filter 并非匿名化工具,亦不替代合规认证,在法律、医疗和金融等高敏感性场景中,人工审核及领域特定的评估与微调依然是必要的。 在用户日常使用中不慎将包含个人信息的文本粘贴到 AI 工具的行为并不罕见,Privacy Filter 定位为在本地即可运行的预过滤层 —— 数据在不离开用户设备的前提下即可完成 PII 的检测与脱敏处理,此后再将已脱敏内容发送至云端 LLM,从而在使用强大 AI 服务的同时有效控制个人信息的暴露风险。

linux.do · 2026-04-26 23:10:05+08:00 · tech

来源: Introducing OpenAI Privacy Filter | OpenAI Demo: 流程大概是 对用户的输入使用该小模型处理, 识别输入中的敏感信息, 将其替换为替代词(环境变量?), 脱敏后发送给云端LLM. 云端的LLM返回后, 再在本地对输出按需恢复. 模型参数量: 总参数1.5B, 激活参数50M 模型上下文窗口: 128K 仓库地址: GitHub github.com GitHub - openai/privacy-filter: OpenAI Privacy Filter OpenAI Privacy Filter Hugging Face huggingface.co openai/privacy-filter · Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science. 模型卡片 cdn.openai.com OpenAI-Privacy-Filter-Model-Card.pdf 4 个帖子 - 4 位参与者 阅读完整话题

linux.do · 2026-04-23 07:34:09+08:00 · tech

huggingface.co openai/privacy-filter · Hugging Face We’re on a journey to advance and democratize artificial intelligence through open source and open science. [!quote]+ OpenAI隐私过滤器是一种双向令牌分类模型,用于文本中的个人身份信息(PII)检测和掩蔽。它面向高吞吐量的数据净化工作流程,团队需要一个能够在本地运行、快速、上下文感知且可调的模型。 OpenAI隐私过滤器通过预训练自回归,能够到达一个结构类似于GPT-OSS但体积更小的检查点。然后我们将该检查点转换为基于隐私标签分类法的双向令牌分类器,并用监督式分类丢失进行后期训练。(有关 gpt-oss 的架构细节,请参见 gpt-oss 模型卡。)该模型不逐个生成文本符号,而是在一次前向传递中标记输入序列,然后通过约束维特比程序解码相干张成。对于每个输入词,模型预测标签分类法上的概率分布,该分类法包含8个输出类别,如下所述。 宽松的Apache 2.0许可:非常适合实验、定制和商业部署。 小尺寸:可在网页浏览器或笔记本电脑上运行------总参数为1.5亿,活动参数为5000万。 可微调:通过简单且高效的微调,调整模型以适应特定数据分布。 长上下文:128,000令牌上下文窗口支持高吞吐量且无分块处理长文本。 运行时控制:通过预设操作点配置精度/回忆权衡和检测到的跨度长度。 1 个帖子 - 1 位参与者 阅读完整话题