WWW.YOUINFO.SITE
标签聚合 爬出来

/tag/爬出来

LinuxDo 最新话题 · 2026-05-19 16:11:12+08:00 · tech

我靠!终于从坑里爬出来了! 涨姿势了,新学了一个名词:TCP 控制风暴! 之前防爬虫,我是 nginx 直接返回 444,结果带宽一直暴涨,始终找不到原因,今天花了大半天,终于解决了。 当 444 遇到恶意爬虫,与触发 TCP控制风暴。 444 状态码有个反直觉的底层深坑: Nginx 返回 444 会触发内核发送 TCP RST 包(有协议头开销)。 爬虫被断连后误以为是网络抖动,会立即疯狂重试 3~5 次。 于是陷入死循环:爬虫请求 ➔ 触发 RST ➔ 疯狂重试 ➔ 再发 RST…… 瞬间产生的 TCP 控制风暴 直接把输出流量放大了数倍,网卡顶满! 涨姿势了,这一波感谢DeepSeek,国产牛逼! 记录一下,以防后人踩坑。 3 个帖子 - 2 位参与者 阅读完整话题

v2ex.com · 2026-04-28 11:28:58+08:00 · tech

先说结论 帮朋友看简历,他履历不错但 HR 反馈「排版太乱」,我第一反应是——这简历我也是在线生成的啊。 后来仔细看了下,发现问题很隐蔽: 某在线工具导出的 PDF ,HR 系统打开后联系方式行直接消失 表格布局在 macOS 的预览 App 里显示正常,但 Windows Outlook 打开后列宽全乱了 某些「专业模板」用了大量色块和图标,ATS 系统根本无法识别关键信息 一个朋友用某平台模板投了 50 家,回复率 2%,换成简洁排版后回复率 12%。不是简历内容变了,是模板兼容性变了。 踩坑记录 1. 导出格式问题 .docx > .doc > .pdf > 图片转 PDF Word 格式在大多数 ATS 里兼容性最好。PDF 反而容易出问题,尤其是用在线工具生成的——很多底层用了 canvas 渲染,文字直接变成图片,ATS 根本读不到。 2. 表格和分栏 ATS 解析 HTML 表格的能力约等于 2010 年的浏览器,嵌套表格、合并单元格必挂。技能列表用 bullet point ,别用表格。 3. 字体嵌入 常见问题: - 系统缺字体 → 变成宋体/ Times New Roman - 字体未嵌入 → 部分字符显示为方块 - 矢量图标无法解析 → 变成乱码符号 4. ATS 兼容自检(程序员视角) # 用 pdftotext 提取文字,检查关键字段是否完整 pdftotext resume.pdf - | grep -E "名字|邮箱|职位" # 用 ghostscript 转纯文本,检查格式信息是否丢失 gs -dNOPAUSE -dBATCH -sDEVICE=txtwrite -sOutputFile=resume.txt resume.pdf 怎么解决 裸模板优先 :单栏、纯黑白、最多两字体(标题 + 正文)。设计感可以后面加,但基础兼容性是前提。 导出后自测 : 用 PDF 查看器检查文字是否可选 用文本提取工具验证关键信息完整 发给自己,用手机 / 不同系统 / 不同 PDF 阅读器打开一遍 投不同公司备不同格式 :金融/法律/国企 → .docx ,互联网/外企 → .pdf ,但不管哪种,表格能不用就不用。 做了个工具 最近在做一个简历生成工具,叫 棱镜简历 ,核心思路是: 强制单栏、强制纯文本导出 导出前内置 ATS 兼容性检查 支持模板但不提供「花哨模板」,只给经过验证的裸版 目前还在迭代,如果你也在改简历,可以试试 xukz.cn ,看能不能解决你的格式问题。

v2ex.com · 2026-04-28 11:11:27+08:00 · tech

先说结论 帮朋友看简历,他履历不错但 HR 反馈「排版太乱」,我第一反应是——这简历我也是在线生成的啊。 后来仔细看了下,发现问题很隐蔽: 某在线工具导出的 PDF ,HR 系统打开后联系方式行直接消失 表格布局在 macOS 的预览 App 里显示正常,但 Windows Outlook 打开后列宽全乱了 某些「专业模板」用了大量色块和图标,ATS 系统根本无法识别关键信息 一个朋友用某平台模板投了 50 家,回复率 2%,换成简洁排版后回复率 12%。不是简历内容变了,是模板兼容性变了。 踩坑记录 1. 导出格式问题 .docx > .doc > .pdf > 图片转 PDF Word 格式在大多数 ATS 里兼容性最好。PDF 反而容易出问题,尤其是用在线工具生成的——很多底层用了 canvas 渲染,文字直接变成图片,ATS 根本读不到。 2. 表格和分栏 ATS 解析 HTML 表格的能力约等于 2010 年的浏览器,嵌套表格、合并单元格必挂。技能列表用 bullet point ,别用表格。 3. 字体嵌入 常见问题: - 系统缺字体 → 变成宋体/ Times New Roman - 字体未嵌入 → 部分字符显示为方块 - 矢量图标无法解析 → 变成乱码符号 4. ATS 兼容自检(程序员视角) # 用 pdftotext 提取文字,检查关键字段是否完整 pdftotext resume.pdf - | grep -E "名字|邮箱|职位" # 用 ghostscript 转纯文本,检查格式信息是否丢失 gs -dNOPAUSE -dBATCH -sDEVICE=txtwrite -sOutputFile=resume.txt resume.pdf 怎么解决 裸模板优先 :单栏、纯黑白、最多两字体(标题 + 正文)。设计感可以后面加,但基础兼容性是前提。 导出后自测 : 用 PDF 查看器检查文字是否可选 用文本提取工具验证关键信息完整 发给自己,用手机 / 不同系统 / 不同 PDF 阅读器打开一遍 投不同公司备不同格式 :金融/法律/国企 → .docx ,互联网/外企 → .pdf ,但不管哪种,表格能不用就不用。 做了个工具 最近在做一个简历生成工具,叫 棱镜简历 ,核心思路是: 强制单栏、强制纯文本导出 导出前内置 ATS 兼容性检查 支持模板但不提供「花哨模板」,只给经过验证的裸版 目前还在迭代,如果你也在改简历,可以试试 xukz.cn ,看能不能解决你的格式问题。

v2ex.com · 2026-04-28 11:01:12+08:00 · tech

先说结论 帮朋友看简历,他履历不错但 HR 反馈「排版太乱」,我第一反应是——这简历我也是在线生成的啊。 后来仔细看了下,发现问题很隐蔽: 某在线工具导出的 PDF ,HR 系统打开后联系方式行直接消失 表格布局在 macOS 的预览 App 里显示正常,但 Windows Outlook 打开后列宽全乱了 某些「专业模板」用了大量色块和图标,ATS 系统根本无法识别关键信息 一个朋友用某平台模板投了 50 家,回复率 2%,换成简洁排版后回复率 12%。不是简历内容变了,是模板兼容性变了。 踩坑记录 1. 导出格式问题 .docx > .doc > .pdf > 图片转 PDF Word 格式在大多数 ATS 里兼容性最好。PDF 反而容易出问题,尤其是用在线工具生成的——很多底层用了 canvas 渲染,文字直接变成图片,ATS 根本读不到。 2. 表格和分栏 ATS 解析 HTML 表格的能力约等于 2010 年的浏览器,嵌套表格、合并单元格必挂。技能列表用 bullet point ,别用表格。 3. 字体嵌入 常见问题: - 系统缺字体 → 变成宋体/ Times New Roman - 字体未嵌入 → 部分字符显示为方块 - 矢量图标无法解析 → 变成乱码符号 4. ATS 兼容自检(程序员视角) # 用 pdftotext 提取文字,检查关键字段是否完整 pdftotext resume.pdf - | grep -E "名字|邮箱|职位" # 用 ghostscript 转纯文本,检查格式信息是否丢失 gs -dNOPAUSE -dBATCH -sDEVICE=txtwrite -sOutputFile=resume.txt resume.pdf 怎么解决 裸模板优先 :单栏、纯黑白、最多两字体(标题 + 正文)。设计感可以后面加,但基础兼容性是前提。 导出后自测 : 用 PDF 查看器检查文字是否可选 用文本提取工具验证关键信息完整 发给自己,用手机 / 不同系统 / 不同 PDF 阅读器打开一遍 投不同公司备不同格式 :金融/法律/国企 → .docx ,互联网/外企 → .pdf ,但不管哪种,表格能不用就不用。 做了个工具 最近在做一个简历生成工具,叫 棱镜简历 ,核心思路是: 强制单栏、强制纯文本导出 导出前内置 ATS 兼容性检查 支持模板但不提供「花哨模板」,只给经过验证的裸版 目前还在迭代,如果你也在改简历,可以试试 xukz.cn ,看能不能解决你的格式问题。

v2ex.com · 2026-04-28 10:38:20+08:00 · tech

先说结论 帮朋友看简历,他履历不错但 HR 反馈「排版太乱」,我第一反应是——这简历我也是在线生成的啊。 后来仔细看了下,发现问题很隐蔽: 某在线工具导出的 PDF ,HR 系统打开后联系方式行直接消失 表格布局在 macOS 的预览 App 里显示正常,但 Windows Outlook 打开后列宽全乱了 某些「专业模板」用了大量色块和图标,ATS 系统根本无法识别关键信息 一个朋友用某平台模板投了 50 家,回复率 2%,换成简洁排版后回复率 12%。不是简历内容变了,是模板兼容性变了。 踩坑记录 1. 导出格式问题 .docx > .doc > .pdf > 图片转 PDF Word 格式在大多数 ATS 里兼容性最好。PDF 反而容易出问题,尤其是用在线工具生成的——很多底层用了 canvas 渲染,文字直接变成图片,ATS 根本读不到。 2. 表格和分栏 ATS 解析 HTML 表格的能力约等于 2010 年的浏览器,嵌套表格、合并单元格必挂。技能列表用 bullet point ,别用表格。 3. 字体嵌入 常见问题: - 系统缺字体 → 变成宋体/ Times New Roman - 字体未嵌入 → 部分字符显示为方块 - 矢量图标无法解析 → 变成乱码符号 4. ATS 兼容自检(程序员视角) # 用 pdftotext 提取文字,检查关键字段是否完整 pdftotext resume.pdf - | grep -E "名字|邮箱|职位" # 用 ghostscript 转纯文本,检查格式信息是否丢失 gs -dNOPAUSE -dBATCH -sDEVICE=txtwrite -sOutputFile=resume.txt resume.pdf 怎么解决 裸模板优先 :单栏、纯黑白、最多两字体(标题 + 正文)。设计感可以后面加,但基础兼容性是前提。 导出后自测 : 用 PDF 查看器检查文字是否可选 用文本提取工具验证关键信息完整 发给自己,用手机 / 不同系统 / 不同 PDF 阅读器打开一遍 投不同公司备不同格式 :金融/法律/国企 → .docx ,互联网/外企 → .pdf ,但不管哪种,表格能不用就不用。 做了个工具 最近在做一个简历生成工具,叫 棱镜简历 ,核心思路是: 强制单栏、强制纯文本导出 导出前内置 ATS 兼容性检查 支持模板但不提供「花哨模板」,只给经过验证的裸版 目前还在迭代,如果你也在改简历,可以试试 xukz.cn ,看能不能解决你的格式问题。

v2ex.com · 2026-04-28 10:38:20+08:00 · tech

先说结论 帮朋友看简历,他履历不错但 HR 反馈「排版太乱」,我第一反应是——这简历我也是在线生成的啊。 后来仔细看了下,发现问题很隐蔽: 某在线工具导出的 PDF ,HR 系统打开后联系方式行直接消失 表格布局在 macOS 的预览 App 里显示正常,但 Windows Outlook 打开后列宽全乱了 某些「专业模板」用了大量色块和图标,ATS 系统根本无法识别关键信息 一个朋友用某平台模板投了 50 家,回复率 2%,换成简洁排版后回复率 12%。不是简历内容变了,是模板兼容性变了。 踩坑记录 1. 导出格式问题 .docx > .doc > .pdf > 图片转 PDF Word 格式在大多数 ATS 里兼容性最好。PDF 反而容易出问题,尤其是用在线工具生成的——很多底层用了 canvas 渲染,文字直接变成图片,ATS 根本读不到。 2. 表格和分栏 ATS 解析 HTML 表格的能力约等于 2010 年的浏览器,嵌套表格、合并单元格必挂。技能列表用 bullet point ,别用表格。 3. 字体嵌入 常见问题: - 系统缺字体 → 变成宋体/ Times New Roman - 字体未嵌入 → 部分字符显示为方块 - 矢量图标无法解析 → 变成乱码符号 4. ATS 兼容自检(程序员视角) # 用 pdftotext 提取文字,检查关键字段是否完整 pdftotext resume.pdf - | grep -E "名字|邮箱|职位" # 用 ghostscript 转纯文本,检查格式信息是否丢失 gs -dNOPAUSE -dBATCH -sDEVICE=txtwrite -sOutputFile=resume.txt resume.pdf 怎么解决 裸模板优先 :单栏、纯黑白、最多两字体(标题 + 正文)。设计感可以后面加,但基础兼容性是前提。 导出后自测 : 用 PDF 查看器检查文字是否可选 用文本提取工具验证关键信息完整 发给自己,用手机 / 不同系统 / 不同 PDF 阅读器打开一遍 投不同公司备不同格式 :金融/法律/国企 → .docx ,互联网/外企 → .pdf ,但不管哪种,表格能不用就不用。 做了个工具 最近在做一个简历生成工具,叫 棱镜简历 ,核心思路是: 强制单栏、强制纯文本导出 导出前内置 ATS 兼容性检查 支持模板但不提供「花哨模板」,只给经过验证的裸版 目前还在迭代,如果你也在改简历,可以试试 xukz.cn ,看能不能解决你的格式问题。