WWW.YOUINFO.SITE
标签聚合 方面

/tag/方面

LinuxDo 最新话题 · 2026-06-11 23:51:05+08:00 · tech

最近没什么事情,想着去做一个小玩具,正好本人对机器学习方面比较感兴趣,所以想着做一个机器学习的量化小玩具来玩玩(不想着拿着他去赚钱感觉不太可能(我能做量化机构早就做出来了(除非这个策略是低资金才能玩量化玩不了的))) 那么既然是机器学习的小玩具,那么机器学习最重要的是什么呢?就是模型结构啊!(错了数据最重要啊)所以就去闲鱼和淘宝上淘了一点1分钟的数据,来准备训练一个模型去做一下这个实验 那么第一件事情就是说我们要去针对什么股票去思考和预测,由于没什么钱开不起创业板和科创板所以只能玩玩主板了,那么接下来就是把主板的股票给筛选出来大概3800只,那么从2000年到2026年这27年的数据不可能通通加进去,因为要考虑到A股这个玩意儿不同周期的影响是非常大的(2019有科创板,2023年8月印花税调整,2024年量化监管(DMA 收缩、高频报撤单限制))最后还是选择了2018-2026年的数据来训练这个模型 既然数据有了,那么第二个问题就是我们要预测什么?因为一开始听学长说A股有一个操作叫做打版,这个操作非常赚钱,所以说一开始我我就想着往打版的方向去设计这个模型,但是效果并不是那么好,后面会说明。所以说走了第二个方法预测一只股票在达到最大回收之前会不会涨个问题(还在做目前) 然后就是模型结构问题了,一开始考虑的是多因子+lstm结构的但是过拟合严重(暂时打消了后面我想要fashion一点使用rwkv,trans,delta,mamba的想法)最后使用了light gbm的模型结构(听ai的话了:( ) 最后是数据集分割问题了,一开始没动脑子考虑的就是18-25 training set,25来validation set,26来testing set没有考虑到A股随着时间变化的特点,后面在AI的建议下使用了PTSS和CPCV(最后CPCV效果好一点) PS:这里提醒一下大家一定要做数据的Embargo(就是在训练集和测试集之间留出一段空白期) PS: 要有纪律的使用validation set和testing set,testing set是有保质期的!使用多了之后你的模型就会在你的testing set上被你人工过拟合,你饿的testing set的结果就毫无意义了! 关于vibecoding的使用需要提醒一下这里感觉无论是claude-opus-4.6-max还是gpt-5.5都会引入未来函数(在预测day T的时候有day T+1的数据混进去了)建议开一个上下文空的codex来做独立的审查 还有很多东西要写先写个todo吧 1.CPCV 按等长时间块切分,这在 A股是浪费,一个块可能横跨牛熊切换需要解决 2.考虑一些深度学习模型结构的使用 3.light gbm无法原生感知时间的问题 … 1 个帖子 - 1 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-11 20:13:04+08:00 · tech

最近在带实习生妹子,挺可爱也很容易沟通,一方面慨叹现在大学生真卷,另一方面心觉刚实习的同学难逃「漫无目的」~ 仅仅就大厂产品岗实习来说,分享一些我的看法。 产品不像研发乃至算法,技术好识别,工作好量化~审美客观来说也是堆经验,不像UI/UX朋友确实有“发现美的眼睛”,因此到头来正应验《人人都是产品经理》 这话开玩笑还行,我们这种在职中登其实无所谓的,okr定好了迭代方向也明确,什么方法论到头逃不掉怎么赚钱、友商干了啥、行业新玩意、中午吃什么~(¯▽¯~)~ 但这不适合实习生,实习尤其是学历中规中矩(非9甚至双非)的同学,一定要定好自己的方向,搞toB还是toC,搞什么业务板块,实习的每家公司底层逻辑是什么。尤其是Agents时代,要借助codeX之类的软件去拆解真实逻辑,即「页面模块映射到底层如何请求模型」与「业务数据输入到输出都经过哪些步骤」,拆明白这些你才知道这个业务如何真实运转,等你去过几个不同公司触类旁通,很多harness的有意思设计就学到手里 我可能是很普通的那档产品,产品不排除有天才,但大部分还是靠“磨”~因为数据飞轮谁都会说,没人不想数据驱动、利润可观、SaaS交付,但像我很多次分享的【产品是戴着镣铐跳舞,用有限资源做更多用户效能】 总结下来就是,多看,多用,多想。这话挺俗的,但很多小伙伴没有这个意识,正编中登经常自己都忙不过来才招实习生,说难听点打杂为主,甚至没空让你打杂因为我还要自己看一遍……所以一定要对自己的实习负责,礼貌点多请教,不要等分活儿,不是每个人都会关心你实习是否学有所成,等真面试就晚了╮(╯_╰)╭ 时代卷是客观的,但HC也客观存在,老大说招进来就能干活最重要,想办法体现自己是合格的小牛马吧,加油宝子们 2 个帖子 - 2 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-11 11:03:02+08:00 · tech

之前看到站内佬友们发贴升级ccs有哪方面出问题,当时觉得还是保留版本不升级了,后来看到还是有佬升级的,而且升级了后可以配置cc的桌面版配置,也跟着升级了,开始觉得没什么问题,过了段时间就感觉他这个测试连通总是会有点错误,错误具体情况是:我配置的公益站网址是可以用的,他一直反馈联通不上这个网址,也不是报503之类的错误,而且获取模型也全没有获取到,到终端测试还是可以用的,旧版本从来没有,而且这个问题他是时断时续的给我冒出来的,这真的太影响体验了,有时候想更换公益站模型都要去手动输入了(对不起我是懒人 8 个帖子 - 6 位参与者 阅读完整话题

LinuxDo 最新话题 · 2026-06-10 21:20:23+08:00 · tech

今天做实验遇到了一个难题,刚好不是fable5出来了么?就打算用fable5,看看实力如何。但是不碰巧,在下刚好是AI for 生物/医疗,每一次都给我打回 opus4.8,可谓是气煞我也。刚刚我灵机一动,LLM本质上就是个概率分布模型,那么我如果用提示词去诱导它,让他压根不知道我是在问根生物医疗相关的话题呢? 于是我让sonnet和opus写了一份提示词,把生物信息的一些问题换成了其他的名词。比如蛋白质替换成 空间多聚体,氨基酸替换成 空间基本单位。蛋白质对应的配体小分子就是 空间附着物。最后非常完美绕过了Claude的监管,成功让fable5输出了一份很nice的方案。 5 个帖子 - 4 位参与者 阅读完整话题

v2ex · 2026-06-09 17:17:38+08:00 · tech

我身边有几位朋友,对所有国产产品都抱有极强的不信任感。 手机方面只认可苹果,对国产手机从不了解、从不关注,还一味贬低吐槽;聊到汽车,如今国产车表现越来越好,可他们只认准特斯拉,直言国产车企的宣传都是虚假噱头,智能驾驶也只信任 FSD 。 再说说 AI 大模型,业内公认综合实力顶尖的是 Claude ,而在 arena 排行榜中,国产模型在代码领域表现突出,除了 Claude 之外,直接包揽了榜单 2-5 名。即便数据摆在眼前,他们依旧打心底里看不起国产模型。宁愿花大价钱使用体验参差不齐的海外模型中转站,也要坚持用 Gemini 和 Claude 。 在他们眼里,仿佛国外产品不论实际表现如何,就一定是好的,对国产事物的偏见根深蒂固。想问问大家,这种情况算崇洋媚外吗?

v2ex · 2026-06-09 17:07:54+08:00 · tech

我身边有几位朋友,对所有国产产品都抱有极强的不信任感。 手机方面只认可苹果,对国产手机从不了解、从不关注,还一味贬低吐槽;聊到汽车,如今国产车表现越来越好,可他们只认准特斯拉,直言国产车企的宣传都是虚假噱头,智能驾驶也只信任 FSD 。 再说说 AI 大模型,业内公认综合实力顶尖的是 Claude ,而在 arena 排行榜中,国产模型在代码领域表现突出,除了 Claude 之外,直接包揽了榜单 2-5 名。即便数据摆在眼前,他们依旧打心底里看不起国产模型。宁愿花大价钱使用体验参差不齐的海外模型中转站,也要坚持用 Gemini 和 Claude 。 在他们眼里,仿佛国外产品不论实际表现如何,就一定是好的,对国产事物的偏见根深蒂固。想问问大家,这种情况算崇洋媚外吗?