算法

提示词工程你是怎么搞的?System/角色/约束/分步指令怎么写,如何防越狱与 Prompt Injection,评测和 Guardrails 怎么做。
56 阅读
PEFT 方案里(LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter)你怎么选?说说稳定训练的经验。
66 阅读
RAG 系统你怎么设计?切分、索引、召回/重排、压缩/融合、兜底策略都怎么串起来。
56 阅读
长上下文怎么搞?Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力,你的实战方案是什么。
70 阅读
位置编码这条线你怎么选:绝对 PE、相对 PE、RoPE 各自的思路、优势和局限,结合你的项目谈取舍。
74 阅读
把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。
57 阅读
算法岗高频面试题:二元和多分类的交叉熵你怎么写?
57 阅读
你做 CTR/CVR/CTCVR 联合建模时,ESMM/ESMM2 是怎么推导与工程落地的?线上到底带来了什么收益?
70 阅读
AUC 到底在统计上代表什么?你怎么计算它,在线上业务里你如何解释“这次 AUC 提升”的含义。
65 阅读
Scaled Dot‑Product Attention 为啥要除以 √dk?如果不除会出什么数值或训练问题。
49 阅读
Transformer 里因果注意力的 Q/K/V 各从哪来?Mask 具体怎么实现。
59 阅读
算法面试题:L1 和 L2 正则你怎么选?
60 阅读
算法岗面试题:分类和回归你最常用哪些损失?
62 阅读