keep reading, keep writing, keep coding
人生有限,做自己喜欢的事
大模型推理能力 大模型推理能力
大模型推理能力 大模型的推理能力是能够在复杂任务中进行高效、准确的预测和决策,通常是 think step by step 的方式,这个也是
Qwen Math PRM Qwen Math PRM
PRM 的难点 数据标注 效果评估
2025-01-20
Natural Language Reinforcement Learning Natural Language Reinforcement Learning
介绍 什么是 Natural Language Reinforcement Learning 呢? 顾名思义,其实就是自然语言和强化学习的结
2025-01-02
Transformer相关技术问题 Transformer相关技术问题
Bert为什么没有Decoder模块 Decoder是否存在其实是依赖于预测目标依赖什么数据的? 以下的tokens表示为预测目标 传
the-rise-of-decoder-only-model the-rise-of-decoder-only-model
Bert是由encoder-only训练而来,T5由encoder-decoder训练而来,不过都是需要有大量的训练语料才能够训练而来. 近
深入理解Transformer(一): 基础 深入理解Transformer(一): 基础
Transformer在2017年被提出时,作为一种序列转换工具将一个序列转换为另一个符号序列,最流行的例子是翻译,比如从英语到德语。它还被
Prompt 综述 Prompt 综述
Prompt已然成为新的模型训练方式,方法日新月异,所以全面 介绍 三要素 Prompt Template Answer Search
2022-06-12
Cross Attention Cross Attention
Cross Attention是用来处理两个不同Sequence时的SelfAttention变体。 介绍 属于Transformer常见
数据结构在机器学习中的思考 数据结构在机器学习中的思考
当不同任务下的数据结构统一后,如训练数据、验证数据以及测试数据,模型的训练、切换、验证、测试等不同阶段都可以实现高效自动化。 介绍 做过模
2022-03-23
1 / 2