大模型推理能力 大模型推理能力 大模型的推理能力是能够在复杂任务中进行高效、准确的预测和决策,通常是 think step by step 的方式,这个也是 2025-02-11 nlp reasoning llm reasoning 推理能力 Qwen Math PRM PRM 的难点 数据标注 效果评估 2025-01-20 nlp Natural Language Reinforcement Learning 介绍 什么是 Natural Language Reinforcement Learning 呢? 顾名思义,其实就是自然语言和强化学习的结 2025-01-02 nlp Transformer相关技术问题 Bert为什么没有Decoder模块 Decoder是否存在其实是依赖于预测目标依赖什么数据的? 以下的tokens表示为预测目标 传 2022-09-12 nlp transformer nlp Transformer the-rise-of-decoder-only-model Bert是由encoder-only训练而来,T5由encoder-decoder训练而来,不过都是需要有大量的训练语料才能够训练而来. 近 2022-09-12 nlp transformer nlp Transformer 深入理解Transformer(一): 基础 Transformer在2017年被提出时,作为一种序列转换工具将一个序列转换为另一个符号序列,最流行的例子是翻译,比如从英语到德语。它还被 2022-09-12 nlp transformer nlp Transformer Senmatic Neural Search 定义 2022-07-31 nlp Prompt 综述 Prompt已然成为新的模型训练方式,方法日新月异,所以全面 介绍 三要素 Prompt Template Answer Search 2022-06-12 nlp prompt nlp prompt learning Cross Attention Cross Attention是用来处理两个不同Sequence时的SelfAttention变体。 介绍 属于Transformer常见 2022-06-11 nlp pretrained-language-model nlp transformer 数据结构在机器学习中的思考 当不同任务下的数据结构统一后,如训练数据、验证数据以及测试数据,模型的训练、切换、验证、测试等不同阶段都可以实现高效自动化。 介绍 做过模 2022-03-23 nlp nlp data