跳到主要内容

生成数据

大模型时代没有技术壁垒,为什么?首先大家都在用开源的SOTA模型结构,然后在训练数据的方面做一些工作,同时会利用开源的数据以及用LLM来生成一些高质量的数据。

同时使用LLM来生成数据这个研究方向已然成为了当下一个热门方向,接下来我将不断更新当下最新的一些有意思的工作。

2024 阿里论文:Self-play with Execution Feedback

详细请看:Paper Reading:Self-play with Execution Feedback:Improving Instruction-following Capabilities of Large Language Models