Промпты с рассуждением. Chain-of-Thought промптинг

Техника составления промптов Chain-of-Thought "цепочка рассуждений" (CoT) помогает добиться более точных ответов от нейросети в различных типах задач, как например числовых, за счет предварительного примера рассуждения.

💡
Исследования на тему опубликованы и переведены в статье по ссылке ниже. Если вам интересны детали, рекомендуем ознакомиться.
Цепочка рассуждений (Chain-of-Thought) как способ выявления логики в больших языковых моделях
Метод цепочки рассуждений (Chain-of-Thought) для активации логического мышления в больших языковых моделях Авторы: Джейсон Вей, Сюэчжи Ван, Дейл Шурманс, Мартен Босма, Брайан Иктер, Фэй Ся, Эд Чи, Куок Ле, Денни Чжоу Google Research, Brain Team Аннотация Мы исследуем, как генерация цепочки рассуждений — последовательности промежуточных логических шагов — значительно улучшает способность больших

Методика составления запросов по форме Chain-of-Thought

Запрос

Нечётные числа в этой группе в сумме дают чётное число: 4, 8, 9, 15, 12, 2, 1.
A: Сложив все нечётные числа (9, 15, 1), получаем 25. Ответ: False (Ложь).

Нечётные числа в этой группе в сумме дают чётное число: 17, 10, 19, 4, 8, 12, 24.
A: Сложив все нечётные числа (17, 19), получаем 36. Ответ: True (Истина).

Нечётные числа в этой группе в сумме дают чётное число: 16, 11, 14, 4, 8, 13, 24.
A: Сложив все нечётные числа (11, 13), получаем 24. Ответ: True (Истина).

Нечётные числа в этой группе в сумме дают чётное число: 17, 9, 10, 12, 13, 4, 2.
A: Сложив все нечётные числа (17, 9, 13), получаем 39. Ответ: False (Ложь).

Нечётные числа в этой группе в сумме дают чётное число: 15, 32, 5, 13, 82, 7, 1.
A:

Результат

Сложив все нечётные числа (15, 5, 13, 7, 1), получаем 41. Ответ: False (Ложь).

Как видите, когда мы показываем нейросети логику рассуждения и даем пример в виде последовательности мысли, то мы получаем впечатляющий результат.

Однако данный пример получается слишком объемным.

Давайте сократим шаг рассуждения до одной строчки:

Запрос

Нечетные числа в этой группе в сумме дают четное число: 4, 8, 9, 15, 12, 2, 1.
A: Сумма нечетных чисел (9, 15, 1) равна 25. Ответ: False (Ложь).

Нечетные числа в этой группе в сумме дают четное число: 15, 32, 5, 13, 82, 7, 1.
A:

Результат

Нечетные числа в этой группе (15, 5, 13, 7, 1) в сумме дают:
15 + 5 + 13 + 7 + 1 = 41.

41 — нечетное число, поэтому ответ: False (Ложь).

На текущий момент подобный навык является возникающей способностью. Характерен только для больших языковых моделей

Цикл статей:

Промпты без примеров. Zero-Shot промптинг
Методика Zero-Shot позволяет использовать большие языковые модели, такие как GPT-3 без уточняющих или задающих роль промптов. Такое возможно потому, что подобные модели обучаются на масштабных объемах данных. Как следствие при обработке нашего запроса LLM модель будет использовать полученные ранее знания. Пример Zero-Shot промптинга Определи эмоцию текста. Грусть, позитив, равнодушие. Текст:
Дмитрий Петров

Дмитрий Петров

Популяризатор промпт-инжиниринга
PRMPT.RU