Исследования

Каждая техника форматирования в NovaPrompt подкреплена научными работами. Ниже — 139 исследований из ведущих лабораторий мира, сгруппированных по темам.

Материалы курса по промпт-форматированию от NovaSapiens. Все ссылки ведут на страницы с разбором статей на русском языке.

139

статей

13

категорий

53+

техник

Форматирование и структура

Как разделители, заголовки и визуальная структура влияют на точность модели

2504.02052Структурированные промпты позволяют слабым моделям достигать уровня сильных 2510.26238Без визуальных разделителей модель теряет 16-24% точности 2510.05152Явное указание разделителей стабилизирует точность (30-80% → 70-80%)2505.14178Разделители токенов драматически улучшают точность на аналитических задачах 2504.05689Ролевые разделители <USER:> и [INST] управляют поведением модели 2503.01622DOVE: тонкая настройка форматирующих элементов стабилизирует выход модели 2510.13191C-NORM: модели экстремально чувствительны к типу разделителя 2507.070455C Framework: 5-компонентная структура (Context, Constraints, Criteria, Cues, Chain)2601.14152Контекст ПЕРЕД вариантами выбора (формат CQO), decoder-only архитектура 2601.10102Роль перебивает явные инструкции и числа 2504.02111Избыточное форматирование и КАПС снижают точность рассуждений 2505.13171Якорь первых слов: первые слова промпта определяют интерпретацию 2503.03194Markdown-иерархия как структура для промптов 2505.13360Таблицы и структурированные данные в промптах 2506.05739Полиморфный промптинг: визуальные разделители между секциями 2505.13546Модульные секции (Role/Task/Context) делают промпт устойчивым к изменениям 2601.15251Формат записи чисел меняет точность на 87%2411.03766LLM фундаментально не являются калькуляторами (Chain-of-Thought для чисел)2601.02023Плотность информации важнее длины контекста 2512.17920U-образная кривая длины промпта: средние промпты хуже коротких и длинных

XML и семантическая разметка

XML-теги как средство снижения когнитивной нагрузки модели

2509.08090XML-структура снижает когнитивную нагрузку модели 2504.01216Эффект «якоря»: теги <role> и <task> в начале создают когнитивный якорь 2504.201188-секционный XML-шаблон сокращает итерации с 13 до 1.5 2510.12637Фреймворк COSTAR-A: 7 обязательных компонентов промпта

MetaGlyph и символьные нотации

Символы вместо слов: экономия токенов без потери качества

2601.07354MetaGlyph: символьные ограничения работают как псевдокод, валидировано на 8 моделях 2510.18043CompactPrompt: три техники сжатия промптов

Таблицы и структурированные данные

JSON, таблицы и структуры данных внутри промптов

2504.07087JSON группирует связанные факты рядом (+точность)2410.10813JSON-структура + «извлеки → ответь» улучшает работу с большим контекстом 2506.02589JSON-формат повышает полноту (recall) при извлечении сущностей 2502.18878Think-of-Structure (ToS): сначала модель «думает» о структуре, потом генерирует 2508.11454Референсные данные в JSON для сравнительного анализа 2601.18014Схема-первый промпт для извлечения данных 2509.24592Промежуточный JSON вместо сложных форматов (BPMN, XML)2511.03570Канонизация чисел в JSON 2506.14927MDBench: бенчмарк Markdown-структур

Few-shot и примеры

Как примеры в промпте влияют на качество, формат и стиль ответа

2310.07019Конкретные примеры стабильнее абстрактных правил 2502.11681Стиль и структура примеров переносятся на результат 2504.05716Примеры важнее логики: простой промпт с примерами лучше сложного без 2502.10634Format Over Content: формат примера важнее его содержания 2503.19602Less is More: один качественный пример лучше множества посредственных 2411.14720Оптимальное число примеров (~6 для GPT-4, Claude)2504.20444Recency Bias: последний пример весит больше первого 2506.00842Contrastive Examples: контрастные пары (позитив + негатив) эффективнее 2506.06699Edge Cases: пограничные случаи учат модель нюансам 2504.08745Негативные примеры повышают точность на ~15%2506.23149Ловушка однообразия: похожие примеры вредят разнообразию 2504.06969Format Diversity: разнообразные форматы примеров повышают устойчивость 2503.15579Generalization: разнообразие примеров включает обобщение у модели 2506.04855Instruction-Example Conflict: при конфликте пример побеждает инструкцию 2506.13109Fragments: короткие фрагменты почти так же эффективны, как полные примеры 2509.23501Role-Based Prompting: роли (user/assistant) работают лучше текстовых меток 2601.16466История перевешивает system prompt для стиля (5-10 примеров > инструкция)

Chain-of-Thought и рассуждения

Пошаговые рассуждения, их пределы и оптимальное применение

2505.10981Chain-of-Thought: классическая техника «думай шаг за шагом»2505.22113Overthinking: на простых задачах CoT вредит 2504.07128Sweet Spot: оптимальная длина рассуждений (3-5 шагов)2506.01341Error Propagation: ранняя ошибка убивает всю цепочку CoT 2504.05081CoT Hurts Pattern-Matching: для паттернов прямой ответ лучше 2507.09850Structure Over Correctness: структура рассуждения важнее правильности ответа 2507.10906CoT + Few-Shot = максимальная эффективность 2601.01490Reasoning меняет тип ошибки (скрытые искажения вместо открытых нарушений)2601.07525Строгий формат с первого токена душит рассуждение 2601.13537Модель сначала выбирает ответ, потом придумывает обоснование 2601.11227Язык мышления заменяет высокую температуру для разнообразия

Prompt Engineering (общее)

Общие техники, подходы и паттерны промпт-инженеринга

2409.08775Полнота формулировки — один из сильнейших факторов качества 2507.03254Псевдокод-промптинг: +36% точности, -87% токенов 2510.09970Atomic Instructions: цепочка простых бинарных вопросов 2509.16268Function Calling стиль: задача как Python-функция с типами 2511.16837Cognitive BASIC: BASIC-стиль с нумерованными строками 2508.06942CNL-P: формальный контролируемый язык для промптов 2512.03272Декларативная генерация: код вместо рассуждений (с 10% до 89%)2507.08664INoT: интроспекция мысли через псевдокод-дебаты агентов 2510.19850Prompt Decorators: декларативный синтаксис (+++Reasoning, +++Tone)2412.08985Двухэтапный промпт (генерация + форматирование)2508.02523RAG эффективнее копирования данных 2503.15664RAG эффективнее копирования (второе подтверждение)2505.13258Нумерованные блоки данных для организации контекста 2502.17204Порядок инструкций: от сложного к простому (hard → easy)2411.01101Recency Bias: позиционное искажение в середине промпта 2601.03630Иерархия критериев оценки фиксирует приоритеты 2601.04925Инструкции о тоне влияют на детекцию AI-текста 2601.02989System-2 Counting: механика подсчёта в LLM, разбиение на части 2601.01768CAPEL: внешний счётчик длины в реальном времени 2410.16325Принудительный выбор стабилизирует результат (категоризация)2507.08250Чёткие категории повышают точность анализа 2412.17189+40% точности на аналитических задачах через структуру 2507.21133Accountability Prompting: ответственность и последствия улучшают качество

Сжатие и оптимизация промптов

Как сократить промпт без потери эффективности

2510.18043CompactPrompt: удаление токенов, N-gram abbreviation, округление чисел 2505.23480«Ответь кратко, но точно» сокращает длину на 37-80% без потери качества

Role prompting и персоны

Влияние ролей и персон на качество ответов модели

2510.17535Информация о роли кодируется в ранних слоях; наречие > прилагательное 2512.05858Персоны не улучшают точность (5 из 6 моделей — ноль эффекта)2601.05376Чем уже роль, тем сильнее фокус (и резче падение вне контекста)2601.01997Role-playing экономичнее CoT для генерации списков 2601.05104RLHF закрепил связь похвала → улучшение качества

Безопасность и надёжность

Галлюцинации, предвзятость, защита от манипуляций

2601.08070Semantic Gravity Wells: запреты активируют запрещённое 2503.19540Запреты запускают предвзятость 2506.12338Подтверждающее искажение (confirmation bias) в LLM 2501.02295Скрытые стереотипы усиливаются в LLM 2504.04141Self-Debiasing: модель сама обнаруживает и корректирует предвзятость 2411.17304Абстрактные хэши вместо триггерных слов 2505.21828Эмоциональная окраска промпта смещает распределение ответов 2503.10690Confidence Hijacking: уверенный тон заставляет LLM принимать ложь 2601.11429Паттерн-вопросы провоцируют галлюцинации (60-80% случаев)2601.05050Bunking effect симметричен debunking 2510.16492Quit Instructions: учи модель останавливаться при неуверенности 2403.08211Inverse Prompting: инверсия задачи активирует критическое мышление 2504.21625Self-correction (итеративная коррекция) чрезвычайно эффективна 2506.16064Self-correction: самокритика даёт более честные и точные ответы 2511.21734Verification-First: верификация перед генерацией улучшает точность 2510.03528Модели на зашумленных данных лучше улавливают суть (робастность)

Оценка и бенчмарки

Как корректно использовать LLM для оценки и измерений

2601.03444Шкала 0-5 оптимальна для субъективных оценок LLM 2601.03630План оценки перед оценкой снижает bias на 16-32%2601.06189Chain-of-Thought не снижает bias при оценке 2601.08064Разные методы измерения оценки измеряют разное 2512.05998Fake Prediction Markets: виртуальные ставки калибруют уверенность модели

Магические фразы и лайфхаки

Конкретные формулировки и приёмы, влияющие на качество ответов

2503.15793Uncertainty Prompting: «если не знаешь — скажи» снижает галлюцинации 2505.12896Expand/Echo Commands: «expand» раскрывает, «echo» повторяет 2504.09402Внимательное чтение: «прочитаем задачу шаг за шагом»2410.14675«Сначала проверь, можно ли доверять контексту»2505.24858Метакогнитивная инструкция: «если не уверен — скажи насколько»2410.07103Повторение данных 2-3 раза даёт +30-70% точности 2506.00069Повторение инструкции в конце устраняет «потерю в середине»2505.17407Язык рассуждений: «Think in English, answer in Russian»2504.11833Ансамбль языков: решить задачу на двух языках и сравнить 2506.01776Для малых языков инструкция на английском повышает качество 2504.12951Retry-стратегия часто лучше сложного промпта 2506.099922-3 предложения контекста крайне эффективны для культурных нюансов 2502.11028Превращение в multiple choice даёт более точный ответ 2506.00072Эмоциональное давление повышает точность, но раздувает самоуверенность 2601.18730Разделение генерации и проверки: модель сильнее в анализе готового текста 2406.17378Почему опечатки не ломают понимание: дистилляция семантического ядра 2505.21657Императив и вопрос активируют разные механизмы обработки 2504.12180Неструктурированные запросы повышают риск галлюцинаций 2507.10124Неуверенность активирует глубину: вопрос лучше императива для критики 2506.02867Word Triggers: «подумай», «проверь», «сделай вывод» улучшают рассуждения 2507.02778Correction Markers: «стоп», «подожди», «однако» активируют самокоррекцию 2503.18072Label Sensitivity: замена слова-ярлыка меняет точность на 5-15%2503.13510Нейтральный тон даёт самые точные ответы 2505.15323Answer Prefix: prefix-фраза перед ответом улучшает точность

Агенты и инструменты

Организация работы AI-агентов и долгосрочных проектов

2601.03298Файл RULES.md для долгосрочных проектов: правила против размазывания фокуса

Применяйте исследования на практике

NovaPrompt — редактор, который знает эти техники. Подсветка синтаксиса, MetaGlyph, XML-теги, шаблоны фреймворков — всё в одном месте.

Открыть редактор