Эффективность больших языковых моделей
Крупнейшее исследование Ipsos применения LLM для Conjoint и MaxDiff анализа в маркетинговых исследованиях
Ipsos провел одно из крупнейших исследований генеративных языковых моделей.
Мы проанализировали более 250 000 сгенерированных ИИ ответов на вопросы с совместным выбором (Conjoint, MaxDiff), чтобы оценить, как разные LLM ведут себя в различных сценариях, и сравнить их результаты с данными реальных респондентов.
Задачами исследования были комплексная оценка потенциала LLM как альтернативы ответам реальных респондентов при совершении выбора, а также анализ возможностей использования LLM для бизнеса в будущем.
Мы сформулировали и проверили несколько гипотез:
- LLM способны понять структуру характеристик товара любой сложности
- Для решения наших задач существует оптимальная LLM
- Настройка «температуры» влияет на результат работы LLM
- Качество формулировки промпта улучшает результат работы LLM
- На работу LLM влияет расположение вариантов ответов (positional bias)
- LLM может сгенерировать различные предпочтения на уровне респондента
- Обучение LLM с использованием данных от реальных респондентов повышает качество результатов
- Результаты, полученные на основе LLM, позволяют сделать аналогичные выводы, что и на основании исследований на реальных респондентах.
Результаты проверки гипотез читайте в нашей статье.