ИИ сочинил более смешные подписи к интернет-мемам, чем люди

ПН	ВТ	СР	ЧТ	ПТ	СБ	ВС
24	25	26	27	28	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31	1	2	3	4	5	6

Новое исследование показало, что нейросети лучше людей справились с созданием подписей к популярным интернет-мемам. Сгенерированные ИИ варианты в среднем получили более высокие оценки за юмор, креативность и «вирусность» — потенциал к широкому распространению. Впрочем, в «индивидуальном зачете» все-таки победили люди: самые смешные отдельные примеры были созданы без помощи ИИ-алгоритмов, пишет Naked Science.

Мем, созданный людьми и признанный в эксперименте самым смешным. Подпись можно перевести на русский язык так: «Я ас многозадачности: могу одновременно впустую тратить время, быть непродуктивным и прокрастинировать». Фото: Zhikun Wu et al

Своеобразный турнир по проверке навыков сочинительства подписей к мемам провела группа ученых из Германии и Швеции. В эксперименте задействовали три сценария: в первом задачу выполняли только люди без помощи ИИ, во втором для генерации идей участникам разрешили использовать чат-интерфейс с нейросетью GPT-4o, а в третьем работу полностью поручили искусственному интеллекту. Исследователи использовали уже существующие шаблоны популярных мемов, а люди и нейросеть придумывали к ним только текст, который мог затрагивать одну из трех тем: работу, еду или спорт.

На следующем этапе созданные таким образом «веселые картинки» использовали в онлайн-опросе, организованном с помощью платформы Prolific. В нем участников попросили оценить мемы с подписями по трем критериям: юмор, находчивость (креативный подход) и потенциал к широкому распространению.

Самая смешная подпись к картинке, придуманная ИИ: «Тот самый момент, когда коллега говорит, что ему нужна твоя помощь, а на самом деле хочет, чтобы ты сделал за него всю работу». Иллюстрация: Zhikun Wu et al

Мемы с целиком сгенерированными ИИ подписями в среднем набрали больше баллов по всем трем аспектам.

«Вынужден объявить, что мемная версия теста Тьюринга пройдена», — прокомментировал результаты профессор Уортонской школы бизнеса Итан Моллик (Ethan Mollick). Тест Тьюринга считают способом проверки сходства искусственного интеллекта с человеком.

Однако выводы исследователей не так однозначны, как может показаться на первый взгляд. Хотя у нейросети получились усредненно более удачные мемы, когда ученые рассмотрели отдельные примеры, выяснилось, что самые смешные из них — полностью «человеческие». Кроме того, первые места за креативность и потенциальную вирусность получили мемы, подписи к которым создали люди в тандеме с ИИ.

Также ученые установили, что хотя участники, которым помогала нейросеть, выдвигали больше идей и тратили на это меньше усилий, последующая оценка их подписей показала: в среднем они не лучше тех, где люди сочиняли их самостоятельно. Иначе говоря, повышение продуктивности за счет использования ИИ вело не к лучшим результатам, а лишь к увеличению их количества, пояснили авторы.

По мнению ученых, успех ИИ связан с обучением на огромных массивах данных, что позволило нейросети подбирать подписи, импонирующие более широкой аудитории. Мемы с подписями, созданными людьми, в большей степени отражали личный опыт, и временами такие варианты оказывались самыми удачными и яркими. Однако в общей массе они проигрывали версиям, сгенерированным нейросетью.

С полным текстом исследования, которое планируют представить на международной конференции 2025 International Conference on Intelligent User Interfaces в конце марта, можно ознакомиться на сервере препринтов arXiv.

Среди ограничений работы ученые упомянули наличие временных рамок в эксперименте, привлечение к оценке не экспертов, а добровольцев с краудсорсинговой платформы, а также неучитывание культурных особенностей восприятия юмора. Эти моменты следует принять во внимание в будущих исследованиях.